Entwickler optimieren LLMs für spezielle Aufgaben, stimmen einen Chatbot auf die Bearbeitung von Produkt-Support-Fragen ab oder entwickeln einen persönlichen Assistenten für die Verwaltung des eigenen Terminkalenders. Viele dieser Arbeitsabläufe werden durch NVIDIA-GPUs vereinfacht, da Entwickler damit mehr Kontrolle, mehr Speicher und schnellere lokale Iterationen erhalten.
Der RTX AI Garage-Blog dieser Woche zeigt, wie man mit Unsloth, einem für NVIDIA-GPUs optimierten Open-Source-Framework, Feinabstimmungen vornimmt. Das reicht von RTX-Laptops bis hin zu DGX Spark, dem kompakten AI-Supercomputer von NVIDIA. Außerdem wird erläutert, wie Entwickler DGX Spark nutzen können, um größere Modelle für komplexere agentenbasierte Workflows zu optimieren.
NVIDIA stellt außerdem die neu angekündigte NVIDIA Nemotron 3-Familie offener Modelle, Datensätze und Bibliotheken vor, die für eine effiziente, skalierbare Feinabstimmung entwickelt wurden. Nemotron 3 wurde für agentenbasierte AI-Anwendungen entwickelt und ist die bislang leistungsfähigste Reihe offener Modelle von NVIDIA, die Nano-, Super- und Ultra-Größen für unterschiedliche Workloads umfasst.
In der RTX AI Garage dieser Woche gibt es einen kurzen Einblick in die Feinabstimmung, einschließlich:
- Wichtige Aspekte für die Feinabstimmung, von der parameter-effizienten Einstellung bis zum verstärkenden Lernen, sowie VRAM-Empfehlungen für verschiedene Modellgrößen.
- Wie Unsloth das Training beschleunigt und gleichzeitig den VRAM-Verbrauch auf NVIDIA-GPUs reduziert.
- Warum DGX Spark sich durch größere Modelle, erweiterte Kontextfenster und fortschrittliche Workflows auszeichnet.
- Die neue Nemotron 3-Familie offener Modelle – in den Größen Nano, Super und Ultra – stellt die effizienteste Familie offener Modelle mit führender Genauigkeit dar, ideal für die Entwicklung agentenbasierter AI-Anwendungen.
Eine praktische Anleitung zur lokalen Feinabstimmung gibt Matthew Berman im folgenden Video, in dem er das Reinforcement Learning auf einer NVIDIA GeForce RTX 5090 mit Unsloth vorführt: https://youtu.be/9t-BAjzBWj8
So installiert man Unsloth auf NVIDIA DGX Spark. Hier findet man zusätzliche Anleitungen von Unsloth zur Feinabstimmung, um noch heute loszulegen:
- Fine-Tuning LLMs With NVIDIA RTX 50 Series GPUs and Unsloth
- Fine-Tuning LLMs With NVIDIA DGX Spark and Unsloth
Die Feinabstimmung von Nemotron 3 Nano ist auf Unsloth verfügbar! Nemotron 3 Nano kann jetzt von Hugging Face heruntergeladen oder über Llama.cpp und LM Studio ausprobiert werden.
*Auszug Pressemitteilung






