AI-Optimierung auf RTX-Laptops für DGX Spark sowie neue NVIDIA Nemotron 3 Open-Modelle

Entwickler optimieren LLMs für spezielle Aufgaben, stimmen einen Chatbot auf die Bearbeitung von Produkt-Support-Fragen ab oder entwickeln einen persönlichen Assistenten für die Verwaltung des eigenen Terminkalenders. Viele dieser Arbeitsabläufe werden durch NVIDIA-GPUs vereinfacht, da Entwickler damit mehr Kontrolle, mehr Speicher und schnellere lokale Iterationen erhalten.

Der RTX AI Garage-Blog dieser Woche zeigt, wie man mit Unsloth, einem für NVIDIA-GPUs optimierten Open-Source-Framework, Feinabstimmungen vornimmt. Das reicht von RTX-Laptops bis hin zu DGX Spark, dem kompakten AI-Supercomputer von NVIDIA. Außerdem wird erläutert, wie Entwickler DGX Spark nutzen können, um größere Modelle für komplexere agentenbasierte Workflows zu optimieren.

NVIDIA stellt außerdem die neu angekündigte NVIDIA Nemotron 3-Familie offener Modelle, Datensätze und Bibliotheken vor, die für eine effiziente, skalierbare Feinabstimmung entwickelt wurden. Nemotron 3 wurde für agentenbasierte AI-Anwendungen entwickelt und ist die bislang leistungsfähigste Reihe offener Modelle von NVIDIA, die Nano-, Super- und Ultra-Größen für unterschiedliche Workloads umfasst.

In der RTX AI Garage dieser Woche gibt es einen kurzen Einblick in die Feinabstimmung, einschließlich:

Wichtige Aspekte für die Feinabstimmung, von der parameter-effizienten Einstellung bis zum verstärkenden Lernen, sowie VRAM-Empfehlungen für verschiedene Modellgrößen.
Wie Unsloth das Training beschleunigt und gleichzeitig den VRAM-Verbrauch auf NVIDIA-GPUs reduziert.
Warum DGX Spark sich durch größere Modelle, erweiterte Kontextfenster und fortschrittliche Workflows auszeichnet.
Die neue Nemotron 3-Familie offener Modelle – in den Größen Nano, Super und Ultra – stellt die effizienteste Familie offener Modelle mit führender Genauigkeit dar, ideal für die Entwicklung agentenbasierter AI-Anwendungen.

Eine praktische Anleitung zur lokalen Feinabstimmung gibt Matthew Berman im folgenden Video, in dem er das Reinforcement Learning auf einer NVIDIA GeForce RTX 5090 mit Unsloth vorführt: https://youtu.be/9t-BAjzBWj8

So installiert man Unsloth auf NVIDIA DGX Spark. Hier findet man zusätzliche Anleitungen von Unsloth zur Feinabstimmung, um noch heute loszulegen:

Die Feinabstimmung von Nemotron 3 Nano ist auf Unsloth verfügbar! Nemotron 3 Nano kann jetzt von Hugging Face heruntergeladen oder über Llama.cpp und LM Studio ausprobiert werden.

*Auszug Pressemitteilung