DeepSeek का नया डिस्टिल्ड AI मॉडल R1-0528-Qwen3-8B बना चर्चा का केंद्र, Gemini और Phi 4 को दी चुनौती
DeepSeek: AI समुदाय इस सप्ताह DeepSeek के अपडेट किए गए R1 रीजनिंग मॉडल को लेकर चर्चा में रहा। कंपनी ने चुपचाप एक नया, हल्का लेकिन अधिक शक्तिशाली संस्करण भी पेश किया है।

DeepSeek: उज्जवल प्रदेश डेस्क. AI समुदाय इस सप्ताह DeepSeek के अपडेट किए गए R1 रीजनिंग मॉडल को लेकर चर्चा में रहा। कंपनी ने चुपचाप एक नया, हल्का लेकिन अधिक शक्तिशाली संस्करण भी पेश किया है- DeepSeek-R1-0528-Qwen3-8B. यह मॉडल अलीबाबा द्वारा जारी किए गए Qwen3-8B पर आधारित है और AI सेक्टर में तहलका मचा रहा है।
DeepSeek-R1-0528-Qwen3-8B में क्या खास है?
डीपसीक-R1-0528-QWEN3-8B एक आसुत एआई (AI) मॉडल है, जिसका अर्थ है कि इसे अपने बड़े मॉडल से संघनित (Condensed) और अनुकूलित किया गया है। इसके बावजूद, इसने कई प्रमुख AI बेंचमार्क पर शानदार प्रदर्शन किया है. IME 2025 (Advanced Mathematical Reasoning) परीक्षण में, मॉडल ने गूगल जेमिनी 2.5 (Google Gemini) फ्लैश को हराया। HMMT (हार्वर्ड-MIT गणित प्रतियोगिता) पर, इसका प्रदर्शन Microsoft के नए Phi-4 रीजनिंग प्लस मॉडल के बराबर रहा है।
यह AI उद्योग के लिए एक बड़ी बात है क्योंकि छोटे मॉडल आम तौर पर बड़े मॉडल की तुलना में कम सक्षम होते हैं, लेकिन DeepSeek का मॉडल उस धारणा को चुनौती देता है।
तकनीकी विश्लेषण: कम संसाधनों के साथ उच्च प्रदर्शन
DeepSeek-R1-0528-Qwen3-8B की विशेषता इसका इकोनोमिकल उपयोग है:
- 40GB-80GB RAM वाले GPU की पर बिना रुके काम कर सकता है
- इसके विपरीत, अपडेट किए गए पूर्ण-आकार वाले R1 मॉडल के लिए 12 80GB GPU की आवश्यकता होती है।
- यह इस मॉडल को स्टार्टअप, शोधकर्ताओं और छोटे AI डेवलपर्स के लिए एक व्यवहार्य विकल्प बनाता है।
DeepSeek मॉडल प्रशिक्षण और उपयोग
डीपसीक ने अपने बड़े R1 मॉडल से उत्पन्न पाठ का उपयोग किया और इस मॉडल को बनाने के लिए Qwen3-8B पर इसे ठीक किया। इसका लक्ष्य एक तर्क-केंद्रित मॉडल बनाना था जो अकादमिक शोध और औद्योगिक दोनों जरूरतों को पूरा कर सके।
डीपसीक-R1-0528-Qwen3-8B को एमआईटी लाइसेंस (MIT license) के तहत जारी किया गया है, जिसका अर्थ है कि कोई भी इसे बिना किसी प्रतिबंध के व्यावसायिक परियोजनाओं (Commercial Projects) में उपयोग कर सकता है।
DeepSeek इसका उपयोग कहां और कैसे करें?
- Hugging Face पर उपलब्ध है डीपसीक-R1-0528-Qwen 3-8B का डेडिकेटेड वेबपेज।
- एलएम (LM) स्टूडियो और अन्य डेवलपर प्लेटफ़ॉर्म ने पहले ही एपीआई के माध्यम से इस मॉडल को उपलब्ध करा दिया है।