SHANGHAI, CHINA - JANUARY 28, 2025 - A user displays the LOGO of DeepSeek on a mobile phone in front of the artificial intelligence digital world background in Shanghai, China, January 28, 2025. (Photo credit should read CFOTO/Future Publishing via Getty Images)
पिछले हफ्ते एक डेवलपर प्लेटफॉर्म पर गुमनाम रूप से सामने आए एक शक्तिशाली कृत्रिम बुद्धिमत्ता मॉडल का खुलासा बुधवार को हुआ कि यह चीनी स्मार्टफोन और इलेक्ट्रिक वाहन निर्माता कंपनी Xiaomi का है। इससे इस अटकल को बल मिला कि स्टार्टअप DeepSeek लॉन्च से पहले चुपचाप अपनी अगली पीढ़ी के सिस्टम का परीक्षण कर रहा था।
पिछले साल डीपसीक के कम लागत वाले मॉडल डीपसीक-वी3 और आर1 के लॉन्च ने वैश्विक तकनीकी शेयरों में भारी गिरावट ला दी, जिससे निवेशकों के मन में यह सवाल उठने लगा कि क्या अमेरिकी एआई कंपनियों को एआई कंप्यूटिंग क्षमता पर अरबों डॉलर खर्च करने की आवश्यकता है। तब से, डीपसीक-वी4 में काफी दिलचस्पी देखी जा रही है, जो अगली पीढ़ी का मॉडल है और अभी तक लॉन्च नहीं हुआ है।
हंटर अल्फा नामक रहस्यमय मुफ्त मॉडल 11 मार्च को एआई गेटवे प्लेटफॉर्म ओपनराउटर पर बिना किसी डेवलपर के नाम के सामने आया और बाद में प्लेटफॉर्म द्वारा इसे “स्टील्थ मॉडल” के रूप में वर्णित किया गया।
Xiaomi की AI मॉडल टीम MiMo, जिसका नेतृत्व DeepSeek के पूर्व शोधकर्ता लूओ फुली कर रहे हैं, ने बुधवार को कहा कि हंटर अल्फा “MiMo-V2-Pro का एक प्रारंभिक आंतरिक परीक्षण निर्माण” है। यह मॉडल AI एजेंटों के “मस्तिष्क” के रूप में कार्य करने के लिए डिज़ाइन किया गया है। AI एजेंट ऐसे उपकरण हैं जो चैटबॉट की तुलना में कम मानवीय संकेतों और पर्यवेक्षण के साथ उपयोगकर्ताओं को जटिल कार्यों को निष्पादित करने की अनुमति दे सकते हैं।
Xiaomi का यह लॉन्च ऐसे समय में आया है जब ओपन-सोर्स एजेंट फ्रेमवर्क OpenClaw को चीन में सभी प्रकार के उपयोगकर्ताओं द्वारा तेजी से अपनाया जा रहा है।
“मैं इसे एक शांत घात कहता हूं – इसलिए नहीं कि हमने इसकी योजना बनाई थी, बल्कि इसलिए कि चैट से एजेंट प्रतिमान में बदलाव इतनी तेजी से हुआ कि हमें खुद भी इस पर मुश्किल से विश्वास हुआ,” लूओ ने गुरुवार को एक एक्स पोस्ट में कहा।
“लोग पूछते हैं कि हम इतनी तेजी से आगे क्यों बढ़ते हैं। मैंने डीपसीक आर1 का निर्माण करते समय इसे स्वयं देखा है।”
रहस्यमय चीनी मॉडल
रॉयटर्स द्वारा किए गए परीक्षणों के दौरान, हंटर अल्फा चैटबॉट ने खुद को “एक चीनी एआई मॉडल बताया जिसे मुख्य रूप से चीनी भाषा में प्रशिक्षित किया गया है” और कहा कि इसका डेटा मई 2025 तक का है, जो कि डीपसीक के अपने चैटबॉट द्वारा रिपोर्ट किए गए ज्ञान की सीमा का समान बिंदु है।
हालांकि, जब इसके निर्माता के बारे में पूछा गया, तो सिस्टम ने अपने डेवलपर की पहचान बताने से इनकार कर दिया।
चैटबॉट ने कहा, “मुझे सिर्फ अपना नाम, अपना पैरामीटर स्केल और अपनी कॉन्टेक्स्ट विंडो की लंबाई पता है।”
हंटर अल्फा के प्रोफाइल पेज पर इसे 1-ट्रिलियन-पैरामीटर मॉडल के रूप में वर्णित किया गया है, जिसका अर्थ है कि इसे लगभग एक ट्रिलियन समायोज्य मूल्यों का उपयोग करके प्रशिक्षित किया गया था जो यह निर्धारित करते हैं कि सिस्टम भाषा को कैसे संसाधित करता है और प्रतिक्रियाएं उत्पन्न करता है।
यह सिस्टम दस लाख टोकन तक की एक संदर्भ विंडो का भी विज्ञापन करता है, जो यह मापता है कि एक एआई मॉडल एक ही इंटरैक्शन के दौरान कितना टेक्स्ट प्रोसेस या याद रख सकता है। एक टोकन मोटे तौर पर टेक्स्ट के एक छोटे से हिस्से, जैसे कि किसी शब्द के एक भाग के बराबर होता है।
एआई एजेंट सिस्टम बनाने वाले इंजीनियर नबील हाउआम ने कहा, “हंटर अल्फा के 1 मिलियन टोकन के संदर्भ, तर्क क्षमता और मुफ्त पहुंच का संयोजन सबसे अलग था।”
उन्होंने आगे कहा, “उस संदर्भ सीमा वाले अधिकांश अग्रणी मॉडलों को बड़े पैमाने पर लागू करने में वास्तविक लागत आती है।”
ये विशिष्टताएं डीपसीक के अगली पीढ़ी के वी4 मॉडल के लिए स्थानीय मीडिया में व्यक्त की गई अपेक्षाओं से मिलती-जुलती थीं, जिसके बारे में चीनी मीडिया आउटलेट्स ने बताया है कि इसे अप्रैल की शुरुआत में ही लॉन्च किया जा सकता है।
स्वतंत्र एआई बेंचमार्क परीक्षण चलाने वाले उमुर ओज़कुल ने कहा कि विज्ञापित समय और क्षमताओं को देखते हुए मॉडल को डीपसीक से जोड़ने की अटकलें समझ में आती हैं।
गुप्त परीक्षण
अनाम मॉडल लॉन्च असामान्य नहीं हैं, क्योंकि ओपनराउटर जैसे प्लेटफॉर्म डेवलपर्स को एक ही इंटरफेस के माध्यम से दर्जनों एआई मॉडल को क्वेरी भेजने की अनुमति देते हैं, जिससे वे नए सिस्टम के लिए एक लोकप्रिय परीक्षण स्थल बन जाते हैं।
पोनी अल्फा नामक एक अज्ञात मॉडल फरवरी में ओपनराउटर पर दिखाई दिया, जिसके पांच दिन बाद चीनी फर्म ज़िपू एआई ने पुष्टि की कि यह उसके जीएलएम-5 सिस्टम का हिस्सा था।
हंटर अल्फा के प्रोफाइल पेज पर एक नोटिस में कहा गया है कि मॉडल के लिए सभी प्रॉम्प्ट और पूर्णताएँ “प्रदाता द्वारा लॉग की जाती हैं और मॉडल को बेहतर बनाने के लिए उपयोग की जा सकती हैं,” जो निष्पक्ष प्रतिक्रिया के लिए गुप्त मॉडल लॉन्च का उपयोग करने की उद्योग-व्यापी प्रथा को रेखांकित करता है।
MiMo के अनुसार, प्लेटफॉर्म पर आने के बाद इस मॉडल को तेजी से अपनाया गया, कुल उपयोग में एक ट्रिलियन टोकन का आंकड़ा पार कर गया और OpenRouter पर लीडरबोर्ड चार्ट में शीर्ष स्थान हासिल किया।
