
Google ने गुरुवार को आर्टिफिशियल इंटेलिजेंस (AI) मॉडल के Gemma 3 परिवार में नवीनतम ओपन-सोर्स मॉडल Gemma 3N का पूरा संस्करण जारी किया। पहली बार मई में घोषित किया गया, नया मॉडल ऑन-डिवाइस उपयोग के मामलों के लिए डिज़ाइन और अनुकूलित किया गया है और कई नए आर्किटेक्चर-आधारित सुधारों की सुविधा है। दिलचस्प बात यह है कि बड़े भाषा मॉडल (एलएलएम) को स्थानीय रूप से केवल 2 जीबी रैम पर चलाया जा सकता है। इसका मतलब है कि मॉडल को स्मार्टफोन पर भी तैनात और संचालित किया जा सकता है, बशर्ते कि यह एआई-सक्षम प्रोसेसिंग पावर के साथ आता है।
GEMMA 3N एक मल्टीमॉडल एआई मॉडल है
में एक ब्लॉग भेजामाउंटेन व्यू-आधारित टेक दिग्गज ने GEMMA 3N के पूर्ण संस्करण को जारी करने की घोषणा की। मॉडल Gemma 3 और Gemmasign मॉडल के लॉन्च का अनुसरण करता है और Gemmavers में शामिल होता है। चूंकि यह एक ओपन-सोर्स मॉडल है, कंपनी ने अपने मॉडल वेट के साथ-साथ कुकबुक को समुदाय को भी प्रदान किया है। मॉडल स्वयं एक अनुमेय GEMMA लाइसेंस के तहत उपयोग करने के लिए उपलब्ध है, जो शैक्षणिक और वाणिज्यिक दोनों उपयोगों की अनुमति देता है।
GEMMA 3N एक मल्टीमॉडल AI मॉडल है। यह मूल रूप से छवि, ऑडियो, वीडियो और पाठ इनपुट का समर्थन करता है। हालांकि, यह केवल पाठ आउटपुट उत्पन्न कर सकता है। यह एक बहुभाषी मॉडल भी है और इनपुट के मल्टीमॉडल होने पर पाठ के लिए 140 भाषाओं और 35 भाषाओं का समर्थन करता है।
गूगल कहते हैं कि Gemma 3N में एक “मोबाइल-प्रथम वास्तुकला” है, जो Matryoshka ट्रांसफार्मर या Matformer आर्किटेक्चर पर बनाया गया है। यह एक नेस्टेड ट्रांसफार्मर है, जिसका नाम रूसी घोंसले के शिकार गुड़िया के नाम पर रखा गया है, जहां एक दूसरे के अंदर फिट बैठता है। यह आर्किटेक्चर विभिन्न मापदंडों के आकार के साथ एआई मॉडल को प्रशिक्षित करने का एक अनूठा तरीका प्रदान करता है।
GEMMA 3N दो आकारों में आता है – E2B और E4B – प्रभावी मापदंडों के लिए छोटा। इसका मतलब है, आकार में पांच बिलियन और आठ बिलियन पैरामीटर होने के बावजूद, सक्रिय पैरामीटर सिर्फ दो और चार बिलियन हैं।
यह प्रति-लेयर एम्बेडिंग (PLE) नामक एक तकनीक का उपयोग करके प्राप्त किया जाता है, जहां केवल सबसे आवश्यक मापदंडों को फास्ट मेमोरी (VRAM) में लोड करने की आवश्यकता होती है। बाकी अतिरिक्त परत एम्बेडिंग में रहता है और इसे सीपीयू द्वारा नियंत्रित किया जा सकता है।
इसलिए, मैटफॉर्मर सिस्टम के साथ, E4B संस्करण E2B मॉडल को घोंसला बनाता है, और जब बड़े मॉडल को प्रशिक्षित किया जा रहा है, तो यह एक साथ छोटे मॉडल को प्रशिक्षित करता है। यह उपयोगकर्ताओं को अधिक उन्नत संचालन के लिए E4B का उपयोग करने की सुविधा देता है या प्रसंस्करण या आउटपुट की गुणवत्ता में कोई ध्यान देने योग्य अंतर खोजने के बिना तेजी से आउटपुट के लिए E2B।
Google उपयोगकर्ताओं को कुछ आंतरिक भागों को ट्विक करके कस्टम-आकार के मॉडल बनाने दे रहा है। इसके लिए, कंपनी मैटफॉर्मर लैब टूल जारी कर रही है जो डेवलपर्स को कस्टम मॉडल आकारों को खोजने में मदद करने के लिए विभिन्न संयोजनों का परीक्षण करने देगा।
वर्तमान में, Gemma 3N Google के माध्यम से डाउनलोड करने के लिए उपलब्ध है हगिंग फेस लिस्टिंग और कागल प्रविष्टि। उपयोगकर्ता Gemma 3N की कोशिश करने के लिए Google AI स्टूडियो भी जा सकते हैं। विशेष रूप से, जेम्मा मॉडल को सीधे एआई स्टूडियो से क्लाउड रन के लिए भी तैनात किया जा सकता है।