अलीबाबा की क्यूवेन टीम ने पिछले सप्ताह एक नई छवि पीढ़ी आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया। क्यूवेन वीएलओ को डब किया गया, यह क्यूवेन 2.5 विजन लैंग्वेज मॉडल का उत्तराधिकारी है और पुराने मॉडलों की तुलना में कई उन्नयन के साथ आता है। नवीनतम एआई छवि मॉडल पाठ-से-छवि और छवि-से-छवि पीढ़ी दोनों का समर्थन करता है। यह अंग्रेजी और चीनी सहित कई भाषाओं में पाठ इनपुट का भी समर्थन करता है। छवि पीढ़ी के अलावा, एआई मॉडल भी उत्पन्न छवियों के साथ -साथ इनपुट छवियों के लिए इनलाइन संपादन करने में भी सक्षम है।
Qwen Vlo कई भाषाओं में संकेत स्वीकार करता है
में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), क्यूवेन टीम के आधिकारिक हैंडल ने नए मॉडल को जारी करने की घोषणा की। मॉडल का तकनीकी नाम QWEN3-235B-A22B है, और यह कंपनी के चैट इंटरफ़ेस पर यहां मुफ्त में उपलब्ध है। उपयोगकर्ता लॉग इन किए बिना मॉडल का उपयोग भी कर सकते हैं।
गैजेट्स 360 स्टाफ के सदस्यों ने एआई मॉडल का परीक्षण किया और पाया कि इसकी छवि पीढ़ी की क्षमता Google के इमेजेन 2 के बराबर होने के लिए है। अनुदेश निम्नलिखित और छवि आउटपुट गुणवत्ता इमेजेन -3 और ओपनईएआई के जीपीटी -4O-संचालित छवि पीढ़ी की सुविधा की तुलना में थोड़ा कम है। हालांकि, इसकी पीढ़ी का समय उन दोनों की तुलना में तेज है, और इसकी तुलना में इसकी दर अधिक है।
इसके github पर पेजकंपनी ने कहा कि क्यूवेन वीएलओ बेहतर छवि समझ के साथ आता है, जो इसे इनपुट छवि की संरचनात्मक अखंडता को विकृत किए बिना बेहतर इनलाइन संपादन करने में सक्षम बनाता है। यह आउटपुट की समग्र गुणवत्ता में भी सुधार करता है। मॉडल भी अस्पष्ट और ओपन-एंडेड प्रॉम्प्ट को समझता है, और उन छवियों को उत्पन्न कर सकता है जो उपयोगकर्ता की अपेक्षाओं के साथ संरेखित हैं।
छवि पीढ़ी और संपादन के अलावा, क्यूवेन वीएलओ छवि एनोटेशन-संबंधित कार्यों जैसे कि एज डिटेक्शन, सेगमेंटेशन, प्रेडिक्शन मैपिंग, और बहुत कुछ भी कर सकता है। कंपनी ने कहा कि मॉडल का भविष्य का संस्करण भी कई इनपुट छवियों को स्वीकार करने और उपयोगकर्ता अनुरोधों के आधार पर उन्हें संयोजित करने में सक्षम होगा।
नवीनतम एआई छवि जनरेटर के साथ पाठ प्रतिपादन में भी सुधार किया गया है। हम मॉडल के अपने परीक्षण में विभिन्न फोंट में सटीक पाठ उत्पन्न करने में सक्षम थे। अंत में, Qwen VLO इनपुट के रूप में गतिशील पहलू अनुपात के साथ छवियों का समर्थन करता है, जिसमें 4: 1 और 1: 3 जैसे चरम अनुपात शामिल हैं। कंपनी की योजना जल्द ही अलग -अलग पहलू अनुपातों में छवियों को उत्पन्न करने के लिए सुविधा को जोड़ने की है।