

नवंबर में वापस, मैंने छवि पीढ़ी क्षमताओं का परीक्षण किया Google के मिथुन के भीतर, जो इमेजेन 3 मॉडल द्वारा संचालित था। जबकि मुझे यह पसंद आया, मैं बहुत जल्दी इसकी सीमाओं में भाग गया। Google ने हाल ही में अपने उत्तराधिकारी – इमेजेन 4 – को रोल आउट किया है और मैं इसे पिछले कुछ हफ्तों से अपने पेस के माध्यम से डाल रहा हूं।
मुझे लगता है कि नया संस्करण निश्चित रूप से एक सुधार है, जैसा कि मेरे पास कुछ मुद्दे थे इमेजेन 3 अब शुक्र है कि चले गए। लेकिन कुछ निराशा अभी भी बनी हुई है, जिसका अर्थ है कि नया संस्करण उतना अच्छा नहीं है जितना मैं चाहूंगा।
आप कितनी बार एआई के साथ चित्र बनाते हैं?
0 वोट
तो, क्या सुधार हुआ है?

उत्पादित छवियों की गुणवत्ता में आम तौर पर सुधार हुआ है, हालांकि सुधार बड़े पैमाने पर नहीं है। इमेजेन 3 पहले से ही लोगों, जानवरों और दृश्यों की छवियों को बनाने में अच्छा था, लेकिन नया संस्करण लगातार तेज, अधिक विस्तृत छवियों का उत्पादन करता है।
जब यह लोगों की छवियों को उत्पन्न करने की बात आती है-जो केवल मिथुन एडवांस्ड के साथ संभव है, तो मेरे पास इमेजेन 3 के साथ लगातार मुद्दे थे, जहां यह कार्टूनिश-दिखने वाली तस्वीरें बनाएगा, तब भी जब मैं उस विशिष्ट शैली के लिए नहीं पूछ रहा था। छवि को कुछ और यथार्थवादी में बदलने के लिए इसे प्रेरित करना अक्सर एक हारने वाली लड़ाई थी। मैंने इमेजेन 4 के साथ उसमें से किसी का भी अनुभव नहीं किया है। यह उत्पन्न करने वाले लोगों की सभी छवियां बहुत ही पेशेवर दिखती हैं – शायद थोड़ा बहुत, जो कि हम बाद में छूएंगे।
पुराने मॉडल के साथ मेरी सबसे बड़ी कुंठाओं में से एक पहलू अनुपात पर सीमित नियंत्रण था। मैं अक्सर 1: 1 वर्ग छवियों के साथ अटक गया, जो उनके उपयोग के मामले को गंभीर रूप से सीमित करता है। मैं उन्हें ऑनलाइन प्रकाशनों के लिए उपयोग नहीं कर सकता था, और उन्हें एक मानक फोटो फ्रेम के लिए प्रिंट करना सवाल से बाहर था।
जबकि कल्पना 4 अभी भी 1: 1 अनुपात के लिए चूक करता है, मैं अब बस इसे एक अलग एक का उपयोग करने के लिए संकेत दे सकता हूं, जैसे कि 16: 9, 9:16, या 4: 3। यह वह सुविधा है जिसका मैं इंतजार कर रहा हूं, क्योंकि यह छवियों को कहीं अधिक बहुमुखी और प्रयोग करने योग्य बनाता है।
इमेजेन 4 भी बहुत अधिक सुचारू रूप से काम करता है। जबकि मैंने इसे तेजी से तेजी से नहीं पाया है – हालांकि एक तेज मॉडल कथित तौर पर कार्यों में है – बहुत कम त्रुटियां हैं। पिछले संस्करण के साथ, मिथुन कभी -कभी एक त्रुटि संदेश दिखाता है, यह कहते हुए कि यह एक अज्ञात कारण के लिए एक छवि का उत्पादन नहीं कर सकता है। मुझे इमेजेन 4 वाले लोगों में से कोई भी नहीं मिला है। यह सिर्फ काम करता है।
अभी भी थोड़ा बहुत दिखता है
जबकि इमेजेन 4 बेहतर छवियों का उत्पादन करता है, अधिक विश्वसनीय है, और विभिन्न पहलू अनुपातों के लिए अनुमति देता है, कुछ ऐसे मुद्दे जो मैंने सामना किए थे, जब इसके पूर्ववर्ती का परीक्षण अभी भी मौजूद है।
मेरी मुख्य समस्या यह है कि छवियां अक्सर उतनी यथार्थवादी नहीं होती हैं जितनी मैं चाहूंगा, खासकर जब लोगों और जानवरों के क्लोज़-अप बनाते हैं। छवियां काफी संतृप्त बाहर आती हैं, और कई एक प्रमुख बोकेह प्रभाव पेश करते हैं जो पेशेवर रूप से पृष्ठभूमि को धुंधला करता है। वे सभी ऐसे दिखते हैं जैसे वे मेरे बजाय 15 साल के अनुभव के साथ एक फोटोग्राफर द्वारा लिए गए थे, बस मेरी बिल्ली पर एक कैमरा इशारा करते हुए और शटर को दबाते हुए।
निश्चित रूप से, वे अच्छे दिखते हैं, लेकिन एक “आकस्मिक मोड” एक शानदार जोड़ होगा – कुछ अधिक यथार्थवादी, जहां प्रकाश सही नहीं है और विषय एक मॉडल की तरह नहीं है। मैंने मिथुन को बोकेह प्रभाव को हटाकर एक छवि को और अधिक यथार्थवादी बनाने के लिए प्रेरित किया और आम तौर पर इसे कम सही बनाया। एआई ने कोशिश की, लेकिन एक ही छवि पर तीन या चार बार इसे संकेत देने के बाद, यह अपनी सीमा तक पहुंचने के लिए लग रहा था और कहा कि यह किसी भी बेहतर नहीं कर सकता है। यह उत्पादित प्रत्येक नई छवि थोड़ी अधिक आकस्मिक थी, लेकिन यह अभी भी काफी पॉलिश थी, स्पष्ट रूप से संकेत देती है कि यह एआई-जनित था।
आप देख सकते हैं कि ऊपर की छवियों में, बाएं से दाएं जा रहे हैं। पहले एक में एक मजबूत बोकेह प्रभाव शामिल है, और आदमी की त्वचा बहुत स्पष्ट है, जबकि अन्य दो प्रगति के लिए पुराने और पुराने दिखने वाले व्यक्ति के साथ -साथ अधिक थका हुआ भी। यहां तक कि उन्होंने पिछली छवि में थोड़ा सा गंदे होना शुरू कर दिया। यह वह नहीं है जो मैं वास्तव में मतलब था जब मिथुन को छवि को और अधिक यथार्थवादी बनाने के लिए प्रेरित किया, हालांकि यह अधिक आकस्मिक निकलता है।
इमेजेन 4 लैंडस्केप और सिटी स्काईलाइन जैसी यादृच्छिक छवियों के साथ एक बेहतर काम करता है। दूर से ली गई ये छवियां, कई क्लोज़-अप विवरणों को शामिल नहीं करती हैं, इसलिए वे अधिक वास्तविक दिखते हैं। फिर भी, यह एक हिट या मिस हो सकता है। सिडनी ओपेरा हाउस की एक छवि बहुत अच्छी लगती है, हालांकि संतृप्ति काफी हद तक टकरा जाती है-घास अतिरिक्त हरी होती है, और पानी एक चित्र-परिपूर्ण नीला है। लेकिन जब मैंने ग्रैंड कैन्यन की एक तस्वीर मांगी, तो यह पूरी तरह से कृत्रिम लग रही थी और किसी को भी यह सोचकर बेवकूफ नहीं बनाती कि यह एक वास्तविक फोटो है। हालांकि इसने कुछ रिट्रीज के बाद बेहतर प्रदर्शन किया।
संपादन बेहतर है, लेकिन वहां काफी नहीं है
पिछले संस्करण के साथ मेरी एक पकड़ इसका अनाड़ी संपादन था। जब कुछ नाबालिग को बदलने के लिए कहा गया – जैसे कि एक टोपी का रंग – एआई इसे करेगा, लेकिन यह एक नया, पूरी तरह से अलग छवि भी उत्पन्न करेगा। आदर्श परिदृश्य एक छवि बनाने के लिए होगा और फिर हर विवरण को ठीक से संपादित करने की अनुमति दी जाए, जैसे कि कपड़ों का एक टुकड़ा बदलना, एक विशिष्ट वस्तु जोड़ना, या मौसम की स्थिति को बदलना, जबकि बाकी सब कुछ ठीक उसी तरह से छोड़ देना।
इमेजेन 4 इस संबंध में बेहतर है, लेकिन ज्यादा नहीं। जब मैंने इसे जैकेट के रंग को नीले रंग में बदलने के लिए प्रेरित किया, तो इसने एक नई छवि बनाई। हालांकि, विशेष रूप से इसे अन्य सभी विवरणों को समान रखने के लिए कहकर, यह मूल से बहुत सारे दृश्यों और विषय को बनाए रखने में कामयाब रहा। ऊपर के उदाहरणों में यही हुआ। तीसरी छवि में महिला समान थी, और वह एक समान कमरे में दिखाई दी, लेकिन उसकी मुद्रा और कैमरा कोण अलग-अलग थे, जिससे यह एक संपादन की तुलना में फिर से शूट था।
यहाँ एक बिल्ली का एक और उदाहरण एक पॉप्सिकल खाने का एक और उदाहरण है। मैंने मिथुन को पॉप्सिकल के रंग को बदलने के लिए प्रेरित किया, और यह किया, और इसने बहुत सारे विवरण बनाए रखे। बिल्ली एक ही है, और इसलिए अधिकांश पृष्ठभूमि है। लेकिन बिल्ली के कान अब बाहर चिपके हुए हैं, और टोपी थोड़ी अलग है। फिर भी, एक अच्छी कोशिश।
अपनी कमियों के बावजूद, इमेजेन 4 एक महान उपकरण है
यहां तक कि अपने मुद्दों और लापता कार्यक्षमता की एक लंबी विशलिस्ट के साथ, इमेजेन 4 अभी भी उपलब्ध सर्वश्रेष्ठ एआई छवि जनरेटर में से एक है। मेरे द्वारा बताई गई अधिकांश समस्याएं अन्य एआई छवि-जनरेशन सॉफ्टवेयर में भी मौजूद हैं, इसलिए ऐसा नहीं है कि मिथुन प्रतियोगिता के पीछे है। ऐसा लगता है कि महत्वपूर्ण तकनीकी बाधाएं हैं जिन्हें इस प्रकार के उपकरण सटीकता और यथार्थवाद के अगले स्तर तक पहुंचने से पहले दूर करने की आवश्यकता है।
अन्य सीमाएं अभी भी जगह में हैं, जैसे कि प्रसिद्ध लोगों की छवियां बनाने या ऐसी सामग्री उत्पन्न करने में असमर्थता जो Google के सुरक्षा दिशानिर्देशों का उल्लंघन करती है। चाहे वह एक अच्छी हो या बुरी बात एक राय की बात हो। कम प्रतिबंधों की तलाश करने वाले उपयोगकर्ताओं के लिए, जैसे विकल्प हैं घिसना।
क्या आपने मिथुन में नवीनतम छवि पीढ़ी की कोशिश की है? मुझे टिप्पणियों में अपने विचार बताएं।