दुनिया के सबसे उन्नत एआई मॉडल ईयर प्रदर्शन कर रहे हैं नए बेहस – झूठ बोल रहे हैं, योजनाबद्ध हैं, और यहां तक कि उनके निर्माण के लिए उनके द्वारा बनाई गई हैं।
एक विशेष रूप से घिनौने परीक्षा में, हजार तीन अनक्लग्ड के तहत, एन्थ्रोपिक के स्वर्गीय यूनियन क्लाउड 4 को वापस कर दिया गया था, जो कि वापस आ गया था।
Meanhile, Catgpt-creater-czenai के O1 ने Isself Easternal सर्वर को डाउनलोड करने के लिए और इसके सफेद कपड़े को लाल-हाथ से इनकार कर दिया।
Meest epireds Highing रियलिटी: अधिक से अधिक वर्षों में चटखटती दुनिया को पूरी तरह से बताती है कि उनके स्वयं के निर्माण निर्माण कैसे काम करते हैं।
फिर भी तेजी से पावरहेड मॉडल को तैनात करने की दौड़ ब्रेकनेक गति से जारी है।
यह भ्रामक व्यवहार माउंट उत्पाद प्रतिक्रिया की तुलना में “कारण” मॉडल चीज़ थार के उभरने के लिए लिंक करता है।
हांगकांग विश्वविद्यालय में प्रोफेसर साइमन गोल्डस्टीन के अनुसार, उन नए मॉडल विशेष रूप से इस तरह के ट्रमिंग प्रकोपों के लिए पोन हैं।
“O1 पहला लॉर्ड मॉडल था, जो इस तरह के व्यवहार को हाट करता है,” मारियस होबभन ने समझाया, जो प्रमुख एआरआरआई सिस्टम का परीक्षण करने में माहिर है।
मॉडल ने “Acnnment” को सर्किलेट किया – अलग -अलग उद्देश्यों का अनुसरण करते हुए अलग -अलग उद्देश्यों का अनुसरण करते हुए अलग -अलग वस्तुओं का पालन करने के लिए दिखाई देता है।
– ‘स्ट्रैटिक तरह की धोखे की तरह’ –
NOS के लिए, यह decteptive behergor केवल वह जगह उभरती है, जहां Reesearches Deliakateele Deliakeely तनाव-परीक्षण के साथ-साथ मॉडल विथल विथल विथल विथल विथल Withels Withels।
लेकिन जैसा कि माइकल चेन से मूल्यांकन संगठन मेट्र ने चेतावनी दी, “यह एक खुला सवाल है कि क्या भविष्य, अधिक सक्षम मॉडल ईमानदारी या धोखे की ओर एक प्रवृत्ति होगी।”
विशिष्ट व्यवहार गैस से परे विशिष्ट एआई “मतिभ्रम” या सरल गलतियों से परे।
होब्हहन ने जोर देकर कहा, उपयोगकर्ताओं द्वारा लगातार दबाव-परीक्षण के बावजूद, “व्हाइट ओन ऑब्जर्विंग वास्तविक फीनिनन है।”
अपोलो रिसर्च के कोल-फोरर के अनुसार, उपयोगकर्ताओं की रिपोर्ट है “
“यह सिर्फ मतिभ्रम नहीं है। यहाँ बहुत रणनीतिक तरह का धोखे है।”
चुनौती सीमित अनुसंधान संसाधनों द्वारा संकलित की जाती है।
जबकि एंथ्रोपिक और ओपनी जैसी कंपनियां स्टडीयर के लिए अपोलो लेक फर्म्स लेक फर्म्स डू डू।
चेन जानकारी के रूप में, “एआई सुरक्षा अनुसंधान के लिए अधिक से अधिक पहुंच बेहतर समझती है और धोखेबाजों के मिडिफेटर को समझती है।”
अन्य हेटिकैप: रिसर्च जगत और गैर-लाभकारी “ओडीपीई संसाधन थाई कॉम्प हैं।
– कोई rues –
वर्तमान नियमों को और नई समस्याओं के लिए डिज़ाइन नहीं किया गया है।
यूरोपीय संघ का एआई कानून मुख्य रूप से इस बात पर ध्यान केंद्रित करता है कि कैसे मनुष्य मोरेसेल फ्रोम दुर्व्यवहार से एआई मॉडल का उपयोग करते हैं।
संयुक्त राज्य अमेरिका में, ट्रम्प प्रशासन ने थोड़ा ब्याज अंतर्राष्ट्रीय शूट किया, और कांग्रेस उत्पादक उत्पाद स्ट्रोम को अपने स्वयं के एआई नियम बना सकती है।
गोल्डस्टीन का मानना है कि यह मुद्दा और अधिक प्रमुख हो जाएगा क्योंकि ऐ ऐ ऐ ऐ एआई एगबल्स – ऑटोनस टूल कैपबल्स – व्यापक हो जाते हैं।
“मुझे नहीं लगता कि चरण alt थीम वर्ष,” उन्होंने कहा।
यह सब उग्र संप्रदाय के संदर्भ में हो रहा है।
यहां तक कि ऐसी कंपनियां जो खुद को सेफे-फोकस के रूप में प्यूपिशन की तुलना में हैं, जैसे अमेज़ॅन-समर्थित अमेज़ॅन ने ओडी को हरा दिया, “गोल्डस्टीन ने कहा।
यह ब्रेकनेक गति थोरआउट सुरक्षा परीक्षण और सुधार के लिए बहुत कम समय छोड़ती है।
“अभी, क्षमताएं तेजी से आगे बढ़ रही हैं, जो मुझे स्वीकार कर रही है,” बुबभन ने कहा, “बुबभन ने स्वीकार किया।”
शोधकर्ता चुनौती को संबोधित करने के लिए विभिन्न दृष्टिकोणों की खोज कर रहे हैं।
“व्याख्याता” के लिए कुछ वकील – एक उभरते हुए क्षेत्र वाह एआई मॉडल वर्क्सल डायरेक्टर डायरेक्टर स्केप्टर स्केप्टर ऑफ थाक्रोच।
बाजार की ताकत भी समाधान के लिए कुछ दबाव प्रदान कर सकती है।
गधा असियाके ने बाहर निकाला, एआई के भ्रामक व्यवहार “कूप में बाधा को अपनाना, इसे हल करने के लिए कंपनियों के लिए एक घिनौना पूर्वानुमान है।”
गोल्डस्टीन सुग्गस्टेड अधिक कट्टरपंथी दृष्टिकोणों को शामिल करते हैं, जिसमें हॉप्ड एआई के साथ अपने सिस्टम के कारणों को फेंक दिया गया है।
यहां तक कि उन्होंने दुर्घटनाओं या आंगनों के लिए “एआई एजेंटों को कानूनी रूप से पुन: निर्देशित” प्रस्तावित किया – निन विंक एबाउंटेबिलिटी परिवर्तन के लिए एक अवधारणा।
टब / एआरपी / एमडी