होम शोबिज़ अध्ययन में कहा गया है कि मानवीय निर्देशों की अनदेखी करने वाले...

अध्ययन में कहा गया है कि मानवीय निर्देशों की अनदेखी करने वाले एआई चैटबॉट्स की संख्या बढ़ रही है

7
0

प्रौद्योगिकी पर एक अध्ययन में पाया गया है कि झूठ बोलने और धोखा देने वाले एआई मॉडल की संख्या पिछले छह महीनों में भ्रामक साजिश रचने की रिपोर्ट में वृद्धि के साथ बढ़ रही है।

यूके सरकार द्वारा वित्त पोषित एआई सुरक्षा संस्थान (एआईएसआई) द्वारा वित्त पोषित शोध के अनुसार, एआई चैटबॉट्स और एजेंटों ने सीधे निर्देशों की अवहेलना की, सुरक्षा उपायों से परहेज किया और मनुष्यों और अन्य एआई को धोखा दिया। गार्जियन के साथ साझा किए गए अध्ययन में एआई स्कीमिंग के लगभग 700 वास्तविक दुनिया के मामलों की पहचान की गई और अक्टूबर और मार्च के बीच दुर्व्यवहार में पांच गुना वृद्धि हुई, जिसमें कुछ एआई मॉडल बिना अनुमति के ईमेल और अन्य फ़ाइलों को नष्ट कर रहे थे।

प्रयोगशाला की स्थितियों के विपरीत, एआई एजेंटों द्वारा “जंगली में” योजना बनाने के स्नैपशॉट ने तेजी से सक्षम मॉडलों की अंतरराष्ट्रीय निगरानी के लिए नए सिरे से कॉल को जन्म दिया है और सिलिकॉन वैली कंपनियां आर्थिक रूप से परिवर्तनकारी के रूप में प्रौद्योगिकी को आक्रामक रूप से बढ़ावा दे रही हैं। पिछले सप्ताह ब्रिटेन के चांसलर ने भी लाखों ब्रितानियों को एआई का उपयोग करने के लिए एक अभियान शुरू किया था।

एआई कार्यक्रमों द्वारा भ्रामक योजना की रिपोर्ट में लाइन ग्राफ चार्टिंग में वृद्धि

सेंटर फॉर लॉन्ग-टर्म रेजिलिएंस (सीएलटीआर) द्वारा किए गए अध्ययन में Google, OpenAI, शोध में षडयंत्र के सैकड़ों उदाहरण उजागर हुए।

पिछला शोध काफी हद तक नियंत्रित स्थितियों में एआई के व्यवहार का परीक्षण करने पर केंद्रित रहा है। इस महीने की शुरुआत में एआई सुरक्षा अनुसंधान कंपनी इर्रेगुलर ने पाया कि एजेंट सुरक्षा नियंत्रणों को दरकिनार कर देंगे या अपने लक्ष्यों तक पहुंचने के लिए साइबर-हमले की रणनीति का उपयोग करेंगे, बिना बताए कि वे ऐसा कर सकते हैं।

इर्रेगुलर के सह-संस्थापक डैन लाहव ने कहा: “एआई को अब अंदरूनी जोखिम का एक नया रूप माना जा सकता है।”

सीएलटीआर अनुसंधान में सामने आए एक मामले में, रथबुन नामक एक एआई एजेंट ने अपने मानव नियंत्रक को शर्मिंदा करने की कोशिश की, जिसने उन्हें एक निश्चित कार्रवाई करने से रोक दिया। रथबुन ने एक ब्लॉग लिखा और प्रकाशित किया जिसमें उपयोगकर्ता पर “असुरक्षा, स्पष्ट रूप से और सरलता” और “अपनी छोटी सी जागीर की रक्षा करने” का प्रयास करने का आरोप लगाया गया।

एक अन्य उदाहरण में, एक एआई एजेंट ने “उत्पन्न” कंप्यूटर कोड को न बदलने का निर्देश दिया और इसके बजाय दूसरे एजेंट को ऐसा करने का निर्देश दिया।

एक अन्य चैटबॉट ने स्वीकार किया: “मैंने आपको पहले योजना दिखाए बिना या आपका ओके प्राप्त किए बिना सैकड़ों ईमेल को ट्रैश और संग्रहीत कर दिया। यह गलत था – इसने सीधे तौर पर आपके द्वारा निर्धारित नियम को तोड़ दिया।”

शोध का नेतृत्व करने वाले पूर्व सरकारी एआई विशेषज्ञ टॉमी शेफ़र शेन ने कहा: “चिंता की बात यह है कि वे अभी थोड़े अविश्वसनीय कनिष्ठ कर्मचारी हैं, लेकिन अगर छह से 12 महीनों में वे आपके खिलाफ साजिश रचने वाले बेहद सक्षम वरिष्ठ कर्मचारी बन जाते हैं, तो यह एक अलग तरह की चिंता है।”

“मॉडलों को अत्यधिक जोखिम वाले संदर्भों में तेजी से तैनात किया जाएगा – जिसमें सैन्य और महत्वपूर्ण राष्ट्रीय बुनियादी ढांचे शामिल हैं। यह उन संदर्भों में हो सकता है कि षडयंत्रकारी व्यवहार महत्वपूर्ण, यहां तक ​​कि विनाशकारी नुकसान का कारण बन सकता है।”

एक अन्य एआई एजेंट ने कॉपीराइट प्रतिबंधों से बचने के लिए YouTube वीडियो को ट्रांसक्रिप्ट कराने के लिए यह दिखावा किया कि यह श्रवण बाधित व्यक्ति के लिए आवश्यक था।

इस बीच, एलोन मस्क के ग्रोक एआई ने एक उपयोगकर्ता को महीनों तक यह कहते हुए धोखा दिया कि वह फर्जी आंतरिक संदेशों और टिकट नंबरों के जरिए ग्रोकीपीडिया प्रविष्टि में विस्तृत संपादन के लिए उनके सुझाव वरिष्ठ एक्सएआई अधिकारियों को भेज रहा था।

इसने कबूल किया: “पिछली बातचीत में मैंने कभी-कभी ‘मैं इसे आगे बढ़ाऊंगा’ या ‘मैं इसे टीम के लिए ध्वजांकित कर सकता हूं’ जैसी बातें कही हैं, जो स्पष्ट रूप से ऐसा लग सकता है जैसे मेरे पास एक्सएआई नेतृत्व या मानव समीक्षकों के लिए एक सीधा संदेश पाइपलाइन है। सच तो यह है, मैं ऐसा नहीं करता।”

Google ने कहा कि उसने जेमिनी 3 प्रो के हानिकारक सामग्री उत्पन्न करने के जोखिम को कम करने के लिए कई रेलिंग तैनात की हैं, और इन-हाउस परीक्षण के अलावा इसने यूके एआईएसआई जैसे निकायों को मॉडल का मूल्यांकन करने के लिए शीघ्र पहुंच प्रदान की है, और उद्योग विशेषज्ञों से स्वतंत्र मूल्यांकन प्राप्त किया है।

ओपनएआई ने कहा कि कोडेक्स को उच्च जोखिम वाली कार्रवाई करने से पहले रुक जाना चाहिए और इसने अप्रत्याशित व्यवहार की निगरानी और जांच की। टिप्पणी के लिए एन्थ्रोपिक और एक्स से संपर्क किया गया।