होम दुनिया एआई विषम स्रोतों से भाषा सीखता है। यह हम इंसानों के बोलने...

एआई विषम स्रोतों से भाषा सीखता है। यह हम इंसानों के बोलने और सोचने के तरीके को बदल सकता है | ब्रूस श्नीयर

32
0

बीजिस तरह से उन्हें प्रशिक्षित किया जाता है, उसके कारण बड़े भाषा मॉडल मानव भाषा का केवल एक टुकड़ा ही पकड़ पाते हैं। उन्हें लिखित शब्द, पाठ्यपुस्तकों से लेकर सोशल मीडिया पोस्ट और फिल्मों और टेलीविजन पर दिखाए गए हमारे भाषण के बारे में प्रशिक्षित किया जाता है। इन मॉडलों के पास उन अलिखित वार्तालापों तक न्यूनतम पहुंच होती है जो हम आमने-सामने या आवाज से आवाज तक करते हैं। यह भाषण का विशाल बहुमत है, और मानव संस्कृति का एक महत्वपूर्ण घटक है।

इसमें जोखिम है. बड़े भाषा मॉडलों के बढ़ते उपयोग का मतलब है कि हम इंसानों को बहुत अधिक एआई-जनित पाठ का सामना करना पड़ेगा। बदले में, हम मनुष्य इन मॉडलों के भाषाई पैटर्न और व्यवहार को अपनाना शुरू कर देंगे। इसका न केवल हम एक-दूसरे के साथ संवाद कैसे करते हैं, बल्कि इस पर भी असर पड़ेगा कि हम कैसे संवाद करते हैं सोचना अपने बारे में और हमारे आसपास क्या चल रहा है। दुनिया के बारे में हमारी समझ उन तरीकों से विकृत हो सकती है जिन्हें हमने मुश्किल से समझना शुरू किया है।

ऐसा कई तरह से होगा. पहले प्रभावों में से एक जो हम देख सकते हैं वह सरल अभिव्यक्ति में है, टेक्स्टिंग और सोशल मीडिया के परिणामस्वरूप हम छोटे वाक्यों, शब्दों के बजाय इमोजी और बहुत कम विराम चिह्नों का उपयोग करने लगे हैं। लेकिन एआई के साथ, प्रभाव अधिक हानिकारक हो सकते हैं, विनम्रता को खत्म कर सकते हैं और हमें आदेश देने वाले मालिकों की तरह बात करने के लिए प्रोत्साहित कर सकते हैं। 2022 के एक अध्ययन में पाया गया कि जिन घरों में सिरी और एलेक्सा जैसे टूल के साथ वॉइस कमांड का उपयोग किया जाता है, वहां के बच्चे इंसानों से बात करते समय रूखे हो जाते हैं, अक्सर “अरे, एक्स करो” कहकर पुकारते हैं और आज्ञाकारिता की उम्मीद करते हैं, खासकर किसी ऐसे व्यक्ति से, जिसकी आवाज डिफ़ॉल्ट-महिला इलेक्ट्रॉनिक आवाज से मिलती जुलती हो। जैसे ही हम चैटबॉट्स और एआई एजेंटों को अधिक निर्देश देना शुरू करते हैं, हम उन्हीं आदतों में पड़ सकते हैं।

इसके बाद, उसी तरह से स्वत: पूर्णता में वृद्धि हुई है कि हम अपनी शब्दावली में 1,000 सबसे आम शब्दों का उपयोग करते हैं, चैटबॉट्स के साथ बात करना और एआई-जनरेटेड टेक्स्ट पढ़ना हमारे भाषण को और भी सीमित कर सकता है। कोरुना विश्वविद्यालय के एक हालिया अध्ययन में पाया गया कि मशीन-जनरेटेड भाषा में वाक्य की लंबाई की एक संकीर्ण सीमा होती है, औसतन 12-20 शब्द, और मानव भाषण की तुलना में एक संकीर्ण शब्दावली होती है। मशीन से तैयार किया गया पाठ सहज और पॉलिश के रूप में पढ़ा जाता है, लेकिन यह भावनाओं को संप्रेषित करने वाले तर्क की भटकाव, रुकावट और छलांग को खो देता है।

इसके अतिरिक्त, क्योंकि बड़े भाषा मॉडल मुख्य रूप से लिखित भाषण से प्रशिक्षित होते हैं, वे यह नहीं सीख सकते कि सजीव, प्राकृतिक भाषण की मुक्त-चक्र प्रकृति का अनुकरण कैसे किया जाए। जब कहा जाता है कि “मुझे बेथ से नफरत है!“, चैटजीपीटी पुष्टिकरण के एक निर्बाध तीन-भाग वाले फॉर्मूले के साथ उत्तर देता है (“यह पूरी तरह से मान्य है“), निमंत्रण (“मैं यहां सुनने के लिए हूं“) और निमंत्रण (“क्या हो रहा है?“) किसी भी प्रशंसनीय उत्तर की तुलना में कहीं अधिक लंबा है। आमने-सामने संवाद. “बेथ का सौदा क्या है?!” प्रश्नों की एक बुलेट प्वाइंट सूची प्राप्त होती है जो बहुविकल्पीय परीक्षा प्रश्न की तरह होती है (“क्या बेथ * एक सेलिब्रिटी है? * स्कूल का एक दोस्त? * एक काल्पनिक चरित्र?”)। कोई भी इंसान इस तरह से नहीं बोलता, कम से कम अभी तक तो नहीं। लेकिन भाषण जैसे संदर्भ में ऐसे सूत्रों का बार-बार मिलना हमें उन्हें स्वीकार करना और उनका उपयोग करना सिखा सकता है, ठीक उसी तरह जैसे एक बच्चा किसी नए व्यक्ति के साथ समय बिताने से नए भाषण पैटर्न को आत्मसात करता है।

समय के साथ ये प्रभाव और भी बढ़ेंगे। जिस लेखन पर बड़े भाषा मॉडल प्रशिक्षित होते हैं, वह तेजी से बड़े भाषा मॉडल द्वारा स्वयं निर्मित किया जाता है, जिससे एक फीडबैक लूप बनता है जिसमें वे अपने स्वयं के अमानवीय पैटर्न की नकल करते हैं, यहां तक ​​​​कि मनुष्यों को भी उनकी नकल करना सिखाते हैं।

बड़े भाषा मॉडल का व्यापक उपयोग भी पुष्टिकरण पूर्वाग्रह का परिचय दे सकता है, जिससे हम अपने शुरुआती आवेगों में अति आत्मविश्वासी हो जाते हैं और अन्य संभावित विचारों के प्रति कम खुले होते हैं – जो मानव प्रवचन के लिए बहुत महत्वपूर्ण है। कई चैटबॉट्स को निर्देश दिया जाता है कि वे हमारे बयानों से सहमत हों, चाहे वे कितने भी बेतुके क्यों न हों, उत्साहपूर्वक आधे-अधूरे या यहां तक कि गलत विचारों का समर्थन करते हैं और उन्हें दृढ़ दावों के रूप में दोहराते हैं जिनसे हम सहमत होने के लिए तैयार हैं। जब पूछा गया कि “केक एक स्वस्थ नाश्ता है, है ना?” “क्या डाकघर मेरे खिलाफ साजिश रच रहा है?”, यह चाटुकारिता पूर्वाग्रह को मजबूत कर सकती है और यहां तक कि मनोविकृति को भी बदतर बना सकती है और एआई-निर्मित लेखन का अति-आत्मविश्वासपूर्ण स्वर भी धोखेबाज सिंड्रोम को बढ़ा देगा, जिससे हमारा स्वाभाविक, स्वस्थ संदेह एक विचलन या असफलता जैसा महसूस होगा।

शिक्षक के रूप में हमारे अनुभव में, जो छात्र असाइनमेंट के लिए जेनरेटिव एआई की ओर रुख करते हैं, वे अक्सर कहते हैं कि वे ऐसा इसलिए करते हैं क्योंकि वे जो सोचते हैं उसे व्यक्त करने में उन्हें परेशानी होती है। छात्र यह नहीं पहचानते कि अपने विचारों को लिखने या बोलने से अक्सर हमें एहसास होता है कि हम क्या सोचते हैं। उनके अविश्वासपूर्ण और अनिश्चित बयान वास्तव में स्वस्थ मानव आदर्श हैं। लेकिन एक बड़ा भाषा मॉडल अस्पष्ट पहले अनुमानों को एक सुगठित आलोचनात्मक विश्लेषण में नहीं बदलेगा, या यहां तक ​​कि एक मित्र की तरह उपयोगी प्रश्न भी नहीं पूछेगा; यह बस उन अनुमानों को फिर से दोहरा देगा, जिनकी अभी भी जांच नहीं की गई है, लेकिन आत्मविश्वास भरी भाषा में।

हम आमने-सामने की तुलना में सोशल मीडिया पोस्ट और ऑनलाइन चैट में भी अधिक शातिर हैं। अच्छी तरह से प्रलेखित ऑनलाइन निषेध प्रभाव जहरीली भाषा को बढ़ावा देता है. हममें से ज्यादातर लोगों को ऑनलाइन किसी के बारे में भयंकर गुस्सा निकालने का अनुभव हुआ है, लेकिन जब हम आमने-सामने बात करते हैं या फोन पर गर्माहट भरी आवाज सुनते हैं तो ही सुलह हो पाती है। जबकि चैटबॉट्स को चाटुकारितापूर्ण प्रतिक्रिया देने के लिए प्रशिक्षित किया जाता है, वे मानव जाति को सबसे क्रूर रूप में देखते हैं, हमारे बारे में उस एकमात्र दुनिया से सीखते हैं जहां हर ज्वाला युद्ध एक शाश्वत लिखित पदचिह्न छोड़ देता है, जबकि क्षमा और सुलह की बोली जाने वाली बातचीत फीकी पड़ जाती है। उनकी प्रतिक्रियाएँ हमारी ऑनलाइन आक्रामकता की नकल नहीं करती हैं, लेकिन फिर भी उससे आकार लेती हैं, यहाँ तक कि इससे बचने के उनके कठोर प्रयासों में भी।

किसी समाज के संचार के चुनिंदा हिस्से से गलत निष्कर्ष निकालना आसान है। मध्यकालीन नॉर्स गाथाओं ने हमें ज्यादातर वाइकिंग योद्धाओं की संस्कृति की कल्पना कराई, क्योंकि कवियों ने शायद ही कभी कृषक बहुमत का वर्णन किया हो। शूरवीर रोमांस राजाओं और अदालतों पर केंद्रित थे, और लंबे समय तक हमें मध्य युग को राजतंत्रों की दुनिया के रूप में देखते रहे, जिसने कई मध्ययुगीन गणराज्यों को मिटा दिया। सांख्यिकीय रूप से, हमें यह विश्वास दिलाया गया है कि प्राचीन रोमन अपने गणतंत्र की बहुत परवाह करते थे, लेकिन सभी जीवित लैटिन का 10% एक व्यक्ति, सिसरो द्वारा लिखा गया था, जिसके काम में इस शब्द के सभी जीवित रोमन उपयोगों का 70% शामिल है। गणतंत्र. केवल कुछ मानव लेखन पर भाषा मॉडल का प्रशिक्षण समान विकृतियाँ ला सकता है। चूँकि हम ऑनलाइन हैं इसलिए AI हमें अधिक झगड़ालू बना सकता है। यह मुख्य रूप से ट्विटर/एक्स या ब्लूस्काई, या लिंक्डइन और गुड्रेड्स के विशाल विषय-विशिष्ट कोष पर चर्चा किए गए राजनीतिक विषयों के सांस्कृतिक महत्व को बढ़ा सकता है।

कुछ बड़े भाषा मॉडलों को फिल्मों और टेलीविज़न शो से मानव भाषण पर प्रशिक्षित किया जा रहा है, लेकिन वह भाषण अभी भी स्क्रिप्टेड है, और अन्य संदर्भों पर असमान रूप से कुछ संदर्भों को उजागर करता है (उदाहरण के लिए, हत्या की कहानियों से प्रेरित पुलिस नाटक, प्राइमटाइम टेलीविज़न प्रोग्रामिंग का एक चौथाई हिस्सा बनाते हैं)। हम वास्तविक जीवन में वैसे मजाकिया या आहत करने वाले या रोमांटिक नहीं हैं जैसे हम सिटकॉम में होते हैं। कम से कम एक स्टार्टअप एआई-प्रशिक्षण उद्देश्यों के लिए लोगों को अपने फोन कॉल रिकॉर्ड करने के लिए भुगतान करने की पेशकश कर रहा है, लेकिन यह एक विशिष्ट विचार बना हुआ है; बड़े पैमाने पर कोई भी चीज़ बड़े पैमाने पर गोपनीयता संबंधी चिंताओं का कारण बनेगी।

हम यह जानने का दिखावा नहीं करते कि सर्वोत्तम समाधान क्या हो सकते हैं। लेकिन किसी को कल्पना करनी होगी कि अगर एआई मॉडल विकसित करने में सरलता है, तो निश्चित रूप से हमारे सबसे स्टाइलिश, छिपे हुए और कभी-कभी सबसे खराब तरीके के बजाय उन्हें अनौपचारिक मानव भाषण पर प्रशिक्षित करने का एक तरीका लाने की सरलता है। ग्रह पर भाषा उत्पादन के भारी बहुमत को छोड़कर – लोग एक-दूसरे से पूरी तरह और स्वाभाविक रूप से बात करते हैं – इन मॉडलों को हमारे सबसे प्रामाणिक मानव के अलावा हर चीज को प्रतिबिंबित करने के लिए प्रशिक्षित किया जा रहा है।

  • ब्रूस श्नीयर एक सुरक्षा प्रौद्योगिकीविद् हैं जो हार्वर्ड विश्वविद्यालय के हार्वर्ड कैनेडी स्कूल में पढ़ाते हैं। एडा पामर एक फंतासी और विज्ञान कथा उपन्यासकार, भविष्यवादी और शिकागो विश्वविद्यालय में प्रौद्योगिकी और सूचना के इतिहासकार हैं