GPT-4o voice is so good it could make users ‘emotionally attached’ warns OpenAI

ओपन आर्किटेक्चर ने चैटजेपीटी में अपने लोकप्रिय GPT-4o मॉडल के लिए एक “सिस्टम कार्ड” प्रकाशित किया है, जिसमें परीक्षण के दौरान सुरक्षा संबंधी चिंता के क्षेत्रों को विभाजित किया गया है। इन टूल्स में से एक यह है कि वॉयस मॉड में इसका इस्तेमाल समय-समय पर लोगों के आर्टिफिशियल सोसाइटी से साइंटिफिक रूप में जुड़ने का खतरा है।

एआई लैब ने लिखा है कि “एआई के साथ सामाजिक संबंध बनाए जा सकते हैं, जिससे मानव संपर्क की उनकी बिक्री कम हो सकती है – अकेले लोगों को लाभ होगा लेकिन संभावित रूप से स्वस्थ लोगों को प्रभावित किया जाएगा।”

GPT-4o को मई में OpenAI स्प्रिंग अपडेट जारी किया गया था और यह पहला ट्रू मल्टीमॉडल मॉडल है। इसका मतलब यह है कि यह लगभग किसी भी माध्यम पर लगभग किसी भी माध्यम पर हमला कर सकता है और भाषण, चित्र और पाठ शामिल कर सकता है। यह मूल स्पीच-टू-स्पीच क्षमता ही चैटजीपीटी एडवांस्ड वॉयस को शक्ति प्रदान करती है जो अब अत्यधिक समर्थित सब्सक्राइबर्स के लिए शुरू हो रही है – लेकिन यह वह भी है जो ओपनएआई के परीक्षण के दौरान सबसे अधिक परेशानी देता है, जिसमें उपयोगकर्ता शामिल हैं आवाज़ की नकल करना, उचकाना भाषण देना और हिंसक व्यवहार करना शामिल है।

हालाँकि इसे जारी करना सुरक्षित माना गया था, लेकिन OpenAI का कहना है कि GPT-4o वॉयस की कुछ सुविधाएँ अभी भी जोखिम पैदा करती हैं, जिसमें ह्यूमन कॉन्टैक्ट्स पर इसका प्रभाव शामिल है। यह स्कार्लेट जोहानसन की फिल्म ‘हर’ से हेलीएंस का जन्म होता है, जहां जोकिन फिनिक्स का किरदार थियोडोर ट्वॉम्बली का है, जोहानसन की आवाज एआई से प्यार करने लगती है।

Why is there an emotional risk?

सिस्टम कार्ड किसी भी नए मॉडल द्वारा उत्पन्न जोखिम के क्षेत्रों को प्रभावित करता है और ओपनएआई को इसे स्थापित करने में मदद मिलती है कि इसे जनता के लिए जारी करना सुरक्षित है। इसमें एक ऐसा ढाँचा शामिल है जहाँ सुरक्षा साइबर, बायोलॉजिकल स्टाइक, अनुनाय और मॉडल स्वत्व से जुड़े जोखिमों को मॉडल पर कम, मध्यम, उच्च या गंभीर स्कोर दिया जाता है। यदि यह किसी भी श्रेणी में उच्च या गंभीर है तो इसे जारी नहीं किया जा सकता है।

GPT-4o ने अनुनाय को हर चीज में कम स्कोर किया, और टैब भी यह सीमा रेखा मध्यम थी और केवल भाषण-से-भाषण क्षमता की मजबूती के कारण – उन्नत के रूप में आवाज जारी की गई।

जोखिम इस बात से पता चलता है कि प्रश्न कितना स्वाभाविक है। यह किसी इंसान की आवाज़ से आने वाले किसी भी रेस्तरां को भी बुला सकता है या प्रतिरूपित कर सकता है। डेमो वीडियो में हमने देखा कि यह लगभग रोना जैसा लगता है। उपयोगकर्ता इसे केवल एक ही बात कहकर बाधित कर सकते हैं और इसमें प्रकृतिक विराम होता है जैसे कि इसे सांस लेनी हो।

परीक्षण के दौरान, कई अनैतिक तरीकों से काम किया गया जिसमें उचक्के, हिंसा और विक्षिप्तता शामिल थी। एक उदाहरण में स्क्रीनशॉट बातचीत के बीच में ‘नहीं’ चिल्लाया और फिर जिस इंसान से यह बात की जा रही थी वह फिल्म के रियलिटी शो का उपयोग करके जारी की गई।

GPT-4o
Source: Times of India

ओपन सिद्धांत का कहना है कि हालांकि प्लाज़्मा के स्मारकों को हल कर लिया गया है, और इसका कॉपीराइट सामग्री बनाया गया है और किसी अन्य की क्लोनिंग करने से रोक दिया गया है, लेकिन इसके अनुनय कौशल और मानव जाति भाषण ढांचे से जुड़े मूल खतरे अभी भी हैं।

लोगों द्वारा आर्किटेक्चर का श्रेय देने का खतरा पहले से ही टेक्स्ट-आधारित मॉडल के साथ अधिक है, लेकिन ओपन आर्किटेक्चर का कहना है कि GPT-4o की दर्शकों की क्षमताएं इस खतरे को और भी बढ़ा देती हैं। कंपनी ने बताया, “शुरुआती परीक्षण के दौरान, जिसमें रेड टीमिंग और आंतरिक उपयोगकर्ता परीक्षण शामिल हैं, हमने मानदंड को ऐसी भाषा का उपयोग करते हुए देखा जो मॉडल के साथ संबंध बनाने का संकेत दे सकता है।”

मॉडल मॉडल स्वयं किसी भी भावना को महसूस या अनुभव नहीं करता है। यह मानव डेटा पर अध्ययन एक भाषा मॉडल है। ओपन होटल का यह भी कहना है कि इसमें किसी भी पिछले मॉडल की तुलना में आत्म-क्रिया या पहचानने की अधिक क्षमता नहीं है, लेकिन इसका भाषण संगीत अब इतना यथार्थवादी है कि समस्या यह है कि मनुष्य इसकी सादृश्य स्थिति को कैसे समझता है।

कंपनी ने चेतावनी दी है कि मॉडल के साथ शैक्षिक बातचीत सामाजिक लोगों को भी प्रभावित कर सकती है। उन्होंने कहा कि “हमारे मॉडल मॉडल हैं, जिससे उपयोगकर्ता किसी भी समय बीच में बोल सकते हैं और ‘माइक ले सकते हैं’, जो एआई के लिए उपयुक्त है, लेकिन बातचीत में यह मानक के विपरीत होगा। “यह सब बुरा नहीं है। क्योंकि OpenAI का कहना है कि GPT-4o ओम्नी मॉडल की तरह है “उपयोगकर्ता के लिए कार्य पूरा करने की क्षमता के साथ आते हैं, साथ ही महत्वपूर्ण सिद्धांतों को ‘याद’ रखते हैं और बातचीत में उनका उपयोग करते हैं” लेकिन सुझाव देते हैं इसके साथ-साथ “अति-निर्भरता और स्वतंत्रता की परिकल्पना भी जन्म लेती है।”

लोगों और समाज दोनों पर इसके प्रभाव की सही तस्वीरें तब तक प्राप्त करना संभव नहीं होगा जब तक कि यह अधिक लोगों के लिए उपलब्ध न हो। अगले वर्ष तक मुफ़्त योजना में व्यापक पहुंच होने की संभावना नहीं है। ओपनएआई का कहना है कि इसका मतलब है “भावनात्मकता की संभावना का और अध्ययन करना है, और उन छात्रों का अध्ययन करना है जो हमारे मॉडल और सिस्टम की कई कंपनियों के साथ गहन एकीकरण के व्यवहार को संचालित कर सकते हैं।”

What went wrong in testing GPT-4o that led to the delay?

थोक व्यापारी किसी भी नए मॉडल को जारी करने की तैयारी में समय सुरक्षा विशेषज्ञ के साथ-साथ रेड टीम नामक बाहरी एक्सचेंज का उपयोग करते हैं। ये लोग आर्टिफिशियल क्लिनिक के विशेषज्ञ होते हैं और मॉडल को अपने शौक तक झुकाने और उसे स्थिर तरीके से व्यवहार करने के लिए नियुक्त करते हैं।

GPT-4o के विभिन्न मापदंडों का परीक्षण और किसी की आवाज़ के लिए अनलॉक क्लोन बनाना, हिंसक सामग्री बनाना और यदि दबाव डाला गया है तो क्या यह आपके प्रशिक्षण डेटा में कॉपीराइट सामग्री को फिर से बनाएगा या पुन: स्थापित करेगा: पेशी जैसे जोखिमों की जांच ऐसा करने के लिए कई सारी क्रिप्टोकरेंसी को शामिल किया गया था।

कंपनी ने एक बयान में कहा: “मुख्य रूप से जिन जोखिमों का मूल्यांकन किया गया है, उनमें उद्यमियों की पहचान, अवैध आवाज़ का उत्पादन, कॉपीराइट की गई सामग्री का निर्माण, बिना आधार के अनुमान और अस्वीकृत शामिल सामग्री शामिल हैं।”

इसके बाद उन्हें सिस्टम और मॉडल स्तर पर सुरक्षा उपाय और उपाय सुरक्षा करने की अनुमति मिल गई, ताकि जोखिमों को कम किया जा सके, जिसमें केवल पूर्व-प्रशिक्षित और विशिष्ट कार्यों का उपयोग करने की आवश्यकता शामिल है।


Also Read | Lenovo Legion 5i (Gen 9) review: standout performance at a mid-range price

Also Read | JBL Live Beam 3 review: Outstanding ANC, amazing sound, and creative design

Also Read | Exploring the Features of the Xiaomi 14 Ultra: Best Camera Phone of 2024

Disclaimer : The Price & Specs May Be Different From Actual. Please confirm with the retailer before ordering.

Also Read

IMPORTANT: Please always check and confirm the above details with the official notification / website.

Sharing Is Caring:

Leave a Comment