जनरेटिव एआई चैटजीपीटी के लिए कानूनी प्रलय का दिन अगर चोरी या उल्लंघन करते पकड़ा गया, तो एआई नैतिकता और एआई कानून को चेतावनी दी

जहां क्रेडिट की ज़रूरत है वहां क्रेडिट दें।

यह थोड़ा सा ऋषि ज्ञान है जिस पर आप शायद दृढ़ विश्वास करने के लिए उठे थे। वास्तव में, कोई यह मानता है या कल्पना करता है कि हम सभी कुछ हद तक यथोचित रूप से सहमत हो सकते हैं कि यह जीवन में अंगूठे का एक उचित और समझदार नियम है। जब कोई ऐसा कुछ करता है जो स्वीकृति के योग्य हो, तो सुनिश्चित करें कि उन्हें उनकी योग्य मान्यता मिले।

विरोधाभासी दृष्टिकोण बहुत कम सम्मोहक प्रतीत होगा।

अगर कोई इधर-उधर जिद करके चला कि क्रेडिट चाहिए नहीं क्रेडिट देय होने पर पहचाना जाना चाहिए, ठीक है, आप यह दावा कर सकते हैं कि ऐसा विश्वास असभ्य और संभवतः गुप्त है। जब किसी ऐसे व्यक्ति का श्रेय धोखा दिया जाता है जिसने कुछ उल्लेखनीय उपलब्धि हासिल की है तो हम अक्सर स्वयं को अत्यधिक परेशान पाते हैं। मैं यह कहने की हिम्मत करता हूं कि हम विशेष रूप से तब नापसंद करते हैं जब दूसरे दूसरों के काम का झूठा श्रेय लेते हैं। यह एक परेशान करने वाली दोहरी मार है। जिस व्यक्ति को श्रेय मिलना चाहिए था, उसे धूप में अपने पल से वंचित कर दिया गया। इसके अलावा, चालबाज सुर्खियां बटोर रहा है, हालांकि वे गलत तरीके से हमें बेवकूफ बनाकर हमारे अनुकूल स्नेहों का गलत इस्तेमाल कर रहे हैं।

सही तरीकों से श्रेय बटोरने और गलत और घृणित तरीकों से बचने के बारे में यह सब प्रवचन क्यों?

क्योंकि जब आर्टिफिशियल इंटेलिजेंस (एआई) में नवीनतम की बात आती है तो हम एक समान स्थिति का सामना कर रहे हैं।

हां, दावा किया जाता है कि यह एक प्रकार के एआई के माध्यम से स्पष्ट रूप से हो रहा है जिसे कहा जाता है जनरेटिव एआई. इस बात की बहुत चर्चा है कि जनरेटिव एआई, इन दिनों समाचारों में सबसे लोकप्रिय एआई, पहले से ही इसका श्रेय ले चुका है जिसका वह श्रेय लेने के लायक नहीं है। और इसके और बिगड़ने की संभावना है क्योंकि जेनेरेटिव एआई का तेजी से विस्तार और उपयोग होता है। जनरेटिव एआई को अधिक से अधिक श्रेय दिया जा रहा है, जबकि दुख की बात है कि सच्चे क्रेडिट के लायक लोग धूल में छोड़ दिए गए हैं।

इस कथित घटना को स्पष्ट रूप से निरूपित करने का मेरा प्रस्तावित तरीका दो स्नैज़ी कैचफ्रेज़ के माध्यम से है:

  • 1) बड़े पैमाने पर साहित्यिक चोरी
  • 2) बड़े पैमाने पर कॉपीराइट उल्लंघन

मुझे लगता है कि OpenAI द्वारा नवंबर में जारी किए गए ChatGPT नामक व्यापक रूप से लोकप्रिय AI ऐप के कारण आप जनरेटिव AI के बारे में जान सकते हैं। मैं क्षण भर में जनरेटिव एआई और चैटजीपीटी के बारे में अधिक कहूंगा। वहाँ पर लटका हुआ।

लोगों की बकरियों को क्या हो रहा है, आइए हम तुरंत इसकी जड़ तक पहुँचें।

कुछ लोग उत्साहपूर्वक शिकायत कर रहे हैं कि जनरेटिव एआई संभावित रूप से सामग्री बनाने वाले मनुष्यों को धोखा दे रहा है। आप देखते हैं, अधिकांश जेनेरेटिव एआई ऐप इंटरनेट पर पाए जाने वाले डेटा की जांच करके डेटा प्रशिक्षित होते हैं। उस डेटा के आधार पर, एल्गोरिदम एआई ऐप के भीतर एक विशाल आंतरिक पैटर्न-मिलान नेटवर्क को सान कर सकता है जो बाद में प्रतीत होता है कि नई सामग्री का उत्पादन कर सकता है जो आश्चर्यजनक रूप से दिखता है जैसे कि यह स्वचालन के एक टुकड़े के बजाय मानव हाथ द्वारा तैयार किया गया था।

यह उल्लेखनीय उपलब्धि काफी हद तक इंटरनेट स्कैन की गई सामग्री का उपयोग करने के कारण है। डेटा प्रशिक्षण के स्रोत के रूप में इंटरनेट सामग्री की मात्रा और समृद्धि के बिना, जनरेटिव एआई बहुत अधिक खाली होगा और उपयोग किए जाने के लिए बहुत कम या कोई दिलचस्पी नहीं होगी। एआई द्वारा लाखों-करोड़ों ऑनलाइन दस्तावेज़ों और टेक्स्ट के साथ-साथ सभी प्रकार की संबंधित सामग्री की जाँच करने से, पैटर्न-मिलान को धीरे-धीरे मानव-निर्मित सामग्री की कोशिश करने और उसकी नकल करने के लिए प्राप्त किया जाता है।

जितनी अधिक सामग्री की जांच की जाती है, संभावना है कि पैटर्न मिलान अधिक बेहतर होगा और मिमिक्री में और भी बेहतर होगा, बाकी सभी समान होंगे।

यहाँ तो अरबों डॉलर का सवाल है:

  • बड़ा सवाल: यदि आपके या अन्य लोगों के पास इंटरनेट पर सामग्री है कि कुछ जनरेटिव एआई ऐप को प्रशिक्षित किया गया था, तो संभवतः आपकी प्रत्यक्ष अनुमति के बिना और शायद पूरी तरह से आपकी जागरूकता के बिना, क्या आपको पाई के एक टुकड़े के हकदार होना चाहिए, जो भी मूल्य उत्पन्न होता है वह सामान्य AI डेटा प्रशिक्षण?

कुछ जोरदार तर्क देते हैं कि एकमात्र उचित उत्तर है हाँ, विशेष रूप से यह कि वे मानव सामग्री निर्माता वास्तव में कार्रवाई में कटौती के पात्र हैं। बात यह है कि, आपको किसी ऐसे व्यक्ति को खोजने में मुश्किल होगी जिसने अपना उचित हिस्सा प्राप्त किया हो, और इससे भी बदतर, लगभग किसी को भी कोई हिस्सा नहीं मिला है। इंटरनेट सामग्री निर्माता जो अनैच्छिक रूप से और अनजाने में योगदान करते हैं, उन्हें अनिवार्य रूप से उनके सही क्रेडिट से वंचित किया जा रहा है।

इसे अत्याचारी और अपमानजनक के रूप में वर्णित किया जा सकता है। हमने अभी-अभी ऋषि के उस ज्ञान के अनपैकिंग को देखा है कि जहाँ श्रेय देय है वहाँ श्रेय दिया जाना चाहिए। जनरेटिव एआई के मामले में, जाहिर तौर पर ऐसा नहीं है। क्रेडिट के बारे में लंबे समय से चले आ रहे और अच्छे नियम का घोर उल्लंघन होता दिख रहा है।

वाह, प्रत्युत्तर जाता है, आप पूरी तरह से अतिरंजना कर रहे हैं और स्थिति को गलत बता रहे हैं। ज़रूर, जेनेरेटिव एआई ने इंटरनेट पर सामग्री की जांच की। निश्चित रूप से, यह जनरेटिव एआई के डेटा प्रशिक्षण के एक भाग के रूप में बहुतायत से सहायक था। माना जाता है कि प्रभावशाली जनरेटिव AI ऐप्स आज इस विचार किए गए दृष्टिकोण के बिना उतने प्रभावशाली नहीं होंगे। लेकिन आप यह कहते हुए बहुत दूर चले गए हैं कि सामग्री निर्माताओं को क्रेडिट के किसी विशेष अंश को आवंटित किया जाना चाहिए।

तर्क इस प्रकार है। मनुष्य इंटरनेट पर जाते हैं और इंटरनेट से चीजें सीखते हैं, ऐसा नियमित रूप से और बिना किसी उपद्रव के करते हैं। एक व्यक्ति जो प्लंबिंग के बारे में ब्लॉग पढ़ता है और फिर मुफ्त में उपलब्ध प्लंबिंग-फिक्सिंग वीडियो देखता है, वह अगले दिन बाहर जा सकता है और प्लंबर के रूप में काम कर सकता है। क्या उन्हें अपने प्लंबिंग-संबंधित प्रेषण का एक हिस्सा उस ब्लॉगर को देने की आवश्यकता है जिसने लिखा है कि सिंक को कैसे प्लंब करें? क्या उन्हें उस व्लॉगर को शुल्क देने की आवश्यकता है जिसने टपका हुआ बाथटब ठीक करने के चरणों को दिखाने वाला वीडियो बनाया है?

लगभग निश्चित रूप से नहीं।

जनरेटिव एआई का डेटा प्रशिक्षण पैटर्न विकसित करने का एक साधन मात्र है। जब तक जेनेरेटिव एआई से आउटपुट केवल जांच की गई बातों का पुनरुत्पादन नहीं है, तब तक आप प्रेरक तर्क दे सकते हैं कि उन्होंने "सीखा" है और इसलिए किसी विशिष्ट स्रोत को कोई विशिष्ट क्रेडिट देने के अधीन नहीं हैं। जब तक आप जनरेटिव एआई को एक सटीक प्रतिगमन करने में नहीं पकड़ सकते, संकेत हैं कि एआई ने किसी विशेष स्रोत से परे सामान्यीकृत किया है।

किसी का कोई श्रेय नहीं है। या, मान लीजिए, आप कह सकते हैं कि इसका श्रेय सभी को जाता है। इंटरनेट पर पाए जाने वाले मानव जाति के सामूहिक पाठ और अन्य सामग्री को श्रेय जाता है। हम सभी को श्रेय मिलता है। किसी विशेष स्रोत को श्रेय देने की कोशिश करना बेमानी है। खुश रहें कि एआई को उन्नत किया जा रहा है और मानवता को लाभ होगा। इंटरनेट पर उन पोस्टिंग को सम्मानित महसूस करना चाहिए कि उन्होंने एआई में प्रगति के भविष्य में योगदान दिया और यह कैसे अनंत काल तक मानव जाति की सहायता करेगा।

मुझे उन दोनों विपरीत विचारों के बारे में और कहना होगा।

इस बीच, क्या आप उस शिविर की ओर झुकते हैं जो कहता है कि क्रेडिट देय है और इंटरनेट पर वेबसाइटों के लिए देर से अतिदेय है, या क्या आप पाते हैं कि विरोधी पक्ष जो कहता है कि इंटरनेट सामग्री निर्माता निश्चित रूप से हैं नहीं फट जाना एक अधिक अकाट्य आसन है?

एक पहेली और एक पहेली सब एक साथ जाम।

चलो इसे अनपैक करें।

आज के कॉलम में, मैं इन व्यक्त चिंताओं को संबोधित करूंगा कि जनरेटिव एआई अनिवार्य रूप से इंटरनेट पर पोस्ट की गई सामग्री के कॉपीराइट का उल्लंघन कर रहा है या संभावित रूप से उल्लंघन कर रहा है (एक बौद्धिक संपदा अधिकार या आईपी मुद्दा माना जाता है)। हम इन आशंकाओं के आधार पर गौर करेंगे। मैं इस चर्चा के दौरान कभी-कभार चैटजीपीटी का जिक्र करूंगा क्योंकि यह जेनेरेटिव एआई का 600 पाउंड का गोरिल्ला है, हालांकि यह ध्यान रखें कि बहुत सारे अन्य जेनेरेटिव एआई ऐप हैं और वे आम तौर पर समान सिद्धांतों पर आधारित होते हैं।

इस बीच, आप सोच रहे होंगे कि वास्तव में जनरेटिव एआई क्या है।

आइए पहले जनरेटिव एआई के मूल सिद्धांतों को कवर करें और फिर हम तत्काल मामले पर बारीकी से नज़र डाल सकते हैं।

इस सब में एआई नैतिकता और एआई कानून के विचार आते हैं।

कृपया ध्यान रखें कि एआई ऐप्स के विकास और फील्डिंग में नैतिक एआई सिद्धांतों को लागू करने के प्रयास चल रहे हैं। संबंधित और पूर्व एआई नैतिकतावादियों की एक बढ़ती हुई टुकड़ी यह सुनिश्चित करने की कोशिश कर रही है कि एआई को विकसित करने और अपनाने के प्रयासों को ध्यान में रखते हुए एआई फॉर गुड और टालना एआई फॉर बैड. इसी तरह, प्रस्तावित नए एआई कानून हैं जिन्हें एआई के प्रयासों को मानव अधिकारों और इस तरह के हंगामे से बचाने के लिए संभावित समाधान के रूप में बांधा जा रहा है। एआई एथिक्स और एआई कानून के मेरे चल रहे और व्यापक कवरेज के लिए, देखें यहाँ लिंक और यहाँ लिंक, कुछ लोगों का नाम बताने के लिए।

आशा है कि समाज को एआई-प्रेरक जाल के असंख्य में गिरने से रोकने के लिए नैतिक एआई नियमों का विकास और प्रचार किया जा रहा है। यूनेस्को के प्रयासों के माध्यम से लगभग 200 देशों द्वारा तैयार और समर्थित यूएन एआई नैतिकता सिद्धांतों के मेरे कवरेज के लिए, देखें यहाँ लिंक. इसी तरह से, एआई को बराबरी पर रखने की कोशिश करने के लिए नए एआई कानूनों की खोज की जा रही है। नवीनतम में से एक में प्रस्तावित का एक सेट होता है एआई बिल ऑफ राइट्स कि अमेरिकी व्हाइट हाउस ने हाल ही में एआई के युग में मानवाधिकारों की पहचान करने के लिए जारी किया, देखें यहाँ लिंक. एआई और एआई डेवलपर्स को एक सही रास्ते पर रखने और समाज को कमजोर करने वाले उद्देश्यपूर्ण या आकस्मिक गुप्त प्रयासों को रोकने के लिए एक गांव की जरूरत होती है।

मैं इस चर्चा में एआई नैतिकता और एआई कानून से संबंधित विचारों को आपस में जोड़ूंगा।

जनरेटिव एआई के मूल तत्व

जेनेरेटिव एआई का सबसे व्यापक रूप से ज्ञात उदाहरण चैटजीपीटी नामक एआई ऐप द्वारा दर्शाया गया है। ChatGPT नवंबर में वापस सार्वजनिक चेतना में उछला जब इसे AI रिसर्च फर्म OpenAI द्वारा जारी किया गया। जब से चैटजीपीटी ने बड़े पैमाने पर सुर्खियां बटोरी हैं और आश्चर्यजनक रूप से इसके आवंटित पंद्रह मिनट की प्रसिद्धि को पार कर लिया है।

मुझे लगता है कि आपने शायद ChatGPT के बारे में सुना होगा या शायद किसी ऐसे व्यक्ति को जानते भी होंगे जिसने इसका इस्तेमाल किया हो।

ChatGPT को एक जनरेटिव AI एप्लिकेशन माना जाता है क्योंकि यह उपयोगकर्ता से कुछ टेक्स्ट इनपुट के रूप में लेता है और फिर उत्पन्न करता है या एक आउटपुट उत्पन्न करता है जिसमें एक निबंध होता है। एआई एक टेक्स्ट-टू-टेक्स्ट जनरेटर है, हालांकि मैं एआई को टेक्स्ट-टू-निबंध जनरेटर के रूप में वर्णित करता हूं क्योंकि यह अधिक आसानी से स्पष्ट करता है कि इसका आमतौर पर क्या उपयोग किया जाता है। आप लंबी रचनाओं की रचना करने के लिए जनरेटिव एआई का उपयोग कर सकते हैं या आप इसे छोटी सारगर्भित टिप्पणियों को प्राप्त करने के लिए प्राप्त कर सकते हैं। यह आपकी बोली पर है।

आपको बस इतना करना है कि एक संकेत दर्ज करें और एआई ऐप आपके लिए एक निबंध उत्पन्न करेगा जो आपके संकेत का जवाब देने का प्रयास करेगा। रचित पाठ ऐसा प्रतीत होगा मानो निबंध मानव हाथ और दिमाग द्वारा लिखा गया हो। यदि आप "अब्राहम लिंकन के बारे में मुझे बताएं" संकेत दर्ज करने के लिए थे, तो जेनेरेटिव AI आपको लिंकन के बारे में एक निबंध प्रदान करेगा। जेनेरेटिव एआई के अन्य तरीके हैं, जैसे टेक्स्ट-टू-आर्ट और टेक्स्ट-टू-वीडियो। मैं यहां टेक्स्ट-टू-टेक्स्ट भिन्नता पर ध्यान केंद्रित करूंगा।

आपका पहला विचार यह हो सकता है कि निबंध निर्माण के मामले में यह जनरेटिव क्षमता इतनी बड़ी बात नहीं लगती है। आप आसानी से इंटरनेट पर ऑनलाइन खोज कर सकते हैं और राष्ट्रपति लिंकन के बारे में टनों निबंध आसानी से खोज सकते हैं। जनरेटिव एआई के मामले में किकर यह है कि उत्पन्न निबंध अपेक्षाकृत अद्वितीय है और नकल के बजाय एक मूल रचना प्रदान करता है। यदि आप एआई-निर्मित निबंध को कहीं ऑनलाइन खोजने की कोशिश कर रहे थे, तो आपको इसे खोजने की संभावना नहीं होगी।

जनरेटिव एआई पूर्व-प्रशिक्षित है और एक जटिल गणितीय और कम्प्यूटेशनल सूत्रीकरण का उपयोग करता है जिसे पूरे वेब पर लिखित शब्दों और कहानियों में पैटर्न की जांच करके स्थापित किया गया है। हजारों और लाखों लिखित परिच्छेदों की जांच के परिणामस्वरूप, एआई नए निबंधों और कहानियों को उगल सकता है जो कि जो पाया गया था उसका एक मिश्मश है। विभिन्न संभाव्य कार्यक्षमताओं को जोड़कर, परिणामी पाठ प्रशिक्षण सेट में उपयोग किए गए पाठ की तुलना में बहुत अधिक अद्वितीय है।

जनरेटिव एआई के बारे में कई चिंताएँ हैं।

एक महत्वपूर्ण नकारात्मक पक्ष यह है कि एक जनरेटिव-आधारित एआई ऐप द्वारा निर्मित निबंधों में विभिन्न झूठ एम्बेड किए जा सकते हैं, जिसमें प्रकट रूप से असत्य तथ्य, भ्रामक रूप से चित्रित किए गए तथ्य और पूरी तरह से गढ़े गए स्पष्ट तथ्य शामिल हैं। उन मनगढ़ंत पहलुओं को अक्सर एक रूप के रूप में संदर्भित किया जाता है एआई मतिभ्रम, एक ऐसा मुहावरा जिसका मैं विरोध करता हूं लेकिन अफसोस के साथ वैसे भी लोकप्रिय हो रहा है (इस बारे में मेरे विस्तृत विवरण के लिए कि यह घटिया और अनुपयुक्त शब्दावली क्यों है, मेरी कवरेज यहां देखें) यहाँ लिंक).

एक और चिंता का विषय यह है कि मनुष्य स्वयं निबंध की रचना न करने के बावजूद एक जनरेटिव एआई-निर्मित निबंध का श्रेय आसानी से ले सकते हैं। आपने सुना होगा कि शिक्षक और स्कूल जनरेटिव एआई ऐप्स के उभरने को लेकर काफी चिंतित हैं। छात्र अपने असाइन किए गए निबंध लिखने के लिए संभावित रूप से जनरेटिव एआई का उपयोग कर सकते हैं। यदि कोई छात्र दावा करता है कि एक निबंध उनके हाथ से लिखा गया था, तो इस बात की बहुत कम संभावना है कि शिक्षक यह समझने में सक्षम हो कि क्या यह जनरेटिव एआई द्वारा बनाया गया था। इस छात्र और शिक्षक के भ्रमित करने वाले पहलू के मेरे विश्लेषण के लिए, मेरी कवरेज देखें यहाँ लिंक और यहाँ लिंक.

सोशल मीडिया पर इसके बारे में कुछ बौड़म बड़े-बड़े दावे किए गए हैं जनरेटिव एआई यह दावा करते हुए कि एआई का यह नवीनतम संस्करण वास्तव में है संवेदनशील एआई (नहीं, वे गलत हैं!)। एआई एथिक्स और एआई लॉ के लोग विशेष रूप से विस्तारित दावों की इस बढ़ती प्रवृत्ति के बारे में चिंतित हैं। आप विनम्रता से कह सकते हैं कि आज के एआई वास्तव में क्या कर सकते हैं, कुछ लोग अतिशयोक्ति कर रहे हैं। वे मानते हैं कि एआई में ऐसी क्षमताएं हैं जिन्हें हम अभी तक हासिल नहीं कर पाए हैं। वह दुर्भाग्यपूर्ण है। इससे भी बदतर, वे खुद को और दूसरों को इस धारणा के कारण गंभीर परिस्थितियों में जाने की अनुमति दे सकते हैं कि एआई कार्रवाई करने में सक्षम होने में संवेदनशील या मानवीय होगा।

एआई को एंथ्रोपोमोर्फाइज न करें।

ऐसा करने से आप एआई से उन चीजों को करने की उम्मीद करने के एक चिपचिपे और दुस्साहसी निर्भरता जाल में फंस जाएंगे जो वह प्रदर्शन करने में असमर्थ है। इसके साथ ही कहा जा रहा है, जेनेरेटिव एआई में नवीनतम यह क्या कर सकता है इसके लिए अपेक्षाकृत प्रभावशाली है। ध्यान रखें कि किसी भी जेनेरेटिव AI ऐप का उपयोग करते समय महत्वपूर्ण सीमाएँ हैं जिन्हें आपको लगातार ध्यान में रखना चाहिए।

अभी के लिए एक अंतिम पूर्व चेतावनी।

आप जो कुछ भी देखते या पढ़ते हैं वह एक सामान्य एआई प्रतिक्रिया में होता है लगता है विशुद्ध रूप से तथ्यात्मक (दिनांक, स्थान, लोग, आदि) के रूप में बताए जाने के लिए, सुनिश्चित करें कि आप संदेहपूर्ण बने रहें और जो आप देखते हैं उसे दोबारा जांचने के लिए तैयार रहें।

हां, तारीखें मनगढ़ंत हो सकती हैं, स्थान बनाए जा सकते हैं, और जिन तत्वों की हम आमतौर पर निंदा से ऊपर होने की उम्मीद करते हैं वे हैं सब संदेह के अधीन। आप जो पढ़ते हैं उस पर विश्वास न करें और किसी भी जनरेटिव एआई निबंध या आउटपुट की जांच करते समय संदेहपूर्ण नज़र रखें। यदि एक जनरेटिव एआई ऐप आपको बताता है कि अब्राहम लिंकन ने अपने निजी जेट में देश भर में उड़ान भरी, तो निस्संदेह आप जान जाएंगे कि यह कुरूपता है। दुर्भाग्य से, कुछ लोगों को यह एहसास नहीं हो सकता है कि जेट उनके समय में नहीं थे, या वे जानते होंगे लेकिन यह ध्यान देने में विफल रहे कि निबंध इस बेशर्म और अपमानजनक रूप से झूठे दावे करता है।

स्वस्थ संशयवाद की एक मजबूत खुराक और अविश्वास की एक सतत मानसिकता जनरेटिव एआई का उपयोग करते समय आपकी सबसे अच्छी संपत्ति होगी।

हम इस स्पष्टीकरण के अगले चरण में जाने के लिए तैयार हैं।

इसमें इंटरनेट और जनरेटिव एआई एक साथ हैं

अब जब आपको पता चल गया है कि जनरेटिव एआई क्या है, तो हम इस सवाल का पता लगा सकते हैं कि क्या जेनेरेटिव एआई उचित या गलत तरीके से "लीवरेजिंग" है, या कुछ कहेंगे दो टूक शोषण इंटरनेट सामग्री।

इस मामले से संबंधित मेरे चार महत्वपूर्ण विषय इस प्रकार हैं:

  • 1) दोहरी परेशानी: साहित्यिक चोरी और कॉपीराइट उल्लंघन
  • 2) साहित्यिक चोरी या कॉपीराइट उल्लंघन साबित करने की कोशिश की जाएगी
  • 3) साहित्यिक चोरी या कॉपीराइट उल्लंघन का मामला बनाना
  • 4) कानूनी बारूदी सुरंगों का इंतजार

मैं इनमें से प्रत्येक महत्वपूर्ण विषय को कवर करूंगा और व्यावहारिक विचार प्रदान करूंगा, जिस पर हम सभी को ध्यान से विचार करना चाहिए। इनमें से प्रत्येक विषय एक बड़ी पहेली का एक अभिन्न अंग है। आप सिर्फ एक टुकड़े को नहीं देख सकते। न ही आप किसी टुकड़े को दूसरे टुकड़ों से अलग करके देख सकते हैं।

यह एक जटिल पच्चीकारी है और पूरी पहेली को उचित सामंजस्यपूर्ण विचार दिया जाना है।

दोहरी परेशानी: साहित्यिक चोरी और कॉपीराइट उल्लंघन

जेनेरेटिव एआई बनाने और पेश करने वालों के सामने दोहरी समस्या यह है कि उनके माल दो बुरे काम कर सकते हैं:

  • 1) साहित्यिक चोरी। जनरेटिव एआई को इस रूप में समझा जा सकता है plagiarizing एआई के डेटा प्रशिक्षण के दौरान हुई इंटरनेट स्कैनिंग के अनुसार इंटरनेट पर मौजूद सामग्री।
  • 2) कॉपीराइट उल्लंघन। जनरेटिव एआई को उपक्रम के रूप में दावा किया जा सकता है कॉपीराइट का उल्लंघन डेटा प्रशिक्षण के दौरान स्कैन की गई इंटरनेट सामग्री से संबद्ध।

स्पष्ट करने के लिए, जेनेरेटिव एआई के डेटा प्रशिक्षण के लिए वास्तव में आमतौर पर स्कैन की जाने वाली सामग्री की तुलना में इंटरनेट पर बहुत अधिक सामग्री है। आमतौर पर इंटरनेट का केवल एक छोटा सा अंश ही नियोजित होता है। इस प्रकार, हम संभवतः यह मान सकते हैं कि कोई भी सामग्री जो डेटा प्रशिक्षण के दौरान स्कैन नहीं की गई थी, उसमें जेनेरेटिव एआई के साथ कोई विशेष गोमांस नहीं है।

यह कुछ हद तक विवादास्पद है, हालांकि आप संभावित रूप से एक ऐसी रेखा खींच सकते हैं जो स्कैन की गई सामग्री के साथ स्कैन की गई अन्य सामग्री को जोड़ती है। इसके अलावा, एक और महत्वपूर्ण प्रावधान यह है कि भले ही ऐसी सामग्री है जिसे स्कैन नहीं किया गया था, फिर भी यह तर्क दिया जा सकता है कि जनरेटिव एआई परचांस भूमि के समान वर्बेज पर होने पर साहित्यिक चोरी और/या कॉपीराइट का उल्लंघन किया गया है। मेरा कहना यह है कि इन सब में बहुत घिनौनापन है।

नीचे पंक्ति: जब साहित्यिक चोरी और कॉपीराइट उल्लंघन की बात आती है तो जनरेटिव एआई संभावित एआई एथिकल और एआई कानून कानूनी पहेलियों से भरा होता है प्रचलित डेटा प्रशिक्षण प्रथाओं को रेखांकित करना।

अब तक, एआई निर्माताओं और एआई शोधकर्ताओं ने उनके ऊपर लटकी हुई खतरनाक और खतरनाक रूप से लटकती तलवार के बावजूद, इस बहुत अधिक स्कॉच-फ्री के माध्यम से स्केटिंग की है। इन प्रथाओं के खिलाफ आज तक केवल कुछ मुकदमे शुरू किए गए हैं। आपने ऐसी कानूनी कार्रवाइयों के बारे में समाचारों में सुना या देखा होगा। एक, उदाहरण के लिए, इंटरनेट पर पोस्ट की गई कलात्मक सामग्री के उल्लंघन के लिए मिडजर्नी और स्थिरता एआई की टेक्स्ट-टू-इमेज फर्म शामिल हैं। एक अन्य में गिटहब, माइक्रोसॉफ्ट और ओपनएआई के खिलाफ टेक्स्ट-टू-कोड उल्लंघन शामिल है, क्योंकि कोपिलॉट सॉफ्टवेयर एआई ऐप्स का उत्पादन करता है। टेक्स्ट-टू-इमेज उल्लंघन के लिए गेटी इमेजेज भी स्थिरता एआई के बाद जाने का लक्ष्य बना रही है।

आप अनुमान लगा सकते हैं कि इस तरह के और मुकदमे दायर होने वाले हैं।

अभी, उन मुकदमों को शुरू करने की थोड़ी संभावना है क्योंकि परिणाम अपेक्षाकृत अज्ञात है। क्या अदालत एआई निर्माताओं के साथ होगी या जो लोग मानते हैं कि उनकी सामग्री का गलत तरीके से शोषण किया गया था, वे विजेता होंगे? एक महंगी कानूनी लड़ाई हमेशा एक गंभीर मामला होता है। जीतने या हारने की संभावनाओं के खिलाफ बड़े पैमाने पर कानूनी लागतों को खर्च करना पड़ता है।

ऐसा प्रतीत होता है कि एआई निर्माताओं के पास लड़ाई लड़ने के अलावा कोई विकल्प नहीं है। यदि वे थोड़ा भी झुक जाते हैं, तो संभावना यह है कि अतिरिक्त मुकदमों की एक धारा का परिणाम होगा (अनिवार्य रूप से, दूसरों के प्रबल होने की संभावना के लिए द्वार खोलना)। एक बार पानी में कानूनी खून होने के बाद, शेष कानूनी शार्क "आसान स्कोर" माना जाएगा और एक जोरदार और पिटाई करने वाला मौद्रिक रक्तपात निश्चित रूप से घटित होगा।

कुछ का मानना ​​है कि हमें एआई निर्माताओं की रक्षा करने वाले नए एआई कानून पारित करने चाहिए। संरक्षण पूर्वव्यापी भी हो सकता है। इसका आधार यह है कि अगर हम जनरेटिव एआई की प्रगति देखना चाहते हैं, तो हमें एआई निर्माताओं को कुछ सुरक्षित क्षेत्र रनवे देना होगा। एक बार एआई निर्माताओं के खिलाफ मुकदमे जीतना शुरू हो जाते हैं, अगर ऐसा होता है (हम अभी तक नहीं जानते हैं), तो चिंता यह है कि जेनेरेटिव एआई वाष्पित हो जाएगा क्योंकि कोई भी एआई फर्मों को कोई समर्थन देने को तैयार नहीं होगा।

जैसा कि डॉ. इलिया कोलोचेंको और गॉर्डन प्लैट, ब्लूमबर्ग लॉ, फरवरी 2023 द्वारा "चैटजीपीटी: आईपी, साइबर सुरक्षा और जनरेटिव एआई के अन्य कानूनी जोखिम" शीर्षक वाले हाल ही के ब्लूमबर्ग लॉ पीस में कुशलता से बताया गया है, यहां इन दृष्टिकोणों को प्रतिध्वनित करने वाले दो महत्वपूर्ण अंश हैं:

  • "अमेरिकी कानूनी विद्वानों और आईपी कानून के प्रोफेसरों के बीच एक गरमागरम बहस छिड़ गई है कि क्या अनधिकृत स्क्रैपिंग और बाद में कॉपीराइट डेटा राशि का उपयोग कॉपीराइट उल्लंघन है। यदि इस तरह के अभ्यास में कॉपीराइट उल्लंघन देखने वाले कानूनी चिकित्सकों का विचार प्रबल होता है, तो ऐसे AI सिस्टम के उपयोगकर्ता भी द्वितीयक उल्लंघन के लिए उत्तरदायी हो सकते हैं और संभावित रूप से कानूनी प्रभाव का सामना कर सकते हैं।
  • "चुनौती को व्यापक रूप से संबोधित करने के लिए, सांसदों को न केवल मौजूदा कॉपीराइट कानून का आधुनिकीकरण करने पर विचार करना चाहिए, बल्कि एआई-विशिष्ट कानूनों और विनियमों के एक सेट को भी लागू करना चाहिए।"

याद रखें कि एक समाज के रूप में हमने कानूनी सुरक्षा प्रदान की है विस्तार इंटरनेट का, जैसा कि अब सुप्रीम कोर्ट ने प्रसिद्ध या बदनाम धारा 230 की समीक्षा की है। इस प्रकार, यह कारण और मिसाल के तौर पर लगता है कि हम जनरेटिव एआई की उन्नति के लिए कुछ समान सुरक्षा करने के लिए तैयार हो सकते हैं। शायद सुरक्षा को अस्थायी रूप से स्थापित किया जा सकता है, जनरेटिव एआई के प्रवीणता के कुछ पूर्व-निर्धारित स्तर तक पहुंचने के बाद समाप्त हो रहा है। अन्य सुरक्षा प्रावधानों को तैयार किया जा सकता है।

मैं जल्द ही अपने विश्लेषण को पोस्ट करूंगा कि कैसे सुप्रीम कोर्ट का आकलन और धारा 230 पर अंतिम फैसला जेनेरेटिव एआई के आगमन को प्रभावित कर सकता है। उस आगामी पोस्टिंग की तलाश में रहें!

तीखी आवाज वाली राय पर वापस जाएं कि हमें सामाजिक विस्मयकारी तकनीकी नवाचार के लिए जनरेटिव एआई के रूप में जाना चाहिए। कुछ लोग कहेंगे कि भले ही कॉपीराइट उल्लंघन का दावा किया गया हो या हो रहा हो, समग्र रूप से समाज को जनरेटिव एआई को आगे बढ़ाने के विशिष्ट उद्देश्यों के लिए इसकी अनुमति देने के लिए तैयार रहना चाहिए।

उम्मीद है कि नए एआई कानूनों को सावधानी से तैयार किया जाएगा और जेनेरेटिव एआई के लिए डेटा प्रशिक्षण से जुड़े विवरणों को ध्यान से तैयार किया जाएगा।

इस उद्देश्य के लिए नए AI कानूनों को तैयार करने की इस धारणा के बहुत सारे प्रतिवाद हैं। एक चिंता यह है कि इस तरह का कोई भी नया एआई कानून सभी तरह के कॉपीराइट उल्लंघन के लिए दरवाजे खोल देगा। हमें उस दिन अफ़सोस होगा जब हमने ऐसे नए एआई कानूनों को किताबों पर उतरने दिया। कोई फर्क नहीं पड़ता कि आप इसे केवल एआई डेटा प्रशिक्षण तक सीमित करने की कितनी कोशिश करते हैं, अन्य चुपके से या चतुराई से खामियों को खोज लेंगे जो कि अनियंत्रित और बड़े पैमाने पर कॉपीराइट उल्लंघन की राशि होगी।

गोल-गोल तर्क चलते हैं।

एक तर्क जो विशेष रूप से पानी नहीं पकड़ता है वह एआई पर मुकदमा करने की कोशिश कर रहा है। ध्यान दें कि मैं एआई निर्माता या एआई शोधकर्ताओं को अपराधी हितधारकों के रूप में संदर्भित कर रहा हूं। ये लोग और कंपनियां हैं। कुछ का सुझाव है कि हमें एआई को लक्षित करना चाहिए क्योंकि पार्टी पर मुकदमा चलाया जाना चाहिए। मैंने अपने कॉलम में विस्तार से चर्चा की है कि हम अभी तक एआई को कानूनी व्यक्तित्व का श्रेय नहीं देते हैं, देखें यहाँ लिंक उदाहरण के लिए, और इस प्रकार एआई प्रति से लक्षित ऐसे मुकदमों को अभी संवेदनहीन माना जाएगा।

किस पर या किस पर मुकदमा किया जाना चाहिए, इस सवाल के परिशिष्ट के रूप में, यह एक और रसदार विषय लाता है।

मान लें कि एक विशेष जनरेटिव एआई ऐप कुछ एआई निर्माता द्वारा तैयार किया गया है जिसे हम विजेट कंपनी कहेंगे। विजेट कंपनी आकार में अपेक्षाकृत छोटी है और उसके पास न तो अधिक राजस्व है, न ही संपत्ति के रूप में बहुत कुछ है। उन पर मुकदमा करने से उस भव्य धन की संभावना नहीं है, जिसकी तलाश की जा सकती है। अधिक से अधिक, आपको केवल उस चीज़ को ठीक करने का संतोष होगा जिसे आप गलत समझते हैं।

आप बड़ी मछली के पीछे जाना चाहते हैं।

यहाँ बताया गया है कि यह कैसे उत्पन्न होने वाला है। एक एआई निर्माता अपनी जनरेटिव एआई को बिग टाइम कंपनी को उपलब्ध कराने का विकल्प चुनता है, जो टन आटा और टन संपत्ति के साथ एक प्रमुख समूह है। विजेट कंपनी का नाम देने वाला एक मुकदमा अब दृष्टि में एक बेहतर लक्ष्य होगा, अर्थात् बिग टाइम कंपनी का नामकरण भी। यह डेविड और गोलियथ की लड़ाई है जिसे वकील पसंद करेंगे। बेशक, बिग टाइम कंपनी निस्संदेह मछली पकड़ने के हुक को बंद करने की कोशिश करेगी। वे ऐसा कर सकते हैं या नहीं यह एक बार फिर एक कानूनी सवाल है जो अनिश्चित है, और वे निराशाजनक रूप से कीचड़ में फंस सकते हैं।

इससे पहले कि हम इस पर और आगे बढ़ें, मैं डेटा प्रशिक्षण के कारण जनरेटिव एआई के विवादित अतिक्रमणों के बारे में तालिका में कुछ महत्वपूर्ण प्राप्त करना चाहता हूं। मुझे यकीन है कि आप सहज रूप से महसूस करते हैं कि साहित्यिक चोरी और कॉपीराइट उल्लंघन दो अलग-अलग जानवर हैं। उनके पास बहुत कुछ समान है, हालांकि वे काफी भिन्न भी हैं।

यहाँ ड्यूक विश्वविद्यालय से एक संक्षिप्त संक्षिप्त विवरण दिया गया है जो दोनों की व्याख्या करता है:

  • "साहित्यिक चोरी को किसी अन्य व्यक्ति के काम के अनजाने उपयोग के रूप में परिभाषित किया गया है। यह एक नैतिक मुद्दा है जिसमें काम के लिए क्रेडिट का दावा शामिल है जिसे दावेदार ने नहीं बनाया। उस काम की कॉपीराइट स्थिति की परवाह किए बिना कोई भी किसी और के काम की नकल कर सकता है। उदाहरण के लिए, फिर भी किसी पुस्तक या लेख से नकल करना साहित्यिक चोरी है जो अभी भी कॉपीराइट के अधीन होने के लिए बहुत पुराना है। किसी अनजाने स्रोत से लिए गए डेटा का उपयोग करना भी साहित्यिक चोरी है, भले ही डेटा जैसी तथ्यात्मक सामग्री कॉपीराइट द्वारा संरक्षित न हो। साहित्यिक चोरी, हालांकि, आसानी से ठीक हो जाती है - सामग्री के मूल स्रोत के लिए उचित उद्धरण।"
  • "कॉपीराइट उल्लंघन, दूसरी ओर, दूसरे के काम का अनधिकृत उपयोग है। यह एक कानूनी मुद्दा है जो इस बात पर निर्भर करता है कि काम सर्वप्रथम कॉपीराइट द्वारा सुरक्षित है या नहीं, साथ ही यह भी कि कितना उपयोग किया गया है और उपयोग का उद्देश्य क्या है। यदि कोई संरक्षित कार्य की बहुत अधिक प्रतिलिपि बनाता है, या किसी अनधिकृत उद्देश्य के लिए प्रतिलिपि बनाता है, तो केवल मूल स्रोत को स्वीकार करने से समस्या का समाधान नहीं होगा। केवल कॉपीराइट धारक से पूर्व अनुमति लेने से उल्लंघन के आरोप के जोखिम से बचा जा सकता है।

मैं इन दो चिंताओं के महत्व को इंगित करता हूं ताकि आप महसूस कर सकें कि उपचार तदनुसार भिन्न हो सकते हैं। इसके अलावा, वे दोनों एआई एथिक्स और एआई कानून में व्याप्त विचारों में उलझे हुए हैं, जिससे उन्हें जांच के लिए समान रूप से उपयोगी बना दिया गया है।

आइए एक दावा किए गए उपाय या समाधान का पता लगाएं। आप देखेंगे कि यह दोहरी समस्या वाले मुद्दों में से एक में मदद कर सकता है, लेकिन दूसरे में नहीं।

कुछ ने जोर देकर कहा है कि सभी एआई निर्माताओं को अपने स्रोतों का हवाला देना है। जब जनरेटिव एआई एक निबंध तैयार करता है, तो निबंध में जो कुछ भी कहा गया है, उसके लिए केवल विशिष्ट उद्धरण शामिल करें। विभिन्न URL और अन्य संकेत दें जिनमें इंटरनेट सामग्री का उपयोग किया गया था। ऐसा लगता है कि यह उन्हें साहित्यिक चोरी के बारे में चिंता से मुक्त करता है। आउटपुट निबंध संभवतः स्पष्ट रूप से पहचान करेगा कि उत्पादित किए जा रहे शब्दों के लिए किन स्रोतों का उपयोग किया गया था।

उस दावा किए गए समाधान में कुछ क्विबल्स हैं, लेकिन 30,000 फुट के स्तर पर मान लें कि यह साहित्यिक चोरी की दुविधा के लिए एक अर्ध-संतोषजनक इलाज के रूप में काम करता है। जैसा कि कॉपीराइट उल्लंघन की व्याख्या में ऊपर कहा गया है, स्रोत सामग्री का हवाला देना जरूरी नहीं है कि आप डॉगहाउस से बाहर निकल जाएं। यह मानते हुए कि सामग्री कॉपीराइट थी, और अन्य कारकों पर निर्भर करता है जैसे कि सामग्री का कितना उपयोग किया गया था, कॉपीराइट उल्लंघन की प्रतीक्षारत तलवार तेजी से और अंतिम रूप से नीचे आ सकती है।

दोहरी मुसीबत यहाँ नारा है।

साहित्यिक चोरी या कॉपीराइट उल्लंघन साबित करने की कोशिश कोशिश होगी

इसे साबित करो!

यह पुरानी कहावत है जिसे हम सभी ने अपने जीवन में कई बार सुना है।

आपको पता है कि यह कैसे होता है। आप दावा कर सकते हैं कि कुछ हो रहा है या हो चुका है। आप अपने दिल के दिल में जान सकते हैं कि यह हुआ है। लेकिन जब धक्का-मुक्की की बात आती है, तो आपके पास सबूत होना चाहिए।

आज की भाषा में आपको दिखाने की जरूरत है प्राप्तियों, वे कहते हैं।

आपके लिए मेरा प्रश्न यह है: हम कैसे स्पष्ट रूप से साबित करने जा रहे हैं कि जेनेरेटिव एआई ने अनुचित तरीके से इंटरनेट सामग्री का दोहन किया है?

एक का मानना ​​है कि उत्तर आसान होना चाहिए। आप आउटपुटेड निबंध तैयार करने के लिए जनरेटिव एआई से पूछते हैं या बताते हैं। फिर आप निबंध लें और उसकी तुलना इंटरनेट पर उपलब्ध सामग्री से करें। यदि आप निबंध पाते हैं, तो बाम, आपने जनरेटिव एआई को लौकिक दीवार पर कील से ठोंक दिया है।

जीवन इतना आसान कभी नहीं लगता।

कल्पना करें कि हमें लगभग 100 शब्दों वाले एक निबंध को तैयार करने के लिए जेनेरेटिव AI मिलता है। हम चारों ओर घूमते हैं और उन 100 शब्दों को खोजते हुए इंटरनेट के सभी नुक्कड़ और कोनों तक पहुँचने का प्रयास करते हैं। यदि हम 100 शब्दों को एक ही सटीक क्रम और एक समान फैशन में दिखाते हैं, तो ऐसा लगता है कि हमने खुद को एक गर्म पकड़ा है।

मान लीजिए कि हम इंटरनेट पर एक "तुलनीय" निबंध पाते हैं, हालांकि यह 80 शब्दों में से केवल 100 से मेल खाता है। यह अभी भी पर्याप्त लगता है, शायद। लेकिन कल्पना कीजिए कि हमें 10 में से केवल 100 शब्दों का एक उदाहरण मिलता है जो मेल खाता है। क्या यह शोर मचाने के लिए पर्याप्त है कि या तो साहित्यिक चोरी हुई है या कॉपीराइट का उल्लंघन हुआ है?

भूरापन मौजूद है।

पाठ उस तरह से मज़ेदार है।

इसकी तुलना टेक्स्ट-टू-इमेज या टेक्स्ट-टू-आर्ट परिस्थितियों से करें। जब जनरेटिव एआई टेक्स्ट-टू-इमेज या टेक्स्ट-टू-आर्ट क्षमता प्रदान करता है, तो आप एक टेक्स्ट प्रॉम्प्ट दर्ज करते हैं और एआई ऐप आपके द्वारा प्रदान किए गए प्रॉम्प्ट पर कुछ हद तक एक इमेज तैयार करता है। छवि इस या किसी अन्य ग्रह पर देखी गई किसी भी छवि के विपरीत हो सकती है।

दूसरी ओर, छवि अन्य छवियों की याद दिला सकती है जो मौजूद हैं। हम जनरेटिव एआई-निर्मित छवि को देख सकते हैं और कुछ हद तक आंत वृत्ति से कह सकते हैं कि यह निश्चित रूप से किसी अन्य छवि की तरह दिखता है जिसे हमने पहले देखा है। आम तौर पर, दृश्य तुलना और कंट्रास्ट के पहलुओं को थोड़ा और आसानी से किया जाता है। कहा जा रहा है, कृपया जान लें कि बड़ी कानूनी बहसें इस बात को सुनिश्चित करती हैं कि एक छवि से दूसरी छवि का ओवरलैप या प्रतिकृति क्या है।

इसी तरह की एक और स्थिति संगीत के साथ मौजूद है। जेनेरेटिव एआई ऐप हैं जो आपको टेक्स्ट प्रॉम्प्ट दर्ज करने की अनुमति देते हैं और एआई द्वारा उत्पादित आउटपुट ऑडियो संगीत है। ये टेक्स्ट-टू-ऑडियो या टेक्स्ट-टू-म्यूजिक AI क्षमताएं अभी उभरने लगी हैं। एक चीज जिस पर आप अपना शीर्ष डॉलर दांव पर लगा सकते हैं, वह यह है कि जेनेरेटिव एआई द्वारा निर्मित संगीत की उल्लंघन के लिए अत्यधिक छानबीन की जाएगी। जब हम संगीत उल्लंघन सुनते हैं तो हमें पता लगता है, हालांकि फिर से यह एक जटिल कानूनी मुद्दा है जो केवल इस बात पर आधारित नहीं है कि हम कथित प्रतिकृति के बारे में कैसा महसूस करते हैं।

मुझे एक और उदाहरण दें।

टेक्स्ट-टू-कोड जनरेटिव एआई आपको टेक्स्ट प्रॉम्प्ट दर्ज करने की क्षमता प्रदान करता है और एआई आपके लिए प्रोग्रामिंग कोड तैयार करेगा। फिर आप इस कोड का उपयोग कंप्यूटर प्रोग्राम तैयार करने के लिए कर सकते हैं। आप कोड का ठीक उसी तरह उपयोग कर सकते हैं जैसा उत्पन्न किया गया है, या आप अपनी आवश्यकताओं के अनुरूप कोड को संपादित और समायोजित करने का विकल्प चुन सकते हैं। यह सुनिश्चित करने की भी आवश्यकता है कि कोड उपयुक्त और व्यावहारिक है क्योंकि यह संभव है कि उत्पन्न कोड में त्रुटियां और झूठ उत्पन्न हो सकते हैं।

आपकी पहली धारणा यह हो सकती है कि प्रोग्रामिंग कोड टेक्स्ट से अलग नहीं है। यह सिर्फ टेक्स्ट है। ज़रूर, यह एक ऐसा पाठ है जो एक विशेष उद्देश्य प्रदान करता है, लेकिन यह अभी भी पाठ है।

ठीक है, बिल्कुल नहीं। अधिकांश प्रोग्रामिंग भाषाओं में उस भाषा के कोडिंग स्टेटमेंट की प्रकृति के लिए एक सख्त प्रारूप और संरचना होती है। यह एक अर्थ में मुक्त प्रवाह वाली प्राकृतिक भाषा की तुलना में बहुत अधिक संकीर्ण है। आप कुछ हद तक बॉक्सिंग कर रहे हैं कि कोडिंग स्टेटमेंट कैसे तैयार किए जाते हैं। इसी तरह, जिस क्रम और तरीके से बयानों का उपयोग किया जाता है और उन्हें कुछ हद तक बॉक्सिंग किया जाता है।

कुल मिलाकर, यह दिखाने की संभावना कि प्रोग्रामिंग कोड को साहित्यिक चोरी या उल्लंघन किया गया था, प्राकृतिक भाषा की तुलना में लगभग आसान है। इस प्रकार, जब एक जनरेटिव एआई इंटरनेट पर प्रोग्रामिंग कोड को स्कैन करने के लिए जाता है और बाद में प्रोग्रामिंग कोड उत्पन्न करता है, तो यह तर्क देने की संभावना है कि कोड को स्पष्ट रूप से दोहराया गया था, अपेक्षाकृत अधिक आश्वस्त होने वाला है। स्लैम डंक नहीं, इसलिए इस पर कड़वी लड़ाइयों की अपेक्षा करें।

मेरा अति महत्वपूर्ण बिंदु यह है कि हमारे पास एक ही एआई नैतिकता और एआई कानून के मुद्दे होंगे जो एआई के सभी प्रकारों का सामना कर रहे हैं।

साहित्यिक चोरी और कॉपीराइट उल्लंघन के लिए समस्या होगी:

  • टेक्स्ट-टू-टेक्स्ट या टेक्स्ट-टू-निबंध
  • टेक्स्ट-टू-इमेज या टेक्स्ट-टू-आर्ट
  • टेक्स्ट-टू-ऑडियो या टेक्स्ट-टू-म्यूजिक
  • पाठ से वीडियो
  • टेक्स्ट-टू-कोड
  • आदि

वे सभी समान चिंताओं के अधीन हैं। कुछ को दूसरों की तुलना में "साबित" करना थोड़ा आसान हो सकता है। उन सभी के पास एआई एथिक्स और एआई लॉ ग्राउंडिंग के अपने-अपने तरह के बुरे सपने आने वाले हैं।

साहित्यिक चोरी या कॉपीराइट उल्लंघन का मामला बनाना

चर्चा के उद्देश्यों के लिए, आइए टेक्स्ट-टू-टेक्स्ट या टेक्स्ट-टू-निबंध जनरेटिव AI पर ध्यान दें। मैं आंशिक रूप से ChatGPT की जबरदस्त लोकप्रियता के कारण ऐसा करता हूं, जो कि जेनरेटिव AI का टेक्स्ट-टू-टेक्स्ट प्रकार है। चैटजीपीटी का उपयोग करने वाले बहुत से लोग हैं, साथ ही कई अन्य समान टेक्स्ट-टू-टेक्स्ट जेनरेटिव एआई ऐप्स का उपयोग कर रहे हैं।

क्या वे लोग जो जेनेरेटिव एआई ऐप्स का उपयोग कर रहे हैं, जानते हैं कि वे संभावित रूप से साहित्यिक चोरी या कॉपीराइट उल्लंघन पर भरोसा कर रहे हैं?

ऐसा करना संदिग्ध लगता है।

मैं यह कहने की हिम्मत करूंगा कि प्रचलित धारणा यह है कि यदि जेनेरेटिव एआई ऐप उपयोग के लिए उपलब्ध है, तो एआई निर्माता या कंपनी जिसने एआई को मैदान में उतारा है, उसे पता होना चाहिए या आश्वस्त होना चाहिए कि वे जिन सामानों का उपयोग करने की पेशकश कर रहे हैं, उनके बारे में कुछ भी अनहोनी नहीं है। यदि आप इसका उपयोग कर सकते हैं, तो यह ऊपर होना चाहिए।

आइए मेरी पिछली टिप्पणी पर फिर से विचार करें कि हम कैसे प्रयास करने जा रहे हैं और यह साबित करने जा रहे हैं कि एक विशेष जनरेटिव एआई गलत तरीके से डेटा प्रशिक्षण के आधार पर काम कर रहा है।

मैं यह भी जोड़ सकता हूं कि अगर हम ऐसा करते हुए एक जेनेरेटिव एआई को पकड़ सकते हैं, तो दूसरों को पकड़ने की संभावना बढ़ सकती है। मैं यह नहीं कह रहा हूं कि सभी जेनेरेटिव एआई ऐप्स एक ही नाव में होंगे। लेकिन जब उनमें से एक को दीवार से चिपका दिया जाएगा तो वे खुद को कठोर समुद्र में पाएंगे।

इसलिए भी मौजूदा मुकदमों पर नजर रखना बेहद फायदेमंद होगा। पहला व्यक्ति जो दावा किए गए उल्लंघन के रूप में जीतता है, यदि ऐसा होता है, तो संभवतः अन्य जनरेटिव एआई ऐप्स के लिए कयामत और निराशा होगी, जब तक कि कुछ संकीर्णता हाथ में व्यापक मुद्दों से बच नहीं जाती। जो लोग दावा किए गए उल्लंघन के रूप में हार जाते हैं, उनका मतलब यह नहीं है कि जनरेटिव एआई ऐप घंटी बजा सकते हैं और जश्न मना सकते हैं। यह हो सकता है कि नुकसान अन्य कारकों को जिम्मेदार ठहराया जाता है जो अन्य जनरेटिव एआई ऐप्स के लिए प्रासंगिक नहीं हैं, और इसी तरह।

मैंने उल्लेख किया था कि यदि हम 100 शब्दों का निबंध लेते हैं और इंटरनेट पर ठीक उसी क्रम में उन सटीक शब्दों को खोजने का प्रयास करते हैं, तो हमारे पास साहित्यिक चोरी या कॉपीराइट उल्लंघन के लिए अपेक्षाकृत ठोस मामला हो सकता है, बाकी सभी समान हैं। लेकिन यदि मेल खाने वाले शब्दों की संख्या कम है, तो ऐसा लगेगा कि हम मुश्किल में हैं।

मैं उसमें और गहराई तक जाना चाहता हूं।

तुलना करने का एक स्पष्ट पहलू ठीक उसी क्रम में ठीक वही शब्द होते हैं। यह पूरे मार्ग के लिए हो सकता है। यह पता लगाना सुविधाजनक होगा, लगभग हमें चांदी की थाली में सौंपे जाने जैसा।

यदि शब्दों का केवल एक टुकड़ा मेल खाता है तो हमें भी संदेह हो सकता है। विचार यह देखने के लिए होगा कि क्या वे महत्वपूर्ण शब्द हैं या शायद भरने वाले शब्द हैं जिन्हें हम आसानी से हटा सकते हैं या अनदेखा कर सकते हैं। हम यह भी नहीं चाहते कि उनके भूतकाल या भविष्यकाल के शब्दों के प्रयोग से, या किसी अन्य मूर्खता से धोखा खाया जाए। शब्दों में उन भिन्नताओं पर भी विचार किया जाना चाहिए।

तुलना का एक अन्य स्तर तब होगा जब शब्द विशेष रूप से एक ही शब्द नहीं हैं, फिर भी एक भिन्न अवस्था में भी शब्द समान बिंदु बनाते हुए प्रतीत होते हैं। उदाहरण के लिए, एक सारांश अक्सर मूल स्रोत के रूप में काफी समान शब्दों का उपयोग करेगा, लेकिन हम समझ सकते हैं कि सारांश मूल स्रोत पर आधारित लगता है।

तुलना का सबसे कठिन स्तर अवधारणाओं या विचारों पर आधारित होगा। मान लीजिए कि हम एक निबंध देखते हैं जिसमें तुलना आधार के रूप में समान या समान शब्द नहीं हैं, लेकिन सार या विचार समान हैं। हम बेशक किसी न किसी क्षेत्र में बढ़ रहे हैं। यदि हम सहजता से यह कहें कि विचारों की बारीकी से रक्षा की जाती है, तो हम लगभग सभी प्रकार के ज्ञान और ज्ञान वृद्धि पर एक ढक्कन लगा देंगे।

हम एक बार फिर ड्यूक विश्वविद्यालय से एक आसान व्याख्या का उल्लेख कर सकते हैं:

  • "कॉपीराइट विचारों की रक्षा नहीं करता है, केवल एक विचार की विशिष्ट अभिव्यक्ति है। उदाहरण के लिए, एक अदालत ने फैसला किया कि जब डैन ब्राउन ने लिखा था तो उन्होंने पहले की किताब के कॉपीराइट का उल्लंघन नहीं किया था दा विंची कोड क्योंकि उसने पहले के काम से जो कुछ उधार लिया था, वह मूल विचार थे, न कि कथानक या संवाद की बारीकियाँ। चूंकि कॉपीराइट का उद्देश्य रचनात्मक उत्पादन को प्रोत्साहित करना है, किसी नए और मूल कार्य को तैयार करने के लिए किसी और के विचारों का उपयोग करना कॉपीराइट के उद्देश्य को पूरा करता है, यह इसका उल्लंघन नहीं करता है। केवल अगर कोई अनुमति के बिना दूसरे की अभिव्यक्ति की नकल करता है तो कॉपीराइट का संभावित रूप से उल्लंघन होता है।
  • "साहित्यिक चोरी से बचने के लिए, दूसरी ओर, किसी को उन विचारों के स्रोत को भी स्वीकार करना चाहिए जो किसी और से उधार लिए गए हैं, भले ही उन विचारों की अभिव्यक्ति उनके साथ उधार ली गई हो। इस प्रकार, एक व्याख्या के लिए उद्धरण की आवश्यकता होती है, भले ही यह शायद ही कभी कोई कॉपीराइट समस्या उठाती हो।

कृपया ध्यान दें कि जैसा कि पहले डबल ट्रबल पहलुओं के बीच अंतरों की पहचान की गई थी।

अब तो, तुलना के तरीकों को व्यवहार में लाना कुछ ऐसा है जो कई वर्षों से हो रहा है। इस पर इस तरीके से विचार करें। जो छात्र अपने स्कूल के काम के लिए निबंध लिखते हैं, उन्हें इंटरनेट से सामग्री प्राप्त करने और ए-ग्रेड पुलित्जर पुरस्कार विजेता शब्द लिखने का नाटक करने का लालच हो सकता है।

इससे निपटने के लिए शिक्षक लंबे समय से साहित्यिक चोरी-जांच कार्यक्रमों का उपयोग कर रहे हैं। एक शिक्षक एक छात्र का निबंध लेता है और उसे साहित्यिक चोरी चेकर को खिलाता है। कुछ मामलों में, एक पूरा स्कूल साहित्यिक चोरी-जाँच कार्यक्रम के उपयोग का लाइसेंस देगा। जब भी छात्र किसी निबंध को प्रस्तुत कर रहे हों, तो उन्हें सबसे पहले निबंध को साहित्यिक चोरी जाँच कार्यक्रम में भेजना होगा। शिक्षक को सूचित किया जाता है कि कार्यक्रम क्या रिपोर्ट करता है।

दुर्भाग्य से, आपको इन साहित्यिक चोरी-जांच कार्यक्रमों के बारे में बेहद सतर्क रहना होगा। रिपोर्ट किए गए संकेत मान्य हैं या नहीं, इसका सावधानीपूर्वक मूल्यांकन करना महत्वपूर्ण है। जैसा कि पहले ही उल्लेख किया गया है, यह पता लगाने की क्षमता कि क्या किसी कार्य की नकल की गई थी, धुंधला हो सकता है। यदि आप बिना सोचे-समझे जाँच कार्यक्रम के परिणाम को स्वीकार करते हैं, तो आप किसी छात्र पर नकल करने का झूठा आरोप लगा सकते हैं, जब उन्होंने ऐसा नहीं किया। यह आत्मा को कुचलने वाला हो सकता है।

आगे बढ़ते हुए, हम जनरेटिव AI आउटपुट के परीक्षण के दायरे में साहित्यिक चोरी-जाँच कार्यक्रमों का उपयोग करने का प्रयास कर सकते हैं। एक जनरेटिव एआई ऐप से आउटपुट किए गए निबंधों को समझें जैसे कि यह एक छात्र द्वारा लिखा गया था। हम तब अनुमान लगाते हैं कि साहित्यिक चोरी चेकर क्या कहता है। यह नमक के दाने के साथ किया जाता है।

एक हालिया शोध अध्ययन है जिसने इस प्रकार की तुलनाओं को जेनेरेटिव एआई के संदर्भ में इसी तरह से संचालित करने का प्रयास किया है। मैं आपके साथ कुछ रोचक निष्कर्षों पर जाना चाहता हूं।

सबसे पहले, कुछ अतिरिक्त पृष्ठभूमि की आवश्यकता है। जनरेटिव एआई को कभी-कभी एलएलएम (बड़े भाषा मॉडल) या केवल एलएम (भाषा मॉडल) के रूप में संदर्भित किया जाता है। दूसरा, चैटजीपीटी एक अन्य ओपनएआई जनरेटिव एआई पैकेज के एक संस्करण पर आधारित है जिसे जीपीटी-3.5 कहा जाता है। GPT-3.5 से पहले, GPT-3 था, और उससे पहले GPT-2 था। आजकल, GPT-2 को बाद की श्रृंखला की तुलना में आदिम माना जाता है, और हम सभी GPT-4 के आगामी अनावरण का बेसब्री से इंतजार कर रहे हैं, मेरी चर्चा देखें यहाँ लिंक.

जिस शोध अध्ययन का मैं संक्षेप में अन्वेषण करना चाहता हूं, उसमें GPT-2 की जांच शामिल है। यह महसूस करना महत्वपूर्ण है क्योंकि अब हम GPT-2 की क्षमताओं से बहुत आगे निकल चुके हैं। GPT-2 के इस विश्लेषण के परिणामों के बारे में जल्दबाजी में कोई निष्कर्ष न निकालें। फिर भी, हम GPT-2 के आकलन से बहुत कुछ सीख सकते हैं। अध्ययन का शीर्षक है "क्या भाषा मॉडल साहित्यिक चोरी करते हैं?" जोयॉन्ग ली, थाई ले, जिंगहुई चेन और डोंगवॉन ली द्वारा एसीएम डब्ल्यूडब्ल्यूडब्ल्यू '23, 1-5 मई, 2023, ऑस्टिन, टेक्सास, यूएसए में दिखाई दे रहे हैं।

यह उनका मुख्य शोध प्रश्न है:

  • "किस हद तक (याद करने तक सीमित नहीं) एलएम अपने प्रशिक्षण नमूने से वाक्यांशों या वाक्यों का शोषण करते हैं?"

उन्होंने इन तीन स्तरों या संभावित साहित्यिक चोरी की श्रेणियों का उपयोग किया:

  • "शब्दशः साहित्यिक चोरी: परिवर्तन के बिना शब्दों या वाक्यांशों की सटीक प्रतियां।"
  • "पैराफ्रेज साहित्यिक चोरी: पर्यायवाची प्रतिस्थापन, शब्द पुनर्व्यवस्था, और / या पिछला अनुवाद।"
  • "विचार साहित्यिक चोरी: एक विस्तृत रूप में मूल सामग्री का प्रतिनिधित्व।"

GPT-2 वास्तव में इंटरनेट डेटा पर प्रशिक्षित था और इस प्रकार इस प्रकार के विश्लेषण के लिए एक उपयुक्त उम्मीदवार था:

  • “GPT-2 वेबटेक्स्ट पर पूर्व-प्रशिक्षित है, जिसमें 8 मिलियन रेडिट लिंक से प्राप्त 45 मिलियन से अधिक दस्तावेज़ शामिल हैं। चूंकि ओपनएआई ने वेबटेक्स्ट को सार्वजनिक रूप से जारी नहीं किया है, इसलिए हम ओपनवेबटेक्स्ट का उपयोग करते हैं जो वेबटेक्स्ट कॉर्पस का एक ओपन-सोर्स मनोरंजन है। इसका पूर्व साहित्य द्वारा मज़बूती से उपयोग किया गया है। ”

अध्ययन से निकाले गए चुनिंदा प्रमुख निष्कर्षों में शामिल हैं:

  • "हमने पाया कि पूर्व-प्रशिक्षित GPT-2 परिवार OpenWebText से साहित्यिक चोरी करते हैं।"
  • "हमारे निष्कर्ष बताते हैं कि फाइन-ट्यूनिंग ओपनवेबटेक्स्ट से शब्दशः साहित्यिक चोरी के मामलों को काफी कम कर देता है।"
  • "कार्लिनी एट अल के अनुरूप। और कार्लिनी एट अल।, हम पाते हैं कि बड़े GPT-2 मॉडल (बड़े और xl) आम तौर पर छोटे लोगों की तुलना में अधिक बार साहित्यिक अनुक्रम उत्पन्न करते हैं।
  • "हालांकि, विभिन्न एलएम साहित्यिक चोरी के विभिन्न पैटर्न प्रदर्शित कर सकते हैं, और इस प्रकार हमारे परिणाम अन्य एलएम के लिए सीधे सामान्यीकृत नहीं हो सकते हैं, जिसमें जीपीटी-3 या ब्लूम जैसे अधिक हाल के एलएम शामिल हैं।"
  • "इसके अलावा, स्वचालित साहित्यिक चोरी डिटेक्टरों को कई विफलता मोड (झूठी नकारात्मक और झूठी सकारात्मक दोनों) के लिए जाना जाता है।
  • "यह देखते हुए कि अधिकांश LMs का प्रशिक्षण डेटा सामग्री स्वामियों को सूचित किए बिना वेब से स्क्रैप किया जाता है, उनके द्वारा शब्दों, वाक्यांशों, और यहां तक ​​कि प्रशिक्षण सेटों से मूल विचारों को जेनरेट किए गए टेक्स्ट में दोहराने के नैतिक निहितार्थ हैं।"

हमें निश्चित रूप से इस तरह के बहुत अधिक अध्ययन की आवश्यकता है।

यदि आप इस बारे में उत्सुक हैं कि डेटा प्रशिक्षण के संबंध में GPT-2 की तुलना GPT-3 से कैसे की जाती है, तो इसमें काफी अंतर है।

रिपोर्ट किए गए संकेतों के अनुसार, GPT-3 के लिए डेटा प्रशिक्षण कहीं अधिक व्यापक था:

  • "मॉडल को इंटरनेट से टेक्स्ट डेटाबेस का उपयोग करके प्रशिक्षित किया गया था। इसमें पुस्तकों, वेब ग्रंथों, विकिपीडिया, लेखों और इंटरनेट पर लेखन के अन्य टुकड़ों से प्राप्त 570GB डेटा शामिल था। और भी अधिक सटीक होने के लिए, 300 अरब शब्दों को सिस्टम में भर दिया गया था" (बीबीसी साइंस फोकस पत्रिका, "ChatGPT: OpenAI के GPT-3 टूल के बारे में वह सब कुछ जो आपको जानना चाहिए" एलेक्स ह्यूजेस द्वारा, फरवरी 2023)।

आप में से जो लोग GPT-3 के लिए डेटा प्रशिक्षण के अधिक गहन विवरण में रुचि रखते हैं, उनके लिए यहाँ GitHub पर पोस्ट किए गए आधिकारिक GPT-3 मॉडल कार्ड का एक अंश है (अंतिम अद्यतन तिथि सितंबर 2020 के रूप में सूचीबद्ध है):

  • "GPT-3 प्रशिक्षण डेटासेट इंटरनेट पर पोस्ट किए गए टेक्स्ट, या इंटरनेट पर अपलोड किए गए टेक्स्ट (जैसे, किताबें) से बना है। जिस इंटरनेट डेटा पर इसे प्रशिक्षित किया गया है और आज तक इसका मूल्यांकन किया गया है, उसमें शामिल हैं: (1) कॉमनक्रॉल डेटासेट का एक संस्करण, उच्च गुणवत्ता वाले संदर्भ कॉर्पोरा की समानता के आधार पर फ़िल्टर किया गया, (2) वेबटेक्स्ट डेटासेट का एक विस्तारित संस्करण, (3) ) दो इंटरनेट-आधारित पुस्तक कॉर्पोरा, और (4) अंग्रेज़ी-भाषा विकिपीडिया।"
  • “इसके प्रशिक्षण डेटा को देखते हुए, GPT-3 के आउटपुट और प्रदर्शन मौखिक, गैर-डिजिटल संस्कृति में डूबे लोगों की तुलना में इंटरनेट से जुड़ी आबादी के अधिक प्रतिनिधि हैं। इंटरनेट से जुड़ी आबादी विकसित देशों, धनी, युवा और पुरुष विचारों का अधिक प्रतिनिधि है, और ज्यादातर यूएस-केंद्रित है। अमीर देशों और विकसित देशों की आबादी में इंटरनेट की पहुंच अधिक है। डिजिटल लैंगिक विभाजन दुनिया भर में कम महिलाओं का ऑनलाइन प्रतिनिधित्व भी दिखाता है। इसके अतिरिक्त, क्योंकि दुनिया के विभिन्न हिस्सों में इंटरनेट की पैठ और पहुंच के विभिन्न स्तर हैं, डेटासेट कम जुड़े समुदायों का प्रतिनिधित्व करता है।

GPT-3 के बारे में उपरोक्त संकेत से एक निष्कर्ष यह है कि जनरेटिव AI बनाने वालों के बीच एक सामान्य नियम यह है कि आप जितना अधिक इंटरनेट डेटा स्कैन कर सकते हैं, जेनेरेटिव AI को सुधारने या आगे बढ़ाने की संभावना बढ़ जाती है।

आप इसे दो तरह से देख सकते हैं।

  • 1) बेहतर ऐ. हमारे पास जेनेरेटिव एआई होने जा रहा है जो जितना संभव हो उतना इंटरनेट पर क्रॉल करता है। रोमांचक परिणाम यह है कि जनरेटिव एआई पहले से बेहतर होगा। आगे देखने के लिए कुछ है।
  • 2) संभावित जालोर की नकल करना. इंटरनेट को स्कैन करने का यह विस्तार अप्रिय और आकर्षक रूप से साहित्यिक चोरी और कॉपीराइट उल्लंघन की समस्या को संभावित रूप से बड़ा और बड़ा बना रहा है। जबकि इससे पहले इतने अधिक सामग्री निर्माता प्रभावित नहीं होते थे, आकार फलने-फूलने वाला है। यदि आप सामग्री निर्माता के पक्ष में एक वकील हैं, तो यह आपकी आँखों में आँसू लाता है (शायद निराशा के आँसू, या मुकदमों के संदर्भ में यह क्या संभावनाएँ लाता है, इस पर खुशी के आँसू)।

क्या यह गिलास आधा भरा है या आधा खाली है?

आप तय करें।

कानूनी बारूदी सुरंगों का इंतजार

एक प्रश्न जिस पर आप विचार कर रहे होंगे वह यह है कि क्या आपकी पोस्ट की गई इंटरनेट सामग्री को स्कैन किए जाने के लिए उचित खेल माना जाता है। यदि आपकी सामग्री पेवॉल के पीछे है, तो संभवतः यह स्कैन किए जाने का लक्ष्य नहीं है क्योंकि पेवॉल की ताकत के आधार पर इसे आसानी से नहीं पहुँचा जा सकता है।

मुझे लगता है कि अधिकांश रोज़मर्रा के लोगों के पास भुगतान दीवार के पीछे उनकी सामग्री नहीं होती है। वे चाहते हैं कि उनकी सामग्री सार्वजनिक रूप से उपलब्ध हो। वे मानते हैं कि लोग इसे देखेंगे।

क्या आपकी सामग्री सार्वजनिक रूप से उपलब्ध होने का भी स्वयंसिद्ध अर्थ है कि आप इसे जेनेरेटिव एआई द्वारा उपयोग के लिए स्कैन करने के लिए अनुमोदित कर रहे हैं जिसे डेटा प्रशिक्षित किया जा रहा है?

शायद हां, शायद नहीं।

यह उन रोल-योर-आई कानूनी मामलों में से एक है।

पहले उद्धृत पर लौट रहे हैं ब्लूमबर्ग कानून लेख, लेखक कई वेबसाइटों से जुड़े नियमों और शर्तों (T&C) के महत्व का उल्लेख करते हैं:

  • "कानूनी लैंडमाइन - डेटा स्क्रैपिंग के लिए ऑनलाइन बॉट संचालित करने वाली अनजाने एआई कंपनियों द्वारा काफी हद तक अनदेखी की जाती है - सभी प्रकार की सार्वजनिक वेबसाइटों पर आमतौर पर उपलब्ध नियमों और शर्तों में छिपी हुई है। वर्तमान में अनसुलझे आईपी कानून और कॉपीराइट उल्लंघन दुविधा के विपरीत, एक वेबसाइट के नियम और शर्तें अच्छी तरह से स्थापित अनुबंध कानून द्वारा समर्थित हैं और आमतौर पर पर्याप्त संख्या में उदाहरणों के आधार पर अदालत में लागू की जा सकती हैं।

वे इंगित करते हैं कि यह मानते हुए कि आपकी वेबसाइट में एक लाइसेंसिंग-संबंधित पृष्ठ है, संभावना यह है कि यदि आपने एक मानकीकृत आधुनिक टेम्पलेट का उपयोग किया है, तो इसमें एक महत्वपूर्ण खंड शामिल हो सकता है:

  • "नतीजतन, वेबसाइटों के लिए अधिकांश बॉयलरप्लेट नियम और शर्तें - नि: शुल्क पहुंच में प्रचुर मात्रा में उपलब्ध हैं - स्वचालित डेटा स्क्रैपिंग को प्रतिबंधित करने वाला एक खंड है। विडंबना यह है कि इस तरह के स्वतंत्र रूप से उपलब्ध टेम्प्लेट का उपयोग संभवत: चैटजीपीटी प्रशिक्षण के लिए किया गया है। इसलिए, सामग्री स्वामी अपने नियमों और शर्तों की समीक्षा करना चाहते हैं और एआई प्रशिक्षण या किसी भी संबंधित उद्देश्यों के लिए वेबसाइटों से किसी भी सामग्री के सभी उपयोग को स्पष्ट रूप से प्रतिबंधित करने के लिए एक अलग खंड सम्मिलित कर सकते हैं, चाहे वह मैन्युअल रूप से या स्वचालित रूप से एकत्र किया गया हो, वेबसाइट के मालिक की पूर्व लिखित अनुमति के बिना ।”

एक जोड़ा किकर सामग्री निर्माताओं के लिए उनकी वेबसाइटों के बारे में संभावित कार्रवाइयों के उनके विश्लेषण में शामिल है:

  • "इसलिए, नो-स्क्रैपिंग क्लॉज के प्रत्येक उल्लंघन के लिए एक लागू करने योग्य परिसमापन हर्जाना प्रावधान सम्मिलित करना, निषेधाज्ञा-बिना-बॉन्ड प्रावधान के साथ बढ़ाया गया, रचनात्मक सामग्री के उन लेखकों के लिए एक व्यवहार्य समाधान हो सकता है जो अपने फल प्रदान करने के इच्छुक नहीं हैं। एआई प्रशिक्षण उद्देश्यों के लिए बौद्धिक श्रम इसके लिए भुगतान किए बिना या कम से कम उनके काम के लिए उचित क्रेडिट दिया जाता है।

आप इस बारे में अपने वकील से सलाह लेना चाह सकते हैं।

कुछ का कहना है कि एआई निर्माताओं को यह बताने और बताने का यह एक महत्वपूर्ण तरीका है कि सामग्री निर्माता अपनी सामग्री की सुरक्षा के लिए गंभीर रूप से गंभीर हैं। यह सुनिश्चित करना कि आपके लाइसेंसिंग में उचित शब्द हैं, एआई निर्माताओं को ध्यान में रखना प्रतीत होता है।

हालांकि अन्य थोड़े डाउनबीट हैं। वे उदास होकर कहते हैं कि आप अपनी वेबसाइट पर सबसे कठोर और घातक कानूनी भाषा डालने के लिए आगे बढ़ सकते हैं, लेकिन अंत में, एआई निर्माता इसे स्कैन करने जा रहे हैं। आप नहीं जानते होंगे कि उन्होंने ऐसा किया। आपके पास एक समय का शैतान होगा जो साबित करेगा कि उन्होंने किया था। आपको यह पता चलने की संभावना नहीं है कि उनके आउटपुट आपकी सामग्री को दर्शाते हैं। यह एक कठिन लड़ाई है जिसे आप जीतने नहीं जा रहे हैं।

प्रतिवाद यह है कि आप युद्ध छेड़ने से पहले ही आत्मसमर्पण कर रहे हैं। यदि आपके पास कम से कम पर्याप्त कानूनी भाषा नहीं है, और यदि आप कभी भी उन्हें पकड़ लेते हैं, तो वे किसी भी जिम्मेदारी से बचने के लिए अपना रास्ता भटकेंगे और भटकाएंगे। सब इसलिए क्योंकि आपने सही प्रकार की कानूनी शब्दावली पोस्ट नहीं की।

इस बीच, एक और दृष्टिकोण जो कर्षण प्राप्त करने की कोशिश कर रहा है, उसमें शामिल होगा अंकन आपकी वेबसाइट में कुछ ऐसा है जो कहता है कि साइट को जेनेरेटिव AI द्वारा स्कैन नहीं किया जाना है। विचार यह है कि एक मानकीकृत मार्कर तैयार किया जाएगा। वेबसाइट संभवतः मार्कर को अपनी साइट पर जोड़ सकती हैं। एआई निर्माताओं से कहा जाएगा कि वे चिह्नित वेबसाइटों को छोड़ने के लिए अपने डेटा स्कैनिंग को बदल दें।

क्या एक मार्कर दृष्टिकोण सफल हो सकता है? चिंताओं में मार्करों को प्राप्त करने और पोस्ट करने की लागत शामिल है। साथ ही क्या एआई निर्माता मार्करों का पालन करेंगे और यह सुनिश्चित करेंगे कि वे चिह्नित साइटों को स्कैन करने से बचें। एक और परिप्रेक्ष्य यह है कि भले ही एआई निर्माता चिह्नों के साथ नहीं जाते हैं, यह अदालत में जाने और यह तर्क देने के लिए एक और गप्पी सुराग प्रदान करता है कि सामग्री निर्माता एआई स्कैनिंग की कोशिश करने और चेतावनी देने के लिए अंतिम मील गया था।

हाँ, यह सब आपके सिर को घुमाता है।

निष्कर्ष

इस कांटेदार विषय पर कुछ अंतिम टिप्पणी।

क्या आप साहित्यिक चोरी करने वाले और कॉपीराइट उल्लंघनकर्ता दुविधा के रूप में इस पूरे एआई पर दिमाग घुमा देने वाले दृष्टिकोण के लिए तैयार हैं?

साहित्यिक चोरी या कॉपीराइट उल्लंघन के कार्य में जनरेटिव एआई को "पकड़ने" के बारे में बहुत सी धारणाएं ऐसे आउटपुट की खोज पर निर्भर करती हैं जो अत्यधिक समान पूर्व कार्य जैसे कि इंटरनेट पर सामग्री जो डेटा प्रशिक्षण के दौरान संभावित रूप से स्कैन की गई थी।

हालांकि मान लीजिए कि यहां फूट डालो और राज करो की चाल चल रही है।

मेरा मतलब यह है कि मेरा क्या मतलब है।

यदि जनरेटिव एआई यहां से थोड़ा सा उधार लेता है और वहां से एक किशोर सा, अंततः उन्हें किसी विशेष आउटपुट का उत्पादन करने में एक साथ मिलाता है, तो गोचा पल होने में सक्षम होने की संभावना काफी कम हो जाती है। कोई भी आउटपुट पर्याप्त सीमा तक नहीं बढ़ेगा, जिसे आप निश्चित रूप से कह सकते हैं कि यह एक विशेष स्रोत आइटम से कॉपी किया गया था। परिणामी निबंध या आउटपुट के अन्य तरीके केवल आंशिक रूप से मिलान करने योग्य होंगे। और यह तर्क देने की कोशिश करने के सामान्य दृष्टिकोण से कि साहित्यिक चोरी या कॉपीराइट उल्लंघन हुआ है, आपको आमतौर पर कुछ नन्हे नन्हे से अधिक प्रदर्शन करना पड़ता है, खासकर अगर निवाला एक स्टैंडआउट नहीं है और इंटरनेट पर व्यापक रूप से पाया जा सकता है (अंडरकटिंग) दुर्विनियोजन के सबूत का कोई भी पर्याप्त बोझ)।

क्या आप अभी भी दृढ़ता से घोषित कर सकते हैं कि जनरेटिव एआई द्वारा डेटा प्रशिक्षण ने वेबसाइटों और सामग्री निर्माताओं को फटकारा है, भले ही सुझाया गया सबूत एक स्पष्ट रूप से सारहीन अनुपात है?

उसके बारे में सोचना।

यदि हम बड़े पैमाने पर संभावित साहित्यिक चोरी और बड़े पैमाने पर कॉपीराइट उल्लंघन का सामना कर रहे हैं, तो हमें साहित्यिक चोरी और/या कॉपीराइट उल्लंघन को परिभाषित करने के लिए अपने दृष्टिकोण को बदलने की आवश्यकता हो सकती है। शायद मुख्य रूप से या बड़े स्तर पर साहित्यिक चोरी या कॉपीराइट उल्लंघन का मामला बनता है। एक मोज़ेक जिसमें हजारों या लाखों छोटे-छोटे टुकड़े होते हैं, को इस तरह के उल्लंघन के रूप में माना जा सकता है। हालांकि स्पष्ट समस्या यह है कि यह सभी प्रकार की सामग्री को अचानक उल्लंघनों की छत्रछाया में ला सकता है। यह एक फिसलन भरी ढलान हो सकती है।

भारी विचार।

भारी विचारों की बात करते हुए, महान लेखक, लियो टॉल्स्टॉय ने प्रसिद्ध रूप से कहा: "जीवन का एकमात्र अर्थ मानवता की सेवा करना है।"

यदि एआई की बेहतरी के लिए आपकी वेबसाइट और दूसरों की वेबसाइटों को स्कैन किया जा रहा है, और यद्यपि आपको इसके लिए एक पैसा भी नहीं मिल रहा है, तो क्या आपको इस दृढ़ विश्वास से सांत्वना मिल सकती है कि आप मानवता के भविष्य में योगदान दे रहे हैं? भुगतान करने के लिए एक छोटी सी कीमत लगती है।

ठीक है, जब तक एआई खतरनाक अस्तित्वगत जोखिम नहीं बन जाता है जो सभी मनुष्यों को अस्तित्व से मिटा देता है। आपको इसका श्रेय नहीं लेना चाहिए। मुझे लगता है कि आप जल्द ही उस भयानक परिणाम में योगदान नहीं देंगे। उस विपत्तिपूर्ण भविष्यवाणी को एक तरफ रखते हुए, आप सोच रहे होंगे कि यदि एआई निर्माता अपने जनरेटिव एआई से पैसा कमा रहे हैं, और वे मुनाफाखोरी का आनंद ले रहे हैं, तो आपको पाई का एक टुकड़ा भी मिलना चाहिए। साझा करें और समान रूप से साझा करें। एआई निर्माताओं को किसी भी वेबसाइट को स्कैन करने की अनुमति मांगनी चाहिए और फिर स्कैन करने की अनुमति देने के लिए भुगतान की जाने वाली कीमत पर भी बातचीत करनी चाहिए।

जहां क्रेडिट की ज़रूरत है वहां क्रेडिट दें।

आइए सर वाल्टर स्कॉट को अभी के लिए अंतिम शब्द दें: “ओह, हम कितना पेचीदा जाल बुनते हैं। जब पहले हम धोखा देने का अभ्यास करते हैं।

यह शायद तब लागू होता है जब आप मानते हैं कि धोखा चल रहा है, या शायद यह लागू नहीं होता है यदि आपको लगता है कि सब ठीक है और पूरी तरह से स्पष्ट और वैध है। कृपया इस पर विचार करने के लिए उदारतापूर्वक स्वयं को श्रेय दें। तुम इसके लायक हो।

स्रोत: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- और-ऐ-कानून/