ओपनएआई ने चैटजीपीटी को अपग्रेड किया: एआई चैटबॉट अब "देख, सुन और बोल सकता है"

ओपनएआई ने बहुप्रतीक्षित अपग्रेड शुरू किया है जो इसके लोकप्रिय चैटजीपीटी चैटबॉट को छवियों और आवाजों के साथ बातचीत करने की अनुमति देगा। यह लॉन्च कृत्रिम सामान्य बुद्धिमत्ता के लिए ओपनएआई के दृष्टिकोण की दिशा में एक बड़े कदम का प्रतिनिधित्व करता है जो केवल पाठ ही नहीं, बल्कि कई तरीकों से जानकारी को देख और संसाधित कर सकता है।

“हम चैटजीपीटी में नई आवाज और छवि क्षमताओं को पेश करना शुरू कर रहे हैं। ओपनएआई ने अपने आधिकारिक ब्लॉग पोस्ट में कहा, वे आपको वॉयस वार्तालाप करने या चैटजीपीटी को यह दिखाने की अनुमति देकर एक नया, अधिक सहज प्रकार का इंटरफ़ेस प्रदान करते हैं कि आप किस बारे में बात कर रहे हैं।

https://youtu.be/–khbXchTeE?si=vx3ne9oRgzvJV6ZA

ओपनएआई ने कहा कि नए चैटजीपीटी-प्लस में एक उपन्यास टेक्स्ट-टू-स्पीच मॉडल द्वारा संचालित वॉयस चैट शामिल होगी जो मानव आवाज़ों की नकल करने में सक्षम है, और कंपनी के छवि पीढ़ी मॉडल के साथ एकीकरण के लिए छवियों पर चर्चा करने की क्षमता शामिल है। नई सुविधाएँ GPT विज़न (या GPT-V, जिसे अक्सर सैद्धांतिक GPT-5 के साथ भ्रमित किया जाता है) का हिस्सा प्रतीत होता है और GPT-4 के उन्नत मल्टीमॉडल संस्करण के प्रमुख घटकों का प्रतिनिधित्व करता है जिसे OpenAI ने इस साल की शुरुआत में छेड़ा था।

यह अपग्रेड OpenAI द्वारा DALL-E 3 के अनावरण के ठीक बाद आया है, जो इसका अब तक का सबसे उन्नत टेक्स्ट-टू-इमेज जनरेटर है। अपनी गुणवत्ता और सटीकता के कारण प्रारंभिक परीक्षकों द्वारा "पागल" के रूप में प्रतिष्ठित, DALL-E 3 प्राकृतिक भाषा में व्यक्त जटिल संदर्भ और अवधारणाओं को समझते हुए पाठ संकेतों से उच्च-निष्ठा वाली छवियां बना सकता है। इसे चैटजीपीटी प्लस में बनाया जाएगा, जो एक सदस्यता-आधारित सेवा है जो जीपीटी-4 द्वारा संचालित चैटजीपीटी प्रदान करती है।

DALL-E 3 और संवादी वॉयस चैट का एकीकरण, AI सहायकों की ओर OpenAI के दबाव को दर्शाता है जो दुनिया को इंसानों की तरह ही समझ सकते हैं - कई इंद्रियों के साथ। कंपनी के अनुसार: “आवाज़ और छवि आपको अपने जीवन में चैटजीपीटी का उपयोग करने के अधिक तरीके प्रदान करती है। यात्रा के दौरान किसी ऐतिहासिक स्थल की तस्वीर लें और उसमें क्या दिलचस्प है, उसके बारे में लाइव बातचीत करें।''

Microsoft OpenAI एकीकरण के साथ AI दौड़ को बढ़ावा देता है

OpenAI का सबसे बड़ा समर्थक, Microsoft, OpenAI की उन्नत जेनरेटिव AI क्षमताओं को अपने उपभोक्ता उत्पादों में एकीकृत करने के लिए भी आगे बढ़ रहा है। अपने हालिया शरद ऋतु कार्यक्रम में, माइक्रोसॉफ्ट ने DALL-E 11 (माइक्रोसॉफ्ट के संशोधित पेंट जैसे इमेज-ट्वीकिंग कार्यक्रमों में) और ओपनएआई के प्रोग्रामिंग सहायक कोपायलट जैसे मॉडलों का लाभ उठाते हुए विंडोज 3, ऑफिस और बिंग सर्च में एआई अपग्रेड की घोषणा की।

यह OpenAI में Microsoft के $10 बिलियन से अधिक के निवेश के अनुरूप है, क्योंकि इसका लक्ष्य AI सहायक दौड़ में नेतृत्व करना है। 11 सितंबर को विंडोज 26 में कोपायलट की शुरुआत माइक्रोसॉफ्ट के प्लेटफार्मों और उपकरणों पर एआई सहायता उपलब्ध कराने का वादा करती है। इस बीच, Microsoft 365 चैट जटिल कार्य कार्यों को स्वचालित करने के लिए OpenAI की प्राकृतिक भाषा कौशल को लागू करता है।

जैसा कि पहले बताया गया है डिक्रिप्ट, माइक्रोसॉफ्ट ने कहा कि "माइक्रोसॉफ्ट 365 चैट काम पर आपके संपूर्ण डेटा को एकत्रित करता है, जिसमें ईमेल, मीटिंग, चैट, दस्तावेज़ और बहुत कुछ, साथ ही वेब भी शामिल है।"

जिम्मेदार एआई की ओर सतर्क कदम

हालाँकि, OpenAI दृष्टि और आवाज निर्माण से जुड़े अधिक शक्तिशाली मल्टीमॉडल AI सिस्टम के साथ संभावित जोखिमों के बारे में अच्छी तरह से जानता है। प्रतिरूपण, पूर्वाग्रह और दृश्य व्याख्या पर निर्भरता प्रमुख चिंताएँ हैं।

कंपनी ने अपनी घोषणा में लिखा, "ओपनएआई का लक्ष्य एजीआई का निर्माण करना है जो सुरक्षित और फायदेमंद हो।" "हम अपने उपकरणों को धीरे-धीरे उपलब्ध कराने में विश्वास करते हैं, जो हमें समय के साथ सुधार करने और जोखिम कम करने को परिष्कृत करने की अनुमति देता है, साथ ही भविष्य में और अधिक शक्तिशाली प्रणालियों के लिए सभी को तैयार करता है।"

के रूप में भी डिक्रिप्ट पहले रिपोर्ट की गई थी, OpenAI अपने AI उत्पादों के अनुचित उपयोग के कारण होने वाले हानिकारक परिणामों को रोकने के तरीकों पर काम करने के लिए एक रेड टीम को इकट्ठा कर रहा है। सीईओ सैम अल्टमैन भी अनुकूल कानून के लिए दुनिया भर में पैरवी कर रहे हैं।

ओपनएआई ने कहा कि प्लस और एंटरप्राइज उपयोगकर्ताओं के पास अगले दो हफ्तों में इन नई कार्यक्षमताओं तक पहुंच होगी, बाद में डेवलपर्स के लिए उपलब्धता का विस्तार करने की योजना है। और Google ने अपने स्वयं के क्रांतिकारी मल्टीमॉडल एलएलएम, जेमिनी की भी घोषणा की है, एआई उद्योग पर हावी होने की दौड़ अभी शुरू हो रही है

क्रिप्टो समाचारों के शीर्ष पर रहें, अपने इनबॉक्स में दैनिक अपडेट प्राप्त करें।

स्रोत: https://decrypt.co/198611/openai-upgrades-chatgpt-the-ai-chatbot-can-now-see-hear-and-speak