कार ऑडियो की नई आर्टिफिशियल इंटेलिजेंस सिर्फ धुनों से ज्यादा सुधार कर सकती है

हॉलीवुड ने आर्टिफिशियल इंटेलिजेंस (एआई) को डायस्टोपियन रोबोटों की ऑपरेटिंग परत के रूप में चित्रित किया है जो पहले से न सोचा इंसानों की जगह लेते हैं और बढ़ते, केंद्रीय संघर्ष का निर्माण करते हैं। सबसे अच्छे मामले के संदर्भ में, आप कल्पना कर सकते हैं कि एक युवा हैली जोएल ऑस्मेंट डेविड की भूमिका निभा रहा है, जो स्पीलबर्ग के ध्रुवीय-टोपी-पिघल-और-बाढ़-तटीय-शहरों की दुनिया में आत्म-जागरूक, कृत्रिम बच्चा है (ध्वनि परिचित?) एआई: आर्टिफिशियल इंटेलिजेंस जो (स्पॉइलर अलर्ट) केवल खुद को मारता है। या हो सकता है कि आपको रॉबिन विलियम्स की आवाज़ याद हो दो सौ साल मैन जो, एक बार फिर, एक आत्म-जागरूक रोबोट है जो बढ़ने का प्रयास कर रहा है (एक बार फिर स्पॉइलर अलर्ट पर), उसका एकमात्र शिकार बन जाता है। और, ज़ाहिर है, लगभग क्लिच संदर्भ है समापक और इसकी सर्वनाश के बाद की दुनिया में इंसानों को नष्ट करने की कोशिश करने वाली मशीनें और, ठीक है, (नहीं-तो-बिगाड़ने वाला अलर्ट) कुछ दशकों में बहुत सारे पीड़ित। इनमें से किसी भी परिदृश्य में, हालांकि, मनुष्य बेहतर जीवन के साथ सह-अस्तित्व में नहीं हैं, मनोरंजन और सुरक्षा में वृद्धि की तो बात ही छोड़िए।

बहरहाल, यह नई हकीकत है। आर्टिफिशियल इंटेलिजेंस एल्गोरिदम को ऑडियो डिज़ाइन में शामिल किया जा सकता है और ड्राइविंग अनुभव को बेहतर बनाने के लिए ओवर-द-एयर अपडेट के माध्यम से लगातार सुधार किया जा सकता है। और इन हॉलीवुड उदाहरणों के सीधे विरोधाभास में, ऐसे एआई वास्तव में मानव के जीवित रहने की संभावना में सुधार कर सकते हैं।

केवल आनंद के लिए

कुछ समय पहले तक, ऑडियो विकास सहित सभी यूजर इंटरफेस (यूआई) को एक वाहन कार्यक्रम के मानक छत्तीस (36) महीनों में विशेषज्ञ कोडर्स द्वारा जटिल प्रोग्रामिंग की आवश्यकता होती है। शीट मेटल स्टाइलिंग और इलेक्ट्रॉनिक बॉक्स निर्दिष्ट, सोर्स किए गए और समानांतर में विकसित किए गए हैं ताकि विकास में देर से अलग-अलग तत्वों को कैलिब्रेट किया जा सके। ब्रांडेड ध्वनियाँ। ध्वनिक हस्ताक्षर। एक ही के भीतर सभी अलग-अलग पहल, एनीमिक सिस्टम डिज़ाइन जिसमें लागत निर्माता अरबों.

लेकिन आर्टिफिशियल इंटेलिजेंस ने ऑडियो अनुभव डिजाइन के करीब पहुंचने के अधिक लचीले और कुशल तरीके की अनुमति दी है। "हम जो देख रहे हैं वह रुझानों का अभिसरण है," जोश मॉरिस, डीएसपी कॉन्सेप्ट के मशीन लर्निंग इंजीनियरिंग मैनेजर कहते हैं। "ऑडियो ऑटोमोटिव के भीतर एक अधिक प्रमुख विशेषता बन रहा है, लेकिन साथ ही आप देख रहे हैं कि आधुनिक प्रोसेसर अधिक मेमोरी और क्षमताओं के साथ मजबूत होते जा रहे हैं।"

और, इसमें, सिस्टम-केंद्रित विकास प्लेटफॉर्म का उपयोग करते हुए, आर्टिफिशियल इंटेलिजेंस और ये मजबूत प्रोसेसर ड्राइवरों और यात्रियों को अनुकूली, वास्तविक समय की प्रतिक्रिया का एक नया स्तर प्रदान करते हैं। . ऑटोमोटिव बिजनेस डेवलपमेंट के डीएसपी कॉन्सेप्ट के प्रमुख स्टीव अर्न्स्ट कहते हैं, "हर कल्पनीय परिदृश्य के लिए कोड के रिम्स लिखने की ऐतिहासिक आवश्यकता के बजाय, एआई पर्यावरणीय परिस्थितियों और घटनाओं के बारे में जागरूकता के आधार पर सिस्टम प्रतिक्रियात्मकता का मार्गदर्शन करता है।

इस तरह की सीखने की प्रणाली का उपयोग करने का सबसे स्पष्ट तरीका वाहन को "डी-नोइज़िंग" करना है ताकि सर्दियों के टायरों या इस तरह के अन्य परिवेश में बदलाव के बावजूद प्रीमियम ऑडियो को सिलवाया और बेहतर बनाया जा सके। परंतु एलजी इलेक्ट्रॉनिक्स ने डीएसपी कॉन्सेप्ट के ऑडियो वीवर में चलने वाले एल्गोरिदम विकसित किए हैं पीछे की सीट के मनोरंजन के दौरान फिल्म के संवाद की आवाज बढ़ाने की अनुमति देने के लिए मंच, जिससे यात्री को महत्वपूर्ण सामग्री को बेहतर ढंग से सुनने की अनुमति मिलती है।

एक और गैर-स्पष्ट पहलू यह होगा कि अन्य शोरों के बीच ब्रांडेड ऑडियो ध्वनियों को कैसे व्यवस्थित किया जाता है। क्या इस विशिष्ट वाहन को चलाने के लिए बढ़ते बूट-अप अनुक्रम की आवश्यकता होती है, जबकि रेडियो और झंकार जैसी अन्य ध्वनियां स्वचालित रूप से बंद हो जाती हैं? प्रत्येक अनुभव को समायोजित किया जा सकता है।

फलने-फूलने की अधिक संभावना

जैसे-जैसे दुनिया इलेक्ट्रिक वाहनों और स्वायत्त ड्राइविंग दोनों में दौड़ती है, श्रव्य चेतावनियों की आवृत्ति और जरूरतों में काफी बदलाव आएगा। उदाहरण के लिए, एक स्वायत्त टैक्सी का सुरक्षा इंजीनियर यह नहीं मान सकता है कि समय पर अलर्ट की आवश्यकता होने पर यात्री दृश्य प्रदर्शन के पास कहीं भी हैं। और वह अलर्ट कितना श्रव्य है लगभग 25 मिलियन अमेरिकी विकलांग किसके लिए स्वायत्त वाहनों को गतिशीलता की नई संभावनाएं खोलनी चाहिए? अर्न्स्ट कहते हैं, "ऑडियो अब केवल आपके पसंदीदा गीत को सुनने के लिए नहीं है।" "ऑटोनोमस ड्राइविंग के साथ, ड्राइवर को व्यस्त रखने या गैर-व्यस्त ड्राइवर को उनके आसपास होने वाली चीजों के बारे में सचेत करने के लिए सभी प्रकार के अलर्ट की आवश्यकता होती है।"

"और जो इसे और अधिक चुनौतीपूर्ण बनाता है," एडम लेवेन्सन, डीएसपी कॉन्सेप्ट्स के मार्केटिंग प्रमुख, इंजेक्ट करता है, "क्या कार के भीतर सभी चीजें एक साथ संभाली जा रही हैं: टेलीफोनी, इमर्सिव या स्थानिक ध्वनि, इंजन का शोर, सड़क का शोर, ध्वनिक वाहन अलर्ट सिस्टम, वॉयस सिस्टम, आदि। हम कहना चाहते हैं कि सबसे जटिल ऑडियो उत्पाद कार है। ”

उदाहरण के लिए, उस परिदृश्य की कल्पना करें जहां एक ड्राइवर ने राजमार्ग पर ऑटोनॉमस ड्राइव मोड को सक्षम किया है, अपनी धुनों को चालू किया है और आने वाले आपातकालीन वाहन से सुखद रूप से अनभिज्ञ है। वाहन के माइक्रोफ़ोन का उपयोग करके सायरन-पहचान की कितनी सटीकता (और दूरी) पर कार अपने अर्ध-विचलित-चालक को सचेत करती है? परिवेश के शोर को दूर करने के लिए उस अलर्ट को कैसे प्रस्तुत किया जाना चाहिए, पर्याप्त ध्यान देना चाहिए लेकिन ड्राइवर को अनावश्यक रूप से चौंकाना नहीं चाहिए? यह सब पूर्व-विकसित मॉडल, विभिन्न सायरन के साथ अग्रिम प्रशिक्षण और बाद में क्लाउड-आधारित ट्यूनिंग के माध्यम से ट्यून किया जा सकता है। "यह वह जगह है जहाँ समग्र ऑर्केस्ट्रेशन वास्तव में महत्वपूर्ण हो जाता है," मॉरिस बताते हैं। “हम [AI's डिटेक्शन] मॉडल का आउटपुट ले सकते हैं और उसे कार के विभिन्न स्थानों पर निर्देशित कर सकते हैं। हो सकता है कि आप ऑडियो को बंद कर दें, कुछ श्रव्य चेतावनी संकेत ट्रिगर करें और ड्राइवर को ध्यान देने के लिए डैशबोर्ड पर कुछ फ्लैश करें।"

बाहरी अलर्ट के लिए भी यही सच है। उदाहरण के लिए, शांत इलेक्ट्रिक वाहन में पैदल चलने वालों के लिए ट्यून किए गए अलार्म हो सकते हैं। और इसलिए नए कैलिब्रेशन को ऑफ़लाइन बनाया जा सकता है और सक्षम नवाचार के आधार पर सॉफ़्टवेयर अपडेट के रूप में वाहनों में डाउनलोड किया जा सकता है।

हर जगह नवाचार। और आर्टिफिशियल इंटेलिजेंस हॉलीवुड की डायस्टोपियन दुनिया बनाने के बजाय यूटोपियन अनुभव को खिला रहा है।

लेखक की भविष्यवाणी

यहाँ सप्ताह की मेरी भविष्यवाणी है (और यह केवल मंगलवार है, दोस्तों): ऑडियो के अगले विकास में सूक्ष्म, वास्तविक समय के उपयोगकर्ताओं की खुशी सहित एक पूर्ण, तात्कालिक प्रतिक्रिया लूप शामिल होगा। हां, वर्तमान डिजाइन के अधिकांश अनुभव में सुधार की संभावना है, लेकिन उपयोगकर्ता-केंद्रित डिजाइन (यूसीडी) के चल रहे अंशांकन को यात्रियों के हाव-भाव, बॉडी लैंग्वेज और टिप्पणियों के आधार पर अतिरिक्त रूप से बढ़ाया जा सकता है, जिससे वास्तविक समय में संतुष्टि को व्यक्तिगत रूप से ट्यून किया जा सकता है। सभी सक्षमकर्ता सभी हैं: कैमरा, एआई, प्रोसेसर और एक अनुकूली मंच।

हां, हमने पहले सुना है अनुकूली मूड लाइटिंग और सुरक्षा में सुधार के लिए बोरियत, तनाव, आदि का दूरस्थ पता लगाना, लेकिन ऐसा कुछ भी नहीं जो वास्तविक समय के आधार पर संयुक्त अनुभव को बढ़ाता है, सभी उपयोगकर्ता द्वारा इंगित सेंसर के एल्गोरिदम सीखना।

शायद मैं बहुत ज्यादा एक्सट्रपलेशन कर रहा हूं। लेकिन रॉबिन विलियम्स के चरित्र की तरह ही मैंने दो शताब्दियां बिताई हैं ... इसलिए शायद मैं भी सिर्फ इस बात के प्रति संवेदनशील हूं कि मनुष्य क्या चाहता है।

स्रोत: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/