कंप्यूटर विजन प्रोपेल ट्रांसपोर्टेशन ऑटोनॉमी में प्रगति

दृष्टि एक शक्तिशाली मानव संवेदी इनपुट है। यह जटिल कार्यों और प्रक्रियाओं को सक्षम बनाता है जिन्हें हम हल्के में लेते हैं। परिवहन और कृषि से लेकर रोबोटिक्स और चिकित्सा तक के विविध अनुप्रयोगों में AoT™ (ऑटोनॉमी ऑफ थिंग्स) में वृद्धि के साथ, मानव जैसी दृष्टि और अनुभूति प्रदान करने में कैमरों, कंप्यूटिंग और मशीन लर्निंग की भूमिका महत्वपूर्ण होती जा रही है। एक अकादमिक अनुशासन के रूप में कंप्यूटर दृष्टि ने 1960 के दशक में मुख्य रूप से कृत्रिम बुद्धि (एआई) और मशीन सीखने के उभरते क्षेत्र में लगे विश्वविद्यालयों में शुरुआत की। अगले चार दशकों में इसने नाटकीय रूप से प्रगति की क्योंकि अर्धचालक और कंप्यूटिंग प्रौद्योगिकियों में महत्वपूर्ण प्रगति हुई। डीप लर्निंग और आर्टिफिशियल इंटेलिजेंस में हालिया प्रगति ने वास्तविक समय, कम विलंबता धारणा और पर्यावरण की अनुभूति प्रदान करने के लिए कंप्यूटर विज़न के अनुप्रयोग को और तेज कर दिया है, जिससे विभिन्न अनुप्रयोगों में स्वायत्तता, सुरक्षा और दक्षता को सक्षम किया जा सके। परिवहन एक ऐसा क्षेत्र है जिससे काफी लाभ हुआ है।

LiDAR (लाइट डिटेक्शन एंड रेंजिंग) एक सक्रिय ऑप्टिकल इमेजिंग दृष्टिकोण है जो किसी वस्तु के आसपास के 3D वातावरण को निर्धारित करने के लिए लेज़रों का उपयोग करता है। यह उन तकनीकों में से एक है जिसे कंप्यूटर विज़न सॉल्यूशंस (जो पूरी तरह से परिवेशी प्रकाश पर निर्भर करते हैं और 3D धारणा के लिए लेज़रों का उपयोग नहीं करते हैं) बाधित करने का प्रयास कर रहे हैं। सामान्य विषय यह है कि मानव चालकों को गहराई की धारणा के लिए LiDAR की आवश्यकता नहीं होती है, इसलिए न ही मशीनों को। वर्तमान वाणिज्यिक L3 स्वायत्त ड्राइविंग सुविधाएँ (विशिष्ट भौगोलिक और मौसम की स्थिति में पूर्ण स्वायत्तता, ड्राइवर के साथ सेकंड के भीतर नियंत्रण लेने के लिए तैयार) उत्पाद आज LiDAR . का उपयोग करें. विशुद्ध रूप से दृष्टि-आधारित तकनीक अभी भी इस क्षमता को व्यावसायिक रूप से पेश करने में सक्षम नहीं है।

विज्ञापन

टेस्लाTSLA
यात्री वाहन स्वायत्तता प्रदान करने के लिए निष्क्रिय कैमरा-आधारित कंप्यूटर दृष्टि का उपयोग करने का एक प्रमुख प्रस्तावक है। कंपनी के हालिया एआई डे इवेंट के दौरान, एलोन मस्क और उनके इंजीनियरों ने एक प्रभावशाली प्रस्तुति दी इसके एआई, डेटा प्रबंधन और कंप्यूटिंग क्षमताओं का समर्थन करता है, अन्य पहलों के साथ, कई टेस्ला मॉडल पर फुल सेल्फ ड्राइविंग (एफएसडी) सुविधा। FSD के लिए आवश्यक है कि मानव चालक हर समय ड्राइविंग कार्य में लगे रहें (जो कि L2 स्वायत्तता के अनुरूप है)। वर्तमान में, यह विकल्प यूएस और कनाडा में ग्राहकों द्वारा खरीदे गए 160,000 वाहनों पर उपलब्ध है। प्रत्येक वाहन पर 8 कैमरों का एक सूट 360° अधिभोग मानचित्र प्रदान करता है। इन वाहनों के कैमरा (और अन्य) डेटा का उपयोग इसके तंत्रिका नेटवर्क (जो ऑटो-लेबलिंग का उपयोग करता है) को वस्तुओं को पहचानने, संभावित वाहन प्रक्षेपवक्र की साजिश रचने, इष्टतम लोगों का चयन करने और उपयुक्त नियंत्रण क्रियाओं को सक्रिय करने के लिए किया जाता है। पिछले 75 महीनों में तंत्रिका नेटवर्क के ~12K अपडेट हुए हैं (~ हर 1 मिनट में 7 अपडेट) क्योंकि नया डेटा लगातार एकत्र किया जाता है और लेबलिंग त्रुटियों या पैंतरेबाज़ी की गलतियों का पता लगाया जाता है। प्रशिक्षित नेटवर्क उद्देश्य-निर्मित कंप्यूट इलेक्ट्रॉनिक्स के एक ऑनबोर्ड, निरर्थक वास्तुकला के माध्यम से योजना और नियंत्रण कार्यों को निष्पादित करता है। टेस्ला को उम्मीद है कि एफएसडी अंततः स्वायत्त वाहनों (एवी) का नेतृत्व करेगा, जो कुछ परिचालन डिजाइन डोमेन में पूर्ण स्वायत्तता प्रदान करता है, जिसमें मानव चालक जुड़ाव की आवश्यकता नहीं होती है (जिसे एल 4 स्वायत्तता भी कहा जाता है)।

अन्य कंपनियां जैसे फिर, हेल्म.एई और नोडा कंप्यूटर विजन एवेन्यू का भी पीछा कर रहे हैं। NODAR का उद्देश्य पेटेंट मशीन लर्निंग एल्गोरिदम के माध्यम से कैमरा मिसलिग्न्मेंट और कंपन प्रभावों के लिए समायोजन करना सीखकर इमेजिंग रेंज और स्टीरियो कैमरा सिस्टम की 3D धारणा का विस्तार करना है। इसने हाल ही में $12M . उठाया अपने प्रमुख उत्पाद हैमरहेड™ के उत्पादन के लिए, जो "ऑफ-द-शेल्फ" ऑटोमोटिव-ग्रेड कैमरों और मानक कंप्यूट प्लेटफॉर्म का उपयोग करता है।

लागत और आकार के अलावा, LiDAR का उपयोग करने के खिलाफ अक्सर तर्क दिया जाता है कि कैमरों की तुलना में इसकी सीमित सीमा और रिज़ॉल्यूशन है। उदाहरण के लिए, 200 मीटर रेंज और 5-10 एम पॉइंट/सेकंड (रिज़ॉल्यूशन के समान पीपीएस) वाले लीडर आज उपलब्ध हैं। 200 मीटर पर, ईंटों या टायर के मलबे जैसी छोटी बाधाएं बहुत कम अंक दर्ज करेंगी (शायद ऊर्ध्वाधर में 2-3 और क्षैतिज दिशा में 3-5), जिससे वस्तु की पहचान मुश्किल हो जाती है। लंबी दूरी पर चीजें और भी मोटे हो जाती हैं। तुलना करके, 30 हर्ट्ज पर चलने वाले मानक मेगापिक्सेल कैमरे 30M पिक्सल/सेकंड उत्पन्न कर सकते हैं, लंबी दूरी पर भी बेहतर वस्तु पहचान को सक्षम करते हैं। अधिक उन्नत कैमरे (12 M पिक्सेल) इसे और भी बढ़ा सकते हैं। मुद्दा यह है कि इस विशाल डेटा का उपयोग कैसे किया जाए और मिलीसेकंड-स्तर की विलंबता, कम बिजली की खपत और खराब रोशनी की स्थिति के साथ कार्रवाई योग्य धारणा उत्पन्न की जाए।

विज्ञापन


recogniकैलिफ़ोर्निया की एक कंपनी, इस समस्या को हल करने की कोशिश कर रही है। सीईओ मार्क बोलिथो के अनुसार, इसका मिशन है "पूरी तरह से स्वायत्त वाहनों के लिए अलौकिक दृश्य धारणा प्रदान करें।" कंपनी की स्थापना 2017 में हुई थी, जिसने अब तक $75M जुटाए हैं और इसमें 70 कर्मचारी हैं। आरके आनंद, जुनिपर नेटवर्क्स के एक फिटकरी, सह-संस्थापक और मुख्य उत्पाद अधिकारी में से एक हैं। उनका मानना ​​है कि 120 डीबी डायनेमिक रेंज के साथ उच्च रिज़ॉल्यूशन वाले कैमरों का उपयोग, उच्च फ्रेम दर (उदाहरण के लिए, ऑनसेमी, सोनी और ओमनीविजन) पर चलने से उच्च-रिज़ॉल्यूशन 3 डी जानकारी बनाने के लिए आवश्यक डेटा प्रदान करता है, जो एवी को साकार करने के लिए महत्वपूर्ण है। इसके प्रवर्तक हैं:

  1. डेटा को कुशलतापूर्वक संसाधित करने और कार पर्यावरण के सटीक और उच्च-रिज़ॉल्यूशन 3D मानचित्र तैयार करने के लिए कस्टम-डिज़ाइन किए गए ASICs। ये TSMC 7 एनएम प्रक्रिया पर गढ़े गए हैं, 100 मिमी² के चिप आकार के साथ, 1 गीगाहर्ट्ज़ आवृत्ति पर काम कर रहे हैं।
  2. प्रशिक्षित तंत्रिका नेटवर्क बनाने के लिए लाखों डेटा बिंदुओं को ऑफ़लाइन संसाधित करने के लिए मालिकाना मशीन लर्निंग एल्गोरिदम, जो तब कुशलता से काम कर सकता है और लगातार सीख सकता है। यह नेटवर्क धारणा प्रदान करता है और इसमें ऑब्जेक्ट वर्गीकरण और डिटेक्शन, सिमेंटिक सेगमेंटेशन, लेन डिटेक्शन, ट्रैफिक सिग्नल और ट्रैफिक लाइट रिकग्निशन शामिल हैं
  3. ऑफ-चिप भंडारण और गुणन संचालन को कम करना जो शक्ति गहन हैं और उच्च विलंबता पैदा करते हैं। रिकॉग्नि का ASIC डिज़ाइन लॉगरिदमिक गणित के लिए अनुकूलित है और अतिरिक्त का उपयोग करता है। प्रशिक्षित तंत्रिका नेटवर्क में वजन को बेहतर तरीके से क्लस्टर करके आगे की क्षमता का एहसास होता है।

प्रशिक्षण चरण के दौरान, गहराई से जानकारी निकालने और गलत संरेखण और कंपन प्रभावों के खिलाफ इसे मजबूत बनाने के लिए उच्च रिज़ॉल्यूशन, उच्च गतिशील रेंज स्टीरियो कैमरा डेटा को प्रशिक्षित करने के लिए एक वाणिज्यिक LiDAR का उपयोग जमीनी सच्चाई के रूप में किया जाता है। श्री आनंद के अनुसार, उनका मशीन लर्निंग कार्यान्वयन इतना कुशल है कि यह कैलिब्रेशन LiDAR (जो कि 100 मीटर की सीमा तक जमीनी सच्चाई प्रदान करता है) द्वारा प्रदान की गई प्रशिक्षण सीमाओं से परे गहराई के अनुमानों को एक्सट्रपलेशन कर सकता है।

विज्ञापन

ऊपर दिए गए प्रशिक्षण डेटा को दिन में 8.3 मेगापिक्सेल कैमरों की एक स्टीरियो जोड़ी के साथ 30 हर्ट्ज फ्रेम दर (~ 0.5 बी पिक्सल प्रति सेकेंड) पर चलने के साथ आयोजित किया गया था। यह प्रशिक्षित नेटवर्क की क्षमता को प्रदर्शित करता है कि वह 3 मीटर की सीमा से परे के दृश्य में 100डी जानकारी निकाल सकता है जिसके साथ उसे प्रशिक्षित किया गया था। रिकॉग्नि का समाधान दिन के डेटा के साथ रात के समय के प्रदर्शन (चित्र 2) के साथ इसके सीखने को भी बढ़ा सकता है।

विज्ञापन

श्री आनंद के अनुसार, रेंज डेटा 5% (लंबी रेंज पर) और 2% के करीब (छोटी रेंज पर) सटीक है। समाधान 1000 एमएस विलंबता और 6W बिजली खपत (25 TOPS/W) के साथ 40 TOPS (ट्रिलियन ऑपरेशन प्रति सेकंड) प्रदान करता है, जो उद्योग का नेतृत्व करता है। पूर्णांक गणित का उपयोग करने वाले प्रतियोगी इस मीट्रिक पर > 10X कम हैं। रिकॉग्नि का समाधान वर्तमान में कई ऑटोमोटिव टियर 1 आपूर्तिकर्ताओं में परीक्षण में है।

भविष्यवाणी ("भविष्यवाणी करना और देखना कि कार्रवाई कहाँ है"), फ्रांस में स्थित, AV, उन्नत चालक सहायता प्रणाली (ADAS), औद्योगिक स्वचालन, उपभोक्ता अनुप्रयोगों और स्वास्थ्य देखभाल के लिए अपने ईवेंट-आधारित कैमरों का उपयोग करता है। 2014 में स्थापित, कंपनी ने हाल ही में $50M . के अपने C राउंड फंडिंग को बंद कर दिया है, अब तक कुल $127M जुटाए गए हैं। मोबाइल फोन की अग्रणी निर्माता कंपनी Xiaomi निवेशकों में से एक है। भविष्यवाणी का लक्ष्य मानवीय दृष्टि का अनुकरण करना है जिसमें रेटिना में रिसेप्टर्स गतिशील जानकारी पर प्रतिक्रिया करते हैं। मानव मस्तिष्क दृश्य में परिवर्तनों को संसाधित करने पर केंद्रित है (विशेषकर ड्राइविंग के लिए)। मूल विचार कैमरा और पिक्सेल आर्किटेक्चर का उपयोग करना है जो एक थ्रेशोल्ड (एक घटना) के ऊपर प्रकाश की तीव्रता में परिवर्तन का पता लगाता है और आगे की प्रक्रिया के लिए कंप्यूट स्टैक को केवल यह डेटा प्रदान करता है। पिक्सल अतुल्यकालिक रूप से काम करते हैं (नियमित सीएमओएस कैमरों की तरह तैयार नहीं) और बहुत अधिक गति से क्योंकि उन्हें पारंपरिक फ्रेम-आधारित कैमरे की तरह फोटॉन को एकीकृत करने की आवश्यकता नहीं होती है और डेटा के रीडआउट से पहले पूरे फ्रेम के समाप्त होने की प्रतीक्षा करते हैं। फायदे महत्वपूर्ण हैं - कम डेटा बैंडविड्थ, निर्णय विलंबता, भंडारण और बिजली की खपत। कंपनी के पहले वाणिज्यिक-ग्रेड वीजीए इवेंट-आधारित विजन सेंसर में एक उच्च गतिशील रेंज (>120 डीबी), कम बिजली की खपत (सेंसर स्तर पर 26 मेगावाट या 3 एनडब्ल्यू/ईवेंट) शामिल है। उद्योग-अग्रणी पिक्सेल आकार (<5 माइक्रोन) के साथ एक एचडी (हाई डेफिनिशन) संस्करण (सोनी के साथ संयुक्त रूप से विकसित) भी लॉन्च किया गया है।

विज्ञापन

ये सेंसर मेटाविजन® सेंसिंग प्लेटफॉर्म का मूल रूप हैं, जो स्वायत्तता अनुप्रयोगों के लिए स्मार्ट और कुशल धारणा प्रदान करने के लिए एआई का उपयोग करता है और परिवहन क्षेत्र में कई कंपनियों द्वारा मूल्यांकन के अधीन है। AV और ADAS के लिए अग्रगामी धारणा के अलावा, Prophesee सक्रिय रूप से L2 और L3 अनुप्रयोगों के लिए ड्राइवर की इन-केबिन निगरानी के लिए ग्राहकों के साथ जुड़ा हुआ है, चित्र 4 देखें:

ऑटोमोटिव अवसर आकर्षक हैं, लेकिन डिजाइन-इन चक्र लंबे हैं। पिछले दो वर्षों में, Prophesee ने औद्योगिक अनुप्रयोगों के लिए मशीन विज़न स्पेस में महत्वपूर्ण रुचि और कर्षण देखा है। इनमें हाई-स्पीड काउंटिंग, सरफेस इंस्पेक्शन और वाइब्रेशन मॉनिटरिंग शामिल हैं।

विज्ञापन

भविष्यवक्ता ने हाल ही में सहयोग की घोषणा की औद्योगिक स्वचालन, रोबोटिक्स, ऑटोमोटिव और IoT (इंटरनेट ऑफ थिंग्स) में अवसरों का फायदा उठाने के लिए मशीन विजन सिस्टम के अग्रणी डेवलपर्स के साथ। अन्य तात्कालिक अवसर मोबाइल फोन और एआर/वीआर एप्लिकेशन के लिए इमेज ब्लर करेक्शन हैं। ये लंबे समय तक ADAS/AV अवसरों के लिए उपयोग किए जाने वाले सेंसर की तुलना में कम प्रारूप वाले सेंसर का उपयोग करते हैं, और भी कम बिजली की खपत करते हैं, और काफी कम विलंबता के साथ काम करते हैं।


महत्वपूर्ण उद्यम निवेश और एक सक्रिय स्टार्ट-अप वातावरण के साथ, इज़राइल उच्च प्रौद्योगिकी में एक अग्रणी नवप्रवर्तनक है। 2015 के बाद से, प्रौद्योगिकी क्षेत्र में उद्यम के नेतृत्व वाले निवेश में लगभग $70B हुआ है. इसका एक हिस्सा कंप्यूटर विजन के क्षेत्र में है। Mobileye ने 1999 में इस क्रांति का नेतृत्व किया, जब हिब्रू विश्वविद्यालय के एक प्रमुख AI शोधकर्ता अम्नोन शशुआ ने ADAS और AV के लिए कैमरा-आधारित धारणा पर ध्यान केंद्रित करने के लिए कंपनी की स्थापना की। कंपनी ने 2014 में आईपीओ के लिए आवेदन किया था और इंटेल द्वारा अधिग्रहित किया गया थाINTC
2017 में $15B के लिए। आज, यह आसानी से कंप्यूटर विज़न और AV डोमेन में अग्रणी खिलाड़ी है और हाल ही में आईपीओ के लिए फाइल करने के अपने इरादे की घोषणा की और एक स्वतंत्र इकाई बनें। Mobileye का राजस्व $1.4B/वर्ष और मामूली नुकसान ($75M) था। यह 50 ऑटोमोटिव ओईएम को कंप्यूटर विज़न क्षमताएं प्रदान करता है जो इसे ADAS क्षमताओं के लिए 800 कार मॉडल में तैनात करते हैं। भविष्य में, वे इंटेल के सिलिकॉन फोटोनिक्स प्लेटफॉर्म पर आधारित इस कंप्यूटर विज़न विशेषज्ञता और LiDAR क्षमताओं का उपयोग करके L4 वाहन स्वायत्तता (ड्राइवर की आवश्यकता नहीं) में नेतृत्व करने का इरादा रखते हैं। जब वे अंततः सार्वजनिक हो जाते हैं तो Mobileye का मूल्यांकन ~$50B होने का अनुमान है।

विज्ञापन

चैपल कैपिटल, जेरूसलम में स्थित, परिवहन और कृषि से लेकर सुरक्षा और सुरक्षा तक के विविध अनुप्रयोगों के लिए कंप्यूटर विज़न पर आधारित उत्पादों को विकसित करने वाली कंपनियों में निवेश करने में सबसे आगे है। Amir Weitman एक सह-संस्थापक और प्रबंध भागीदार है और उसने 2017 में अपनी उद्यम कंपनी शुरू की। पहले फंड ने 20 कंपनियों में $14M का निवेश किया। उनका एक निवेश इनोविज़ में था, जो 2018 में SPAC विलय के माध्यम से सार्वजनिक हुआ और एक LiDAR गेंडा बन गया। ओमर कीलाफ के नेतृत्व में (जो इज़राइल रक्षा बल की खुफिया कोर की प्रौद्योगिकी इकाई से सम्मानित थे), कंपनी आज ADAS और AV के लिए LiDAR परिनियोजन में अग्रणी है, बीएमडब्ल्यू और वोक्सवैगन में कई डिज़ाइन जीत के साथ।

चैम्पेल कैपिटल का दूसरा फंड (इम्पैक्ट डीप टेक फंड II) जनवरी 2022 में शुरू किया गया था और अब तक 30 मिलियन डॉलर जुटा चुका है (100 के अंत तक लक्ष्य 2022 मिलियन डॉलर है)। कंप्यूटर विज़न पर एक प्रमुख फोकस है, जिसमें पांच कंपनियों में $ 12M तैनात है। इनमें से तीन परिवहन और रोबोटिक्स के लिए कंप्यूटर विज़न का उपयोग करते हैं।

टंकू, हाइफ़ा में स्थित, ने 2018 में परिचालन शुरू किया और फंडिंग में $ 10M जुटाया। डैन वाल्धॉर्न सीईओ हैं और यूनिट 8200 से स्नातक हैं, जो सिग्नल इंटेलिजेंस और कोड डिक्रिप्शन के लिए जिम्मेदार इजरायली रक्षा बल के भीतर एक कुलीन उच्च तकनीक समूह है। TankU के SaaS (एक सेवा के रूप में सॉफ़्टवेयर) उत्पाद वाहनों और ड्राइवरों की सेवा करने वाले जटिल बाहरी वातावरण में प्रक्रियाओं को स्वचालित और सुरक्षित करते हैं। स्वचालित वित्तीय लेनदेन में चोरी और धोखाधड़ी को रोकने के लिए इन उत्पादों का उपयोग वाहन बेड़े, निजी कारों, ईंधन और इलेक्ट्रिक चार्जिंग स्टेशनों के मालिकों द्वारा किया जाता है। वाहन ईंधन सेवाएं सालाना वैश्विक राजस्व में ~$2T उत्पन्न करती हैं, जिनमें से निजी और वाणिज्यिक वाहन बेड़े के मालिक 40% या $800B का उपभोग करते हैं। खुदरा विक्रेताओं और बेड़े के मालिकों को चोरी और धोखाधड़ी के कारण सालाना ~$100B का नुकसान होता है (उदाहरण के लिए, अनधिकृत निजी वाहनों के लिए फ्लीट फ्यूल कार्ड का उपयोग करना)। सीएनपी (कार्ड मौजूद नहीं है) धोखाधड़ी और छेड़छाड़/चोरी ईंधन नुकसान के अतिरिक्त स्रोत हैं, खासकर भुगतान के लिए मोबाइल ऐप में चोरी हुए कार्ड विवरण का उपयोग करते समय।

विज्ञापन

कंपनी का टीयूफ्यूल उत्पाद एक-टैप सुरक्षित भुगतान की सुविधा देता है, अधिकांश प्रकार की धोखाधड़ी को रोकता है और धोखाधड़ी का संदेह होने पर ग्राहकों को सचेत करता है। यह इन सुविधाओं और डिजिटल लेनदेन डेटा (पीओएस और अन्य बैक-एंड डेटा सहित) में मौजूदा सीसीटीवी से डेटा पर प्रशिक्षित एआई इंजन के आधार पर करता है। धोखाधड़ी का पता लगाने के लिए वाहन प्रक्षेपवक्र और गतिशीलता, वाहन आईडी, यात्रा का समय, माइलेज, ईंधन भरने का समय, ईंधन की मात्रा, ईंधन इतिहास और चालक व्यवहार जैसे पैरामीटर कुछ विशेषताओं की निगरानी की जाती है। यह डेटा खुदरा विक्रेताओं को साइट संचालन को अनुकूलित करने, ग्राहकों की वफादारी बढ़ाने और दृष्टि-आधारित मार्केटिंग टूल को तैनात करने में भी मदद करता है। सीईओ डैन वाल्धॉर्न के अनुसार, उनका समाधान 70% बेड़े, 90% क्रेडिट-कार्ड और 70% छेड़छाड़ से संबंधित धोखाधड़ी की घटनाओं का पता लगाता है।

सोनोल एक ऊर्जा सेवा कंपनी है जो पूरे इज़राइल में 240 स्टेशनों और सुविधा स्टोरों के नेटवर्क का स्वामित्व और संचालन करती है। टीयूफ्यूल को उनकी साइटों पर तैनात किया गया है और इसने बढ़ी हुई सुरक्षा, धोखाधड़ी की रोकथाम और ग्राहक वफादारी का प्रदर्शन किया है। गैस स्टेशनों और सुविधा स्टोर उपकरणों के एक प्रमुख वैश्विक आपूर्तिकर्ता के सहयोग से अमेरिका में उत्पाद परीक्षण चल रहे हैं। इसी तरह की पहल अफ्रीका और यूरोप में भी चल रही है।

विज्ञापन

तेल-अवीव-आधारित आईटीसी बेन-गुरियन यूनिवर्सिटी के मशीन लर्निंग एकेडमिक्स द्वारा 2019 में स्थापित किया गया था। आईटीसी सास उत्पाद बनाती है कि "यातायात प्रवाह को मापें, भीड़भाड़ की भविष्यवाणी करें और ट्रैफिक लाइट के स्मार्ट हेरफेर के माध्यम से इसे कम करें - जाम शुरू होने से पहले।" TankU के समान, यह लाइव ट्रैफिक डेटा प्राप्त करने के लिए ऑफ-द-शेल्फ कैमरों (पहले से ही कई ट्रैफिक चौराहों पर स्थापित) से डेटा का उपयोग करता है। एक शहर भर के हजारों कैमरों के डेटा का विश्लेषण किया जाता है, और वाहन के प्रकार, गति, गति की दिशा और वाहन के प्रकारों (ट्रकों बनाम कारों) के अनुक्रम जैसे मापदंडों को मालिकाना एआई एल्गोरिदम के अनुप्रयोग के माध्यम से निकाला जाता है। सिमुलेशन 30 मिनट पहले तक ट्रैफ़िक प्रवाह और संभावित ट्रैफ़िक जाम स्थितियों का अनुमान लगाते हैं। ट्रैफिक के प्रवाह को सुचारू बनाने और जाम को रोकने के लिए इन परिणामों का उपयोग करके ट्रैफिक लाइट को समायोजित किया जाता है।

एआई सिस्टम को प्रशिक्षित करने में एक विशिष्ट शहर में एक महीने का दृश्य डेटा लगता है और इसमें पर्यवेक्षित और अनुपयोगी शिक्षा का संयोजन शामिल होता है। ITC का समाधान पहले से ही तेल-अवीव (25 में दुनिया के सबसे भीड़भाड़ वाले शहरों में 2020 वें स्थान पर) में तैनात है, जिसमें ट्रैफिक लाइट द्वारा नियंत्रित सैकड़ों चौराहों पर हजारों कैमरे तैनात हैं। ITC का सिस्टम वर्तमान में 75K वाहनों का प्रबंधन करता है, जिसके बढ़ते रहने की उम्मीद है। कंपनी एक स्थापित कर रही है में समान क्षमता लक्जमबर्ग और प्रमुख अमेरिकी शहरों में परीक्षण शुरू कर रहा है। वैश्विक स्तर पर, इसका समाधान इजरायल, अमेरिका, ब्राजील और ऑस्ट्रेलिया में परिचालन साइटों के साथ 300,000 वाहनों का प्रबंधन करता है। डीविर केनिग, सीटीओ, इस समस्या को हल करने के लिए भावुक हैं - लोगों को व्यक्तिगत समय वापस देना, ग्रीनहाउस गैसों को कम करना, समग्र उत्पादकता में वृद्धि करना और सबसे महत्वपूर्ण बात, भीड़भाड़ वाले चौराहों पर दुर्घटनाओं को कम करना। श्री केनिग के अनुसार, "हमारी तैनाती ट्रैफिक जाम में 30% की कमी दर्शाती है, अनुत्पादक ड्राइविंग समय, तनाव, ईंधन की खपत और प्रदूषण को कम करती है।"

विज्ञापन

इंडोर रोबोटिक्स था 2018 में स्थापित और हाल ही में फंडिंग में 18 मिलियन डॉलर जुटाए. तेल-अवीव, इज़राइल के पास स्थित कंपनी, इनडोर सुरक्षा, सुरक्षा और रखरखाव निगरानी के लिए स्वायत्त ड्रोन समाधान विकसित और बेचती है। सीईओ और सह-संस्थापक, डोरोन बेन-डेविड के पास आईएआई में महत्वपूर्ण रोबोटिक्स और वैमानिकी का अनुभव है।आइएआइ
(एक प्रमुख रक्षा प्रधान ठेकेदार) और MAFAT (इजरायल के रक्षा मंत्रालय के भीतर एक उन्नत अनुसंधान संगठन), जो संयुक्त राज्य अमेरिका में DARPA के समान है। स्मार्ट भवनों और वाणिज्यिक सुरक्षा बाजारों में बढ़ते निवेश ने स्वायत्त प्रणालियों की आवश्यकता को बढ़ावा दिया है जो छोटे और बड़े आंतरिक वाणिज्यिक स्थानों (कार्यालयों, डेटा केंद्रों, गोदामों और खुदरा स्थानों) में कंप्यूटर दृष्टि और अन्य संवेदी आदानों का उपयोग कर सकते हैं। इंडोर रोबोटिक्स ऑफ-द-शेल्फ कैमरों और थर्मल और इंफ्रारेड रेंज सेंसर से लैस इनडोर ड्रोन का उपयोग करके इस बाजार को लक्षित करता है।

ओफिर बार-लेवव मुख्य व्यवसाय अधिकारी हैं। वह बताते हैं कि जीपीएस की कमी ने इनडोर ड्रोन को इमारतों के अंदर खुद को स्थानीयकृत करने से रोक दिया है (आमतौर पर जीपीएस से वंचित या गलत)। इसके अतिरिक्त, सुविधाजनक और कुशल डॉकिंग और पॉवरिंग समाधानों की कमी थी। इंडोर रोबोटिक्स इसे चार ड्रोन-माउंटेड कैमरों (ऊपर, नीचे, बाएं, दाएं) और सरल रेंज सेंसर के साथ संबोधित करता है जो एक इनडोर स्थान और इसकी सामग्री को सटीक रूप से मैप करता है। कैमरा डेटा (कैमरे स्थानीयकरण और मैपिंग डेटा प्रदान करते हैं) और थर्मल सेंसर (ड्रोन पर भी लगाए गए) का विश्लेषण एआई सिस्टम द्वारा संभावित सुरक्षा, सुरक्षा और रखरखाव के मुद्दों का पता लगाने और ग्राहक को सावधान करने के लिए किया जाता है। ड्रोन खुद को सीलिंग-माउंटेड "डॉकिंग टाइल" के माध्यम से शक्ति देते हैं, जो मूल्यवान फर्श की जगह बचाता है और चार्ज करते समय डेटा संग्रह की अनुमति देता है। इन सांसारिक प्रक्रियाओं को स्वचालित करने के वित्तीय लाभ जहां भर्ती, प्रतिधारण और प्रशिक्षण के मामले में मानव श्रम जटिल और महंगा है, स्पष्ट है। एरियल ड्रोन बनाम ग्राउंड-आधारित रोबोट का उपयोग करने से पूंजी और परिचालन लागत, फर्श की जगह का बेहतर उपयोग, बाधाओं का सामना किए बिना स्थानांतरित करने की स्वतंत्रता और कैमरा डेटा कैप्चर की दक्षता के मामले में भी महत्वपूर्ण लाभ हैं। श्री बार-लेवाव के अनुसार, इंडोर रोबोटिक्स का टैम (टोटल एड्रेसेबल मार्केट) 80 तक इनडोर इंटेलिजेंट सुरक्षा प्रणालियों में $2026B हो जाएगा। प्रमुख ग्राहक स्थानों में आज प्रमुख वैश्विक निगमों के गोदाम, डेटा केंद्र और कार्यालय परिसर शामिल हैं।

विज्ञापन


कंप्यूटर विज़न स्वायत्तता के खेल में क्रांति ला रहा है - मूवमेंट ऑटोमेशन, सुरक्षा, स्मार्ट बिल्डिंग मॉनिटरिंग, फ्रॉड डिटेक्शन और ट्रैफिक मैनेजमेंट में। सेमीकंडक्टर्स और एआई की शक्ति शक्तिशाली प्रवर्तक हैं। एक बार जब कंप्यूटर इस अविश्वसनीय संवेदी तौर-तरीकों को एक स्केलेबल फैशन में महारत हासिल कर लेते हैं, तो संभावनाएं अनंत होती हैं।

स्रोत: https://www.forbes.com/sites/sabbirrangwala/2022/10/04/advances-in-computer-vision-propel-transportation-autonomy/