विश्व कप फुटबॉल में ऑफसाइड का पता लगाने के लिए एआई की मदद
२ दिसम्बर २०२२मौजूदा फुटबॉल विश्व कप में रेफरियों को ऑफसाइड की कॉल देने में मदद के लिए फीफा, नयी आर्टिफिशियल इंटेलिजेंस का इस्तेमाल कर रहा है.
इस सिस्टम को कहा जाता है, सेमी-ऑटोमेटड ऑफसाइड टेक्नोलजी (एसएओटी). इसमें 12 कैमरे स्टेडियम की छत पर लगे होते हैं जो गेंद और हर खिलाड़ी की गतिविधि को ट्रैक करते हैं.
एसएओटी एआई की मदद से खिलाड़ियों और गेंद को पहचान लेती है और उन्हें ट्रैक करती है. मैदान पर उनकी पोजीशन की गणना भी एक सेंकड में 50 बार कर लेती है.
कतर विश्व कप की गेंद को अल रिहाला नाम दिया गया है. अरबी में इसका मतलब है सफ़र. गेंद पर एक सेंसर लगाया गया है जिसकी मदद से एसएओटी उस पर लगी किक के सटीक पल को पकड़ लेती है और उसकी तुलना टीम के आखिरी डिफेंडर की पोजीशन और विपक्षी टीम के स्ट्राइकर की पोजीशन से करती है.
ऑफसाइड की शिनाख्त में अपग्रेड
सुनिश्चितता का ये स्तर बहुत ज्यादा टाइट यानी पेचीदा स्थितियों में बड़ा काम आता है जिसमें रेफरियों के लिए फौरन ऑफसाइड की कॉल दे पाना मुश्किल हो जाता है. कभी कभी तो गोल हो जाने की स्थिति में पूरे मैच का नतीजा उस एक फैसले पर निर्भर करता है.
ये नयी तकनीक जब भी ऑफसाइड की शिनाख्त करती है, तो वीडियो मैच अधिकारियों को अलर्ट चला जाता है. वे रेफरी को सूचित कर देते हैं, जो उस पर अंतिम निर्णय देते हैं. इसीलिए इस सिस्टम को सेमी-ऑटोमेटड यानी अर्ध-स्वचालित कहा गया है.
आम फुटबॉल मैचों में, वीडियो असिस्टेंट रेफरी (वीएआर) का इस्तेमाल किया जाता है. ऑफसाइड को पकड़ पाने में उन्हें 70 सेकंड लगते हैं. ये समय एसएओटी से काफी ज्यादा है.
तकनीक की मदद से अधिकारियों को, गेंद पर किक लगने का एकदम सही क्षण पता लगाना होता था और ऑफसाइड लाइन खुद ही खींचनी पड़ती थी. एसएओटी में उन्हें सिर्फ सिस्टम के सुझाए ऑफसाइड की तस्दीक करनी होती है.
फीफा की वेबसाइट के मुताबिक ये नयी प्रक्रिया, "चंद सेकंड में पूरी हो जाती है, इसका मतलब ये है कि ऑफसाइड के निर्णय ज्यादा तेजी से और ज्यादा सटीक ढंग से किए जा सकते हैं."
अगर रेफरी एसएओटी के सुझाव को मान लेते हैं तो सिस्टम, स्टेडियम में लगी विशाल स्क्रीन पर ऑफसाइड प्रसारण का 3डी एनीमेशन तैयार कर देता है जिस पर दर्शक देख सकते हैं कि ऑफसाइड की कॉल क्यों सही थी.
एसएओटी सिस्टम का परीक्षण तीन साल तक किया गया और फीफा के मुताबिक अब ये "वीडियो मैच अधिकारियों को उपलब्ध सबसे ज्यादा सटीक ऑफसाइड सपोर्ट सिस्टम बन गया है.
चीजों की शिनाख्तः एक पेचीदा काम
किसी वीडियो फुटेज का आशय निकालना यानी उसमें से कीमती सूचना को निकालने को वीडियो एनालिसिस यानी वीडियो विश्लेषण कहा जाता है. इस काम से जुड़ी आर्टिफिशियल इंटेलिजेंस की सबफील्ड को कम्प्यूटर विजन कहते हैं.
मान लीजिए, आप एक कम्प्यूटर हैं और आप इंसानों के देखने के ढंग से नहीं देख पाते हैं. आपकी आंखों के बदले डिजिटल कैमरे लगे हैं जो प्रकाश ग्रहण करते हैं और उस सूचना को डाटा में बदल देते हैं. डाटा आपको बताता है कि प्रत्येक फ्रेम की प्रत्येक पिक्सल कैसी दिखती है- मिसाल के लिए, प्रत्येक पिक्सल में हरा रंग कितना है, लाल कितना और नीला कितना.
ये डाटा आमतौर पर मूल्यों के एक विशाल टेबिल की तरह है. जैसे कि, 1080पी वीडियो का हरेक फ्रेम 1920x1080 पिक्सलों का होता है, यानी उसकी हरेक रो (क्षैतिज कतार) में 1920 पिक्सल होंगे और हरेक कॉलम (उर्ध्वाधर कतार) में 1080 पिक्सल.
आप इससे क्या समझे? जी हां, आर्टिफिशियल इंटेलिजेंस की दुनिया में ये सबसे ज्वलंत मुद्दों में से एक है- किसी ऑबजेक्ट का डिटेक्ट करना यानी उसकी शिनाख्त कर पाना और उसे ट्रैक करना.
कम्प्यूटर लोगों और चीजों को कैसे पहचानते हैं
डाटा वैज्ञानिकों ने इस समस्या से निपटने के लिए अलग अलग तकनीके विकसित की हैं. इनमें से एक तकनीक, कान्वलूश्नल न्यूरल नेटवर्क (सीएनएन) यानी घुमावदार स्नायु संजाल कहलाती है. आप देख सकते हैं कि इस वेबसाइट पर ये प्रक्रिया किस तरह दिखती है. इस वेबसाइट को अमेरिका की स्टेनफोर्ड यूनिवर्सिटी में पोस्टडॉक्टोरल शोधकर्ता एडम हार्ले ने बनाया है.
सीएनएन चीजों की परत दर परत शिनाख्त करता है. इसे ऐसे भी समझा जा सकता है जैसे कि एक घोर अंधेरे कमरे में किसी चीज़ को टटोल कर देखने की कोशिश करने की प्रक्रिया होती है.
अपने हाथ से आप चीज को महसूस करते हैं, कई सारे सवाल पूछते हैं जो आगे चलकर विशिष्ट होते जाते हैं. पहले आप सोचते हैं, "ये सख्त है या मुलायम?"
आप उस चीज को दबाते हैं और महसूस करते हैं कि कुछ जगहों पर वो सख्त है और बाकी जगहों पर मुलायम. ये हरकत, चीज के बारे में आपकी समझ को बदल देती हैः अब आपके पास पर्याप्त सूचना है ये जानने के लिए कि ये कोई ऐसी चीज़ है जो मुलायम भी और कड़ी भी. ये ज्ञान उस शिनाख्त की पहली "परत" का प्रतिनिधित्व करता है. सीएनएन में इसे "घुमावदार" कहा जाएगा.
पहली परत का पता लगा लेने के बाद, आप और सवाल पूछेंगे- कि चीज का टेक्सचर यानी गठन कैसा है, वो कितनी बड़ी है और उसका आकार क्या है. इन तमाम सवालों के जवाब मिलते मिलते दूसरी परत बन जाती है और आपके सामने पड़ी चीज के बारे में आपकी कुल समझ बढ़ने लगती है. सीएनन भी कमोबेश इसी तरह काम करता है.
किसी बिंदु पर, आपके पास ये अंदाजा लगाने लायक पर्याप्त सूचना जमा हो जाएगी कि ये चीज है क्या. आपने ये जानकारी जुटा ली है कि चीज रोएदार है, उसके चार पांव है और कान उसके सिर के पास से निकले हुए हैं. क्या वो बिल्ली है? इस समय तक, सीएनएन पूछ लेगाः क्या ये कोई खिलाड़ी? या एक गेंद है?
वस्तु की पहचान
अनुमान लगाने लायक एक बार पर्याप्त सूचना जमा हो जाए तो, ज्ञात चीजों के साथ कम्प्यूटर की हाइपोथेसिस यानी परिकल्पना को क्रॉस चेक करने के लिए वर्गीकरण प्रक्रिया का इस्तेमाल किया जाएगा.
एसएओटी जैसी आर्टिफिशियल इंटेलिजेंस को आमतौर पर उन तमाम चीजों के विशाल वीडियो डाटाबेस के लिए प्रशिक्षित किया जाता है जिनकी शिनाख्त इंसान पहले ही कर चुके हैं.
इस मामले में, मिसाल के लिए, मैदान पर फुटबॉल के खिलाड़ियों को रखा जा सकता है. उसी की बदौलत आर्टिफिशियल इंटेलिजेंस ये सीख लेती है कि खिलाड़ी कैसे दिखते हैं. सघन ट्रेनिंग के बाद, ये तकनीक खिलाड़ियों की आसानी और शीघ्रता से पहचान कर उन्हें ट्रैक कर लेती है.
रिपोर्टः एस्तेबान पार्दो