होम खेल कितनी खराब एनालिटिक्स ने टोटेनहम टीम बनाई जो पदावनति की ओर बढ़...

कितनी खराब एनालिटिक्स ने टोटेनहम टीम बनाई जो पदावनति की ओर बढ़ रही है

53
0

माइकल लुईस की “मनीबॉल” में एक मजेदार, शिक्षाप्रद छोटी सी कहानी है जिसे किसी को याद नहीं है क्योंकि इसमें बिली बीन शामिल नहीं है और इसलिए इसे ब्रैड पिट द्वारा कभी भी फिल्म स्क्रीन पर दोबारा नहीं बनाया गया।

1970 के दशक के अंत या 80 के दशक की शुरुआत में, ह्यूस्टन एस्ट्रोस ने इस बारे में एक अध्ययन शुरू किया कि अगर वे आउटफील्ड बाड़ को होम प्लेट के करीब ले जाते हैं तो उनकी टीम के प्रदर्शन पर क्या असर पड़ सकता है। वे बाड़ को अंदर ले जाना चाहते थे क्योंकि उन्हें लगा कि इससे अधिक होम रन होंगे, और क्योंकि प्रशंसकों को होम रन पसंद है, उन्होंने सोचा कि वे अधिक टिकट बेचेंगे। सिवाय, ह्यूस्टन के रोस्टर पर हिटर और पिचर्स के प्रकार को देखते हुए, अध्ययन के लेखकों ने पाया, बाड़ को अंदर ले जाने से वास्तव में एस्ट्रो के लिए अधिक नुकसान होगा।

इसलिए, ह्यूस्टन के निर्णय निर्माताओं ने डेटा को देखा, और उन्होंने निर्णय लिया… यह आदेश दिया जाए कि अध्ययन को कभी भी सार्वजनिक नहीं किया जाए। उन्होंने पहले ही बाड़ हटाने का निर्णय ले लिया था और वे केवल वही डेटा चाहते थे जो उनकी पसंद का समर्थन कर सके।

मुझे एक पेशेवर फ़ुटबॉल क्लब के बारे में ऐसी ही कहानी किसी ऐसे व्यक्ति द्वारा बताई गई थी जो इस उद्योग में एक दशक से अधिक समय से काम कर रहा है। टीम ने उन्हें तीन अलग-अलग खिलाड़ियों के लिए स्काउटिंग रिपोर्ट तैयार करने का काम सौंपा। उन्होंने प्रत्येक खिलाड़ी के बारे में विस्तार से बताया, और प्रत्येक के लिए उनका निष्कर्ष एक ही था: आप इनमें से किसी भी खिलाड़ी पर हस्ताक्षर नहीं करना चाहते हैं। क्लब ने जवाब में उससे पूछा कि क्या वह भेजने में सक्षम है सकारात्मक प्रत्येक खिलाड़ी के लिए स्काउटिंग रिपोर्ट; वे पहले से ही उन सभी पर हस्ताक्षर करने के लिए प्रतिबद्ध थे।

दोनों कहानियों में, संगठन डेटा का उपयोग करना चाहते थे, लेकिन बेहतर निर्णय नहीं लेना चाहते थे। वे चाहते थे कि यह उनके द्वारा पहले ही लिए गए निर्णयों को उचित ठहराए।


चैंपियंस लीग न खेलने से पीएल टीमों को बढ़ावा क्यों मिल सकता है?
सेट-पीस लक्ष्यों के बिना प्रीमियर लीग: तालिका कैसी दिखेगी?
2026 विश्व कप टीमों की रैंकिंग: सभी 48 राष्ट्रीय टीमें


अब ये साधारण समय की कहानियाँ लग सकती हैं। लगभग हर बेसबॉल टीम को जनता की पहुंच से कहीं अधिक उन्नत विश्लेषणात्मक मॉडल के साथ चलाया जा रहा है। और सॉकर डेटा अब हर जगह है; अमेज़ॅन बुंडेसलीगा प्रसारण को शक्ति प्रदान कर रहा है और “अपेक्षित लक्ष्य” लगभग हर अंग्रेजी भाषा के प्रसारक के लिए आम भाषा का हिस्सा बन गए हैं।

फिर भी, जबकि बेसबॉल टीमें ज्यादातर अपने अंतर्निहित पूर्वाग्रहों को दोहराने और उचित ठहराने के लिए संख्याओं का उपयोग करने से आगे बढ़ गई हैं, सॉकर क्लब ऐसा नहीं कर पाए हैं। वे अभी भी करीब नहीं हैं. मुझ पर विश्वास नहीं है? आपको बस उस टीम पर एक नजर डालनी है, जो कथित तौर पर अपने प्रशंसकों को यह बताने पर विचार कर रही थी कि उसने “एक आधुनिक फुटबॉल क्लब क्या हो सकता है, इसे फिर से परिभाषित किया है।”

दूसरे शब्दों में, आपको बस टोटेनहम हॉटस्पर को देखना है।

फ़ुटबॉल कैसे काम करता है इसके बारे में हम क्या जानते हैं

शायद फ़ुटबॉल के विश्लेषण आंदोलन की मूल अंतर्दृष्टि कुछ ऐसी है जिसे हर कोई पहले से ही जानता है: सर्वश्रेष्ठ टीम हमेशा नहीं जीतती है।

यह मूलतः वही है जो अपेक्षित लक्ष्य हमें बताते हैं। किसी दिए गए सीज़न में लगभग किसी भी बिंदु पर, किसी टीम का अपेक्षित-गोल अंतर किसी भी अन्य शीर्ष-स्तरीय संख्या जैसे शॉट्स, गोल या अंक की तुलना में भविष्य के प्रदर्शन का बेहतर भविष्यवक्ता होता है। यदि सर्वश्रेष्ठ टीम हमेशा जीतती है, तो पिछली जीतें हमें तुरंत बता देंगी कि सर्वश्रेष्ठ टीमें कौन हैं, और फिर वे पिछली जीतें भविष्य की भविष्यवाणी करेंगी।

इसके बजाय, ऐसा प्रतीत होता है कि सर्वश्रेष्ठ टीमें वे टीमें हैं जो अपने मैचों में अपेक्षित लक्ष्यों का सबसे बड़ा अनुपात अर्जित करती हैं। यदि हम उस विचार को एक निरंतर अद्यतन होने वाले एल्गोरिदम के अमूर्त से परे सरल बनाते हैं जो किसी दिए गए मैच में प्रत्येक प्रयास को एक विशिष्ट रूपांतरण संभावना प्रदान करता है, तो सर्वश्रेष्ठ टीमें बस वे टीमें होती हैं जो अपने विरोधियों की तुलना में बेहतर मौके बनाती हैं।

यह कुछ ऐसा है जिसे जिसने भी लंबे समय तक खेल खेला है या देखा है, वह वास्तव में गहरे स्तर पर समझता है – चाहे वे इसे स्वीकार करने के इच्छुक हों या नहीं। लेकिन इसे स्वीकार करते हुए, हम यह स्वीकार कर रहे हैं कि किसी दिए गए फुटबॉल मैच के परिणाम में बड़ी मात्रा में यादृच्छिकता निहित है, क्योंकि मैदान पर एक व्यक्ति को अपने हाथों का उपयोग करने की अनुमति है, जिसके पास एक विकृत पैर के साथ उछलती हुई गेंद को किक करने में बड़ी मात्रा में यादृच्छिकता निहित है।

अब, प्रीमियर लीग सीज़न इतना लंबा नहीं है, और प्रत्येक सीज़न में 20 अलग-अलग टीम-स्तरीय प्रयोग होते हैं। तो एक दशक में, हमें 200 अलग-अलग छोटे प्रयोग मिलते हैं। और इन 200 अलग-अलग सीज़न में, हम उम्मीद करेंगे कि ऐसे कुछ उदाहरण होंगे जहां यादृच्छिकता पूरे सीज़न के लिए एक टीम को बढ़ावा देती है, या दंडित करती है।

यह वही है जो हम देखते हैं। यहां 2010 के बाद से प्रत्येक प्रीमियर लीग सीज़न को इस आधार पर व्यवस्थित किया गया है कि किसी टीम ने अपने xG अंतर से कितना कम प्रदर्शन किया या कितना अधिक प्रदर्शन किया:

2016-17 में दाहिनी ओर वह टीम टोटेनहम है। और यदि आपको सुदूर बाएं स्थान पर कब्जा करने के लिए किसी को चुनना हो, तो 2025-26 में टोटेनहम एक बहुत अच्छा विकल्प प्रतीत होगा, है ना? दुनिया की 10 सबसे अमीर टीमों में से एक के लिए सीज़न में छह गेम बचे होने के बावजूद पदावनति की लड़ाई में, निश्चित रूप से “ऐतिहासिक रूप से बुरी किस्मत” को एक भूमिका निभानी होगी?

नहीं। वह 2023-24 में शेफ़ील्ड यूनाइटेड है।

इस सीज़न में टोटेनहम बिल्कुल भी पीछे नहीं है। उनका लक्ष्य अंतर (माइनस-11) वास्तव में उनके xG अंतर (माइनस-15.13) से थोड़ा बेहतर है, लेकिन उतना नहीं।

तो फिर, दुनिया की नौवीं सबसे मूल्यवान टीम वाली टीम वास्तव में प्रीमियर लीग की सबसे खराब टीमों में से एक कैसे बन जाती है? एक संभावना: आप उन चीजों को मापते हैं जो आप हैं सोचना मामला – और वे चीजें नहीं जो वास्तव में मायने रखती हैं।

टोटेनहम का प्रमुख मुद्दा: वे पास नहीं हो सकते

आमतौर पर, फुटबॉल एक जटिल, गतिशील खेल है जहां रोस्टर निर्माण, प्रबंधकीय निर्देशों और ऑन-फील्ड इंटरैक्शन की अन्योन्याश्रितताओं से व्यक्तिगत गुणों को निकालना असंभव है। लेकिन कभी-कभी आपको टोटेनहम जैसी टीम मिलती है, जहां निदान बहुत सरल है: ये लोग पास नहीं हो सकते।

ग्रैडिएंट स्पोर्ट्स में, ऐसे लोगों की एक टीम है जो प्रत्येक प्रीमियर लीग खेल को देखती है और खिलाड़ी द्वारा किए गए प्रत्येक पास को माइनस-2 से प्लस-2 स्केल पर ग्रेड करती है। यहां बताया गया है कि वे इस प्रक्रिया का वर्णन कैसे करते हैं:

उदाहरण के लिए, एक सेंटर-बैक द्वारा गेंद को आधी लाइन पर पास करने पर विचार करें। एक खुली टीम के साथी को नियमित, बिना दबाव वाले पास पर 0 मिलेगा, क्योंकि यह हमारी विशेषज्ञ ग्रेडिंग टीम की अपेक्षाओं को पूरा करता है। दबाव में एक सटीक, लाइन-ब्रेकिंग पास को सकारात्मक ग्रेड प्राप्त होगा। इसके विपरीत, किसी टीम के साथी को दिया गया अंडरहिट पास – भले ही पूरा हो गया हो – अपेक्षित मानक से कम होने पर उसे नकारात्मक ग्रेड प्राप्त होगा। यह केवल परिणामों के बजाय प्रदर्शन के मूल्यांकन पर हमारे ध्यान को दर्शाता है।

ग्रेडिंग प्रक्रिया व्यक्तिपरकता को कम करने और स्थिरता सुनिश्चित करने के लिए डिज़ाइन किए गए विस्तृत ढांचे द्वारा निर्देशित होती है। एक बार कच्चे ग्रेड एकत्र हो जाने के बाद, वे गुणवत्ता नियंत्रण की कई परतों से गुजरते हैं, जिसमें चिह्नित कार्यों की वरिष्ठ समीक्षा, स्थिरता जांच, चल रहे विश्लेषण और समर्पित गुणवत्ता आश्वासन प्रक्रियाएं शामिल हैं।

पासिंग के मूल्यांकन की इस प्रक्रिया के आधार पर, प्रीमियर लीग सीज़न में टोटेनहम के पांच सर्वश्रेष्ठ पासर्स की रैंकिंग इस प्रकार है:

1. क्रिस्टियन रोमेरो: 19 वीं
2. मिकी वैन डे वेन: 87 वें
3. डेस्टिनी उडोगी: 152
4. केविन डेन्सो: 167
5. मोहम्मद कुदुस: 186वां

गुजरना है इस खेल में मौलिक कौशल। औसत प्रीमियर लीग टीम प्रति गेम 450 पास का प्रयास करती है। और कुछ भी करीब नहीं आता: एक ही खेल में, औसत टीम आठ शॉट का प्रयास करती है, गेंद को 18 बार पार करती है, 18 बार डिफेंडरों को चकमा देने की कोशिश करती है, 16 टैकल का प्रयास करती है, और आठ अवरोधन करती है। यदि आप गेंद को पास नहीं कर सकते, तो और कुछ मायने नहीं रखता। यह खेल के मूल में मौजूद शक्ति है जो बाकी सभी चीजों को अर्थ देती है।

तो, दुनिया की सबसे अमीर टीमों में से एक – जो एक फुटबॉल क्लब का आधुनिक उदाहरण होने का दावा करती है – अपनी ही लीग के 150 सर्वश्रेष्ठ पासरों में से केवल दो के साथ एक टीम कैसे बनाती है?

खेल

1:35

क्या टोटेनहम प्रीमियर लीग से बाहर हो जाएगा?

सुंदरलैंड से 1-0 की हार के बाद जानुस माइकलिक ने टोटेनहम की प्रीमियर लीग में बने रहने की उम्मीदों पर बहस की।

ग़लत विश्लेषण का उदय

पिछले कुछ वर्षों में, फ़ुटबॉल जगत में संख्याओं का एक नया समूह सामने आया है। उन चीजों की मात्रा निर्धारित करने के बजाय जो जीत की ओर ले जाती हैं, वे उन चीजों की मात्रा निर्धारित करते हैं जिन्हें स्काउट्स और कोच हमेशा महत्व देते हैं: कौन बड़ा है और कौन तेज़ है? कौन अच्छा लग रहा है? अगर मैं उसे खेलना सिखा सकूं तो कौन अजेय होगा?

ग्रैडिएंट और स्किलकॉर्नर जैसी कई कंपनियां अब भौतिक मेट्रिक्स की पेशकश करती हैं जो दिखाती हैं कि एक खिलाड़ी कितनी बार दौड़ रहा है – कब्जे के अंदर और बाहर, शीर्ष गति पर, उच्च गति पर, आदि। मैं ऐसा करने के लिए किसी भी कंपनी को दोष नहीं देता; यह अच्छा है कि ये डेटासेट मौजूद हैं। शुरुआत से ही फ़ुटबॉल डेटा से गायब रहने वाली चीज़ों में से एक वह चीज़ है जो हमें बताती है कि बाकी सभी लोग गेंद से क्या कर रहे हैं। औसत खिलाड़ी के पास गेंद पर कब्ज़ा होता है, अधिकतम, प्रति गेम केवल कुछ मिनटों के लिए, और अधिकांश सॉकर डेटा केवल समय के उस छोटे स्नैपशॉट की मात्रा निर्धारित कर रहा है। यह हमें सब कुछ बताने के करीब नहीं है, लेकिन यह हमें सबसे महत्वपूर्ण बातें बता रहा है।

सही ढंग से उपयोग किए जाने पर, यह ऑफ-बॉल, भौतिक डेटा अविश्वसनीय रूप से शक्तिशाली हो सकता है। यदि आप एक टीम चला रहे हैं और आप यह पता लगा सकते हैं कि इन भौतिक मेट्रिक्स को जीतने और गोल करने के लिए किस तरह से संयोजित किया जाए, तो आपने खिलाड़ी के मूल्य की एक नई, बहुत अधिक समग्र समझ बनाई है, और आप किसी भी ऐसे व्यक्ति से आगे निकल जाएंगे जो प्रदर्शन को मापने के लिए केवल पासिंग और शॉट्स का उपयोग कर रहा है। लेकिन यह वास्तव में कठिन है, और चूँकि यह वास्तव में कठिन है, यह वास्तव में नहीं हो रहा है।

इसके बजाय, कई चैंपियंस लीग क्लबों के साथ काम कर चुके एक सूत्र ने मुझे बताया, भौतिक मेट्रिक्स क्लबों को केवल अपने स्वयं के पूर्वाग्रहों की पुष्टि करने की अनुमति दे रहे हैं – वही पूर्वाग्रह जो हम “मनीबॉल” लिखे जाने के बाद से स्काउट्स और सांख्यिकी के बीच इस लड़ाई में बात कर रहे हैं। सिवाय इसके कि, अब हमारे पास नए आँकड़े हैं जो कहते हैं कि स्काउट्स सही थे।

स्पर्स के साथ जो हुआ उसे और कैसे समझाया जाए?

टोटेनहम के पास विस्फोटक एथलीटों से भरा एक रोस्टर है जो दौड़ सकते हैं। अपने भौतिक मेट्रिक्स का उपयोग करते हुए, ग्रैडिएंट ने एक “एथलेटिसिज्म” स्कोर बनाया जो सहनशक्ति, विस्फोटकता और गति का एक कॉम्बो है जो स्थिति और आकार के लिए समायोजित होता है। यह 1-100 पैमाने पर है. टोटेनहम में 90 या उससे ऊपर के सात खिलाड़ी हैं और उनमें से पांच – विल्सन ओडोबर्ट, लुकास बर्गवैल, आर्ची ग्रे, डोमिनिक सोलंके, कॉनर गैलाघर – को अक्टूबर 2023 में जोहान लैंग के क्लब के तकनीकी निदेशक बनने के बाद अनुबंधित किया गया था। पहले चार चार आउटफील्ड खिलाड़ी थे जिन्हें लैंग के पहले ग्रीष्मकालीन प्रभारी के दौरान हस्ताक्षरित किया गया था।

आप ऐसा रोस्टर नहीं बना सकते जो पास न हो सके जब तक कि आप वैकल्पिक खिलाड़ी विशेषताओं के एक सेट पर व्यवस्थित रूप से ध्यान केंद्रित न करें जो एक संस्थागत अंधा स्थान बनाता है। यह देखते हुए कि रोमेरो – अब तक उनका सबसे अच्छा पासर – 2021 में हस्ताक्षरित किया गया था, और जेम्स मैडिसन, जो पूरे सीज़न में घायल हो गए थे, लेकिन आसानी से उनके अन्य सर्वश्रेष्ठ पासर हैं और 2023 की गर्मियों में हस्ताक्षर किए गए थे, वास्तव में जो मायने रखता है उसकी अज्ञानता और भी अधिक स्पष्ट हो जाती है।

“मनीबॉल” की अधिक यादगार कहानियों में से एक वह है जहां बिली बीन अपने स्काउट्स के साथ बहस कर रहा है, जो इस बात पर ध्यान दे रहे हैं कि किसी लड़के का नितंब कितना बड़ा है, उसका चेहरा किस तरह का है, या क्या उसकी प्रेमिका आकर्षक है। बीन बार-बार सवाल पर आता है, “लेकिन क्या वह मार सकता है?” अंततः वह क्रोधित हो जाता है, और कमरे में सभी को चिल्लाता है, “मैं दोहराता हूं: हम यहां जींस नहीं बेच रहे हैं।”

मैंने सुना है कि यह सुझाव दिया गया है कि आपके क्लब में किसी ऐसे व्यक्ति का होना जो डेटा को समझता है और उन्हें वास्तविक आवाज देता है, केवल इसलिए मूल्यवान है क्योंकि वे आपको मुख्य चीज़, मुख्य चीज़ रखने की याद दिलाकर, उन सभी चीजों को करने से रोकेंगे। लेकिन क्या वह मार सकता है? हालाँकि, स्पर्स में, ऐसा लगता है कि संख्याओं के एक नए सेट ने क्लब को यह सोचने पर मजबूर कर दिया होगा कि वे वास्तव में जींस बेचने के व्यवसाय में थे। उन्हें वास्तव में किस चीज़ की आवश्यकता थी – और क्या चीज़ उन्हें पदावनत होने से बचा सकती थी – वह कोई था जो एक सरल प्रश्न पूछता रहा:

लेकिन क्या वह पास हो सकता है?