世界杯奪冠概率榜出爐!西班牙領(lǐng)跑法國緊隨,日本1.2%五隊(duì)0%
離開幕還有十來天,48支隊(duì)全世界拉著橫幅喊目標(biāo)是“走得更遠(yuǎn)”,可一邊是西班牙16.1%的奪冠概率,一邊是五支球隊(duì)被判定“0%可能”,數(shù)據(jù)擺在那,心氣兒和現(xiàn)實(shí)撞在一起,落差感誰都看得見;
這篇東西要解答的就一個(gè)問題:在Opta這臺超級計(jì)算機(jī)眼里,這屆美加墨世界杯究竟是“豪門內(nèi)斗的又一屆”,還是會留一點(diǎn)縫,讓別人鉆出去;
先把背景捋清楚一點(diǎn),這屆世界杯是史上第一次擴(kuò)軍到48隊(duì),12個(gè)小組,每組4隊(duì),小組前兩名加上8個(gè)成績最好的第三名,一共32隊(duì)進(jìn)淘汰賽,比賽場次從以前的64場漲到104場,賽期拉長到39天;賽制一擴(kuò),很多原本看不到?jīng)Q賽圈門檻的球隊(duì)突然有了機(jī)會,這也是為什么這次的概率榜單一出來,討論聲特別大;

Opta這次的模型,主要用的是陣容實(shí)力、近期戰(zhàn)績、Elo積分、歷史大賽表現(xiàn)這些指標(biāo),外加一些賽程難度、分組情況的權(quán)重,官方自己對外說是“數(shù)十項(xiàng)指標(biāo)綜合”,具體公式不會公開,但大體思路和過去幾屆他們的預(yù)測類似;他們不是拍腦袋亂寫,這家公司從2010年開始就做世界杯概率,2014年、2018年、2022年,至少“熱門是誰”這層判斷基本沒跑偏,只是冠軍最后落誰家,經(jīng)常被現(xiàn)實(shí)打臉;
在這份最新版的48隊(duì)概率里,西班牙排第一,16.1%;法國第二,13%;英格蘭11.2%;阿根廷10.4%;葡萄牙7%;緊后面是巴西6.6%、德國5.1%、荷蘭3.6%、挪威3.5%、比利時(shí)2.4%;日本1.2%,排第17;韓國0.4%,在26的位置;更扎眼的是,五支隊(duì)的奪冠概率被寫成“0%”:民主剛果、卡塔爾、佛得角、海地、庫拉索;
西班牙為什么會被算到榜首,這一點(diǎn)不少球迷心里其實(shí)是有疑問的;數(shù)據(jù)層面有兩塊東西在撐他們,一個(gè)是近期成績,一個(gè)是分組;西班牙去年拿了歐洲杯,今年到世界杯前的熱身賽也沒翻車,德拉富恩特接手后,球隊(duì)完成了一次比較徹底的換代,佩德里、亞馬爾、加維這些名字已經(jīng)不算“未來”,而是正兒八經(jīng)的主力,傳控風(fēng)格延續(xù)著老西班牙那一套,但節(jié)奏快了不少,前場的縱向威脅比2018、2022那兩屆強(qiáng);另一塊是分組優(yōu)勢,他們在H組,碰的是烏拉圭、沙特、佛得角,從Elo評分到球員身價(jià),這組里他們都在上風(fēng),小組第一的概率自然高,路徑一旦順,后面對陣?yán)镉龅酵瑱n強(qiáng)隊(duì)的次數(shù)就會被壓下來,這對概率模型來說是非常關(guān)鍵的;

法國排第二,看上去不驚訝;過去兩屆世界杯他們一冠一亞,穩(wěn)穩(wěn)的決賽常客;Opta給的是13%,高盛自己的統(tǒng)計(jì)模型更夸張,直接給到19%;這支隊(duì)的硬件配置幾乎是教科書級別,中前場無論是數(shù)據(jù)還是名氣都是滿格,姆巴佩在國家隊(duì)的進(jìn)球效率現(xiàn)在是0.6球/場左右(參考法國足協(xié)公開統(tǒng)計(jì)),后場還有一整條在五大聯(lián)賽主力級別的后衛(wèi)線;模型喜歡這種“厚度”很大的陣容,因?yàn)槿魏我稽c(diǎn)傷病都不至于讓球隊(duì)瞬間掉層級;
排第三的是英格蘭,11.2%;他們的矛盾比較直觀:紙面實(shí)力好得嚇人,凱恩、貝林厄姆、薩卡、福登這些人隨便拎出來一個(gè),放在別的隊(duì)都是核心;但連續(xù)兩屆歐洲杯都倒在決賽,2021年溫布利點(diǎn)球崩盤,2026年又被西班牙按在地上,對這支隊(duì)的心理標(biāo)簽已經(jīng)寫上了“關(guān)鍵時(shí)刻心態(tài)不穩(wěn)”;概率模型里,這種“心理層面”的東西很難量化,能落到數(shù)字里的,還是更多看戰(zhàn)績和進(jìn)球、防守效率,所以英格蘭的分?jǐn)?shù)不會太低;
阿根廷只排第四,10.4%;不少人看到這個(gè)排名第一反應(yīng)是“衛(wèi)冕冠軍被小看了”;但拉回現(xiàn)實(shí),世界杯是2022年的事,2026年隊(duì)伍會老四歲,這是逃不過去的;梅西自己已經(jīng)37歲了,核心陣容里一大塊都在30歲上下,體能和對抗能力的下滑是肉眼可見的;更現(xiàn)實(shí)的一點(diǎn),在FIFA公布的國家隊(duì)積分榜上,阿根廷仍然占據(jù)前列,但去年一年,他們打的大多是南美區(qū)的對手,對模型來說,這些比賽的信息量不如歐洲隊(duì)那種高強(qiáng)度對抗;Opta的算法向來會給“陣容老化”扣一些分,這點(diǎn)在2010年的意大利、2014年的西班牙身上都出現(xiàn)過;

往后看,葡萄牙7%,巴西6.6%,德國5.1%,荷蘭3.6%,挪威3.5%,比利時(shí)2.4%;這幾支隊(duì)里,最有爭議的是巴西和德國;巴西這幾年國家隊(duì)折騰得比較亂,教練更迭頻繁,世界杯預(yù)選賽成績也不算理想,2023年在南美區(qū)的場均得分只有1.64分(CONMEBOL官方數(shù)據(jù)),是近二十年來最低的一段;德國則屬于“歷史戰(zhàn)績加給分”的典型,2018和2022連續(xù)小組出局,但他們在Elo系統(tǒng)里仍然排前十,加上德甲在人才輸送上的穩(wěn)定,模型會認(rèn)為“反彈的可能性不小”;
亞洲這邊,日本是這次榜單里唯一一個(gè)被寫到1%以上的亞洲隊(duì),1.2%,第17名;他們和美國持平,在所有非歐洲、非南美隊(duì)里,屬于最被看好的那一檔;日本本屆分在F組,對手是荷蘭、瑞典、突尼斯;從紙面實(shí)力看,荷蘭是明顯頭號種子,瑞典有一整套成熟的防守體系,突尼斯更多被視作攪局者;卡塔爾世界杯,日本就在小組賽里先后掀翻德國和西班牙,這一波操作讓模型對他們的“巨人殺傷力”有了更高評價(jià);更關(guān)鍵的是,48隊(duì)賽制給了小組第三一個(gè)后門,只要拿到1勝1平甚至2平,凈勝球不太難看的話,晉級32強(qiáng)的機(jī)會就會大一截,日本相比其他亞洲隊(duì),穩(wěn)定性高,這是這1.2%背后的原因;
韓國的0.4%排第26;表面看和日本差的不多,實(shí)際差距挺明顯;韓國在過去兩年里,換帥風(fēng)波、隊(duì)內(nèi)矛盾、熱身賽表現(xiàn)都不算理想;Elo積分上,他們現(xiàn)在大概在世界前30開外,和卡塔爾之前那批亞洲冠軍球隊(duì)相比,實(shí)打?qū)嵣倭艘恍┯舱蹋粚τ谀P蛠碚f,0.4%并不等于“看不起”,而是把他們放在了“有機(jī)會走出小組,但很難穿越多輪強(qiáng)強(qiáng)對話”的那檔;

然后就到了那五支被標(biāo)記“0%”的隊(duì),這個(gè)“0%”很多人誤解成“零機(jī)會”,嚴(yán)格意義上說,這是一個(gè)四舍五入后的顯示;實(shí)際概率可能是0.03%、0.05%,但在榜單呈現(xiàn)的時(shí)候被歸到“0%”區(qū)間里;但即便這樣,被歸到這一格的,確實(shí)是模型眼里“從整體實(shí)力到賽程全都不占”的那一類;
民主剛果是非洲區(qū)的代表之一,上一次出現(xiàn)在世界杯正賽還是1974年的事,F(xiàn)IFA官方統(tǒng)計(jì),這是他們52年后再次回到這個(gè)舞臺;他們這次在K組,對手是葡萄牙、哥倫比亞、烏茲別克斯坦,前兩支隊(duì)都在世界前二十,烏茲別克斯坦在亞洲范圍內(nèi)也屬于硬骨頭;民主剛果陣中有不少在法甲、比甲打球的球員,但整體Elo排名在48支參賽隊(duì)里基本墊底,這樣的起點(diǎn),模型直接把他們放在“出線都難”的序列里;
卡塔爾的情況更尷尬一點(diǎn);他們曾經(jīng)是2022年的東道主,在那屆世界杯上小組賽三戰(zhàn)全敗,凈勝球-6,是東道主歷史上表現(xiàn)最差的一次;這次他們通過亞洲區(qū)預(yù)選賽殺進(jìn)決賽圈,但過程非常吃力,在18強(qiáng)賽A組僅排第四,靠附加賽搶到門票;Opta給他們的Elo排名是世界第93位,在48支世界杯參賽隊(duì)里基本墊底;本屆分在B組,面對加拿大、波黑、瑞士;三支對手不是絕對豪門,但整體防守硬度都在他們之上;在這種背景下,概率模型幾乎不會給他們“連贏四五場”的路徑;

佛得角和庫拉索是這次擴(kuò)軍制度最直觀的“產(chǎn)物”;佛得角人口大約59萬,官方統(tǒng)計(jì)顯示,他們國土面積只有4000平方公里多一點(diǎn),本屆世界杯他們被分到H組,要對著的是西班牙、烏拉圭、沙特;庫拉索更小,人口大約15.6萬,是本屆所有參賽國里人口最少的;他們在E組,迎面就是德國、科特迪瓦、厄瓜多爾;對這兩支隊(duì)來說,拿到世界杯門票本身就是重大獎(jiǎng)杯,而概率模型看的是“從現(xiàn)在起連續(xù)贏多少場”,這種長路徑讓他們的數(shù)值一眼就低了下去;
海地是另外一個(gè)被寫進(jìn)“0%”區(qū)間的中北美代表;這個(gè)國家的足球發(fā)展一直受制于經(jīng)濟(jì)和社會環(huán)境,國內(nèi)聯(lián)賽斷斷續(xù)續(xù),很多主力要跑去北美甚至歐洲低級別聯(lián)賽謀生;他們的國家隊(duì)在FIFA排名里曾經(jīng)一度跌到百名開外,最近幾年有所回升,但和世界強(qiáng)隊(duì)的差距仍然明顯;這種背景下,模型給他們的概率自然不會高;
說到這,得把一句老話放在桌面上:概率不是命運(yùn);Opta的模型是基于過往數(shù)據(jù)、當(dāng)前陣容、賽程模擬出來的一個(gè)“平均預(yù)期”,每一屆世界杯,總要有幾支球隊(duì)用實(shí)際表現(xiàn)把這些模型砸碎給大家看;2016年的萊斯特城奪英超、2018年的克羅地亞殺進(jìn)世界杯決賽、2022年的摩洛哥進(jìn)四強(qiáng),這些在賽前的概率表上基本都接近“噱頭”,但現(xiàn)實(shí)給出了另一種劇情;

對普通球迷來說,這類概率榜真正有用的地方在于兩個(gè)點(diǎn);一個(gè)是幫自己看清“熱度”和“真實(shí)實(shí)力”的差別,比如阿根廷的奪冠熱度在社交媒體上可能排第一,但在數(shù)據(jù)模型里他們只是第四;另一個(gè)是識別一些明顯的噱頭,比如某些媒體會把日本的1.2%拿來炒作成“亞洲最有希望奪冠”,只要知道這個(gè)數(shù)字在整個(gè)榜單里排在第17,就不會被這種標(biāo)題黨帶跑;
還有一點(diǎn)可以當(dāng)參考:擴(kuò)軍后的48隊(duì)賽制,在數(shù)學(xué)意義上給了更多中下游隊(duì)“一場定江山”的機(jī)會;小組第三也能出線,意味著很多隊(duì)不再是“踢兩場就被淘汰”,而是有機(jī)會拖到淘汰賽再去搏冷門;模型對這種不確定性是有意識的,但無法完全捕捉,特別是傷病、紅黃牌、天氣這些臨場因素,很難事先算進(jìn)去;
最后留個(gè)小小的“鉤子”:等到這屆世界杯結(jié)束時(shí),再回頭翻這份概率榜,大家最想驗(yàn)證的是哪一支隊(duì),是被高估的那一個(gè),還是被寫成“0%”卻偏偏闖出一條路的那一個(gè);
