超碰97人人做人人爱网站,巨爆乳中文字幕爆乳区,国产精品乱码一区二区三,日本免费观看

| 加入桌面 | 手機(jī)版
免費(fèi)發(fā)布信息網(wǎng)站
貿(mào)易服務(wù)免費(fèi)平臺(tái)
 
 
當(dāng)前位置: 貿(mào)易谷 » 資訊 » 電子商務(wù) » 用大數(shù)據(jù)預(yù)測(cè)世界杯:狂熱預(yù)測(cè)打了臉

用大數(shù)據(jù)預(yù)測(cè)世界杯:狂熱預(yù)測(cè)打了臉

放大字體  縮小字體 發(fā)布日期:2014-07-15 09:56  來源:虎嗅網(wǎng)   瀏覽次數(shù):40
  世界杯的狂歡結(jié)束,還在天臺(tái)上的球迷們,可以下樓睡覺了??駳g之余,大家對(duì)世界杯的熱情讓比賽結(jié)果具有了商業(yè)價(jià)值,更促使了機(jī)構(gòu)們熱衷對(duì)比賽的預(yù)測(cè)。比起上屆的章魚保羅,機(jī)構(gòu)們的預(yù)測(cè)背靠大數(shù)據(jù)資源和技術(shù),預(yù)測(cè)起來都更有底氣。但是他們的預(yù)測(cè)是不是真的算得上大數(shù)據(jù)?它們具體又是怎么操作的呢?
  1.百度:高考作文跟世界杯不一樣哦!
  百度預(yù)測(cè)今年精準(zhǔn)預(yù)測(cè)了五一的景點(diǎn)爆滿情況和部分高考作文題,當(dāng)然不會(huì)放過世界杯這個(gè)機(jī)構(gòu)們測(cè)試大數(shù)據(jù)能力的舞臺(tái)。制約大數(shù)據(jù)的一大問題就是海量的數(shù)據(jù),搜索巨頭百度在這一點(diǎn)上擁有先天的優(yōu)勢(shì)。
  百度北京大數(shù)據(jù)實(shí)驗(yàn)室的負(fù)責(zé)人張桐(Zhang Tong)介紹稱,
?   在百度對(duì)世界杯的預(yù)測(cè)中,我們一共考慮了團(tuán)隊(duì)實(shí)力、主場(chǎng)優(yōu)勢(shì)、最近表現(xiàn)、世界杯整體表現(xiàn)和博彩公司的賠率等五個(gè)因素。
  百度大數(shù)據(jù)部利用大數(shù)據(jù)搜索過去5年內(nèi)全世界987支球隊(duì)的3.7萬場(chǎng)比賽數(shù)據(jù),共涉及到19972名球員和1.12億條相關(guān)數(shù)據(jù),這些數(shù)據(jù)的來源基本都是互聯(lián)網(wǎng),再利用一個(gè)由搜索專家設(shè)計(jì)的機(jī)器學(xué)習(xí)模型來對(duì)這些數(shù)據(jù)進(jìn)行匯總和分析,進(jìn)而做出預(yù)測(cè)結(jié)果。
?  針對(duì)本屆世界杯的16場(chǎng)淘汰賽的預(yù)測(cè),準(zhǔn)確度達(dá)到了100%。而今年頻頻爆冷的小組賽階段,百度對(duì)比賽結(jié)果的預(yù)測(cè)準(zhǔn)確率也達(dá)到了58.33%,這一結(jié)果高于微軟語音助手Cortana和必應(yīng)搜索聯(lián)合得出的56.25%的準(zhǔn)確率。但是100%的準(zhǔn)確度也只是猜勝負(fù),德國(guó)和巴西7:1的結(jié)果就和百度預(yù)測(cè)的,德國(guó)將會(huì)以微弱的優(yōu)勢(shì)贏下巴西(51%對(duì)49%),二者相去甚遠(yuǎn)。
? ?  其實(shí)百度在世界杯開賽前預(yù)測(cè)的冠軍是巴西,我會(huì)說?
  2.微軟:小冰、Cortana、必應(yīng)家小齊上陣
?   微軟公司對(duì)世界杯的預(yù)測(cè)除了以往比賽歷史外,考慮了更多的因素:地理位置、草坪、天氣、大量預(yù)測(cè)的參考(群體智慧),還使用大量的公開數(shù)據(jù)——博彩市場(chǎng)、民意調(diào)查、社交媒體以及其它在線數(shù)據(jù),通過歐洲賠率市場(chǎng)最有名的指數(shù)Betfair(必發(fā)指數(shù))來構(gòu)建預(yù)測(cè)模型,并通過微軟的個(gè)人語音助手Cortana和必用搜索引擎發(fā)布。微軟的分析似乎更有大數(shù)據(jù)的氣質(zhì),相較之百度的參考因素更像依靠經(jīng)典理論的傳統(tǒng)統(tǒng)計(jì)分析。
  基于微軟的分析,WP8.1 Cortana預(yù)測(cè)巴西世界杯的戰(zhàn)果是15勝1敗。微軟表示,Cortana進(jìn)行預(yù)測(cè)會(huì)綜合考慮主場(chǎng)優(yōu)勢(shì),這也是為何在預(yù)測(cè)巴西對(duì)決荷蘭的季軍爭(zhēng)奪戰(zhàn)中認(rèn)為巴西會(huì)取勝的一個(gè)因素。
  這次世界杯15勝1敗的戰(zhàn)果是,就上一場(chǎng)比賽結(jié)果對(duì)下場(chǎng)比賽的預(yù)測(cè)。而早在2013年12月,微軟研究院就“高瞻遠(yuǎn)矚”,聲稱開發(fā)了一款Excel軟件,用大數(shù)據(jù)來預(yù)測(cè)2014年世界杯。預(yù)測(cè)結(jié)果是:巴西將奪冠,奪冠率達(dá)到22.5%,遠(yuǎn)遠(yuǎn)高于其他對(duì)手,如今似乎沒人拿出來打臉了。
  3.谷歌:關(guān)鍵時(shí)刻掉鏈子?
  谷歌從Opta Sports的數(shù)據(jù)中,分析了職業(yè)足球聯(lián)盟、世界杯小組賽中隊(duì)員們的表現(xiàn),引入了由BigQuery工程師喬丹·提加尼開發(fā)的實(shí)力排行榜系統(tǒng),來推測(cè)他們將會(huì)在本屆世界杯有什么樣的表現(xiàn)。此外,還考慮了觀眾熱情程度的數(shù)據(jù),來計(jì)算主隊(duì)優(yōu)勢(shì)。
? ?   谷歌則預(yù)測(cè)了16進(jìn)8和8進(jìn)4的兩輪比賽,而谷歌在12場(chǎng)預(yù)測(cè)中有11場(chǎng)正確,準(zhǔn)確率為91.67%,預(yù)測(cè)八強(qiáng)賽時(shí),對(duì)關(guān)鍵的德法大戰(zhàn)預(yù)測(cè)錯(cuò)了。
? ?  在大數(shù)據(jù)概念的推廣過程中,對(duì)流感等疾病的大數(shù)據(jù)預(yù)測(cè)一直是傳播的范本,但是,2013年谷歌對(duì)于流感的預(yù)測(cè)與美國(guó)疾病控制中心匯總后的結(jié)果相比,就夸大了幾乎一倍。大數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確性,仍然是一個(gè)需要長(zhǎng)時(shí)間研究的課題。
  4.高盛:傳統(tǒng)模型寶刀已老
?  擁有世界最頂尖的經(jīng)濟(jì)學(xué)家的高盛,通過對(duì)自1960年以來的正式國(guó)際14000場(chǎng)足球比賽數(shù)據(jù)的回歸分析來構(gòu)建預(yù)測(cè)模型,還通過泊松模型分析了每場(chǎng)小組賽的比分情況。其思路完全是傳統(tǒng)的統(tǒng)計(jì)分析,并沒有體現(xiàn)大數(shù)據(jù)的總體樣本的特點(diǎn)。模型和算法也遵從了投資公司善用的經(jīng)典模型,并沒有完全根據(jù)本次世界杯的命題來答題。
  高盛在小組賽預(yù)測(cè)的準(zhǔn)確率為37.5%,并在世界杯開始前,預(yù)測(cè)東道主巴西最有可能斬獲世界杯冠軍,奪冠幾率為48.5%,比任何參賽球隊(duì)高3倍。甚至給出了最終決賽的結(jié)果,巴西將以3比1的比分,戰(zhàn)勝最后的宿敵阿根廷。即使大數(shù)據(jù)還不夠成熟,但是傳統(tǒng)的樣本分析在大數(shù)據(jù)結(jié)果面前還是相形見絀的。
  5.雅虎:當(dāng)機(jī)器被情緒誤導(dǎo)
  雅虎科學(xué)家小組基于,Tumblr上所有有關(guān)世界杯的討論都存在有價(jià)值的信息,利用了輕博客網(wǎng)站Tumblr的數(shù)據(jù)來估計(jì)每支國(guó)家隊(duì)的優(yōu)勢(shì)。雅虎科研小組表示他們從831億篇Tumblr博客中篩選了1.889億篇文章用于分析,自2月至5月,他們將注意力集中于2730萬篇與世界杯“相關(guān)博文”。針對(duì)每一次比賽,雅虎會(huì)利用名為泊松分布不同參數(shù)的概率論來估計(jì)每一支隊(duì)伍可能的進(jìn)球數(shù)量,例如在“與世界杯有關(guān)的帖子里被提及的國(guó)家隊(duì)”。
  雅虎預(yù)測(cè)德國(guó)將打敗葡萄牙,而西班牙將擊敗荷蘭,而最后的冠軍是巴西。可憐被雅虎提到的兩只會(huì)獲勝的隊(duì)伍,西班牙和巴西都已恥辱性的比分被打敗。據(jù)說社交網(wǎng)絡(luò)數(shù)據(jù)可以預(yù)測(cè)傳染病和犯罪現(xiàn)場(chǎng),這是因?yàn)閭魅静『头缸铿F(xiàn)場(chǎng)中可以利用社交網(wǎng)絡(luò)發(fā)布內(nèi)容的客觀成分,而且大量分散的信息組織起來形成了意義。但雅虎把它用到預(yù)測(cè)足球比賽上,顯然被網(wǎng)友們的情緒誤導(dǎo)了。
  6.德國(guó)科隆體育學(xué)院:專業(yè)范兒試刀
  據(jù)科隆體育學(xué)院官網(wǎng)稱,該校格羅爾教授領(lǐng)導(dǎo)的研究小組用他們?cè)O(shè)計(jì)的計(jì)算機(jī)模擬算式對(duì)本屆2014年世界杯可能的結(jié)果進(jìn)行了共10萬次測(cè)算,考慮因素不僅包括各隊(duì)的世界排名、足彩賠率、市值、預(yù)選賽表現(xiàn),還包括可能的傷病、戰(zhàn)術(shù)、氣候條件、主場(chǎng)優(yōu)勢(shì)因素等。
  德國(guó)科隆體育學(xué)院的研究人員在世界杯開賽前,就拋出了預(yù)測(cè)結(jié)果:預(yù)測(cè)認(rèn)為德國(guó)、巴西、哥倫比亞、阿根廷、比利時(shí)和荷蘭6支隊(duì)肯定能打入八強(qiáng),西班牙即使殺出小組賽也會(huì)在八分之一決賽中被巴西淘汰。其后巴西、德國(guó)、阿根廷和荷蘭半決賽,最終將由巴西和阿根廷爭(zhēng)冠,巴西奪冠概率20.4%,阿根廷14.7%?,F(xiàn)在看來,除了決賽,其他預(yù)測(cè)得都還挺準(zhǔn)。
?  7.德意志銀行:敢和寵物比精準(zhǔn)
  據(jù)英國(guó)《衛(wèi)報(bào)》網(wǎng)站6月9日?qǐng)?bào)道,德意志銀行預(yù)測(cè),英格蘭隊(duì)將在巴西世界杯中奪冠。德銀建立了量化分析模型,計(jì)算參數(shù)包含球隊(duì)的世界排名、以往戰(zhàn)績(jī)、球員構(gòu)成和賭球市場(chǎng)賠率。得出的奪冠概率是巴西名列第一,緊隨其后的是德國(guó)、西班牙、法國(guó)。但是,德銀表示這樣的預(yù)測(cè)太乏味也太傳統(tǒng),于是德銀引入了一系列條件,最后得出了英格蘭是冠軍的結(jié)果。他們的理由是,上一次英格蘭奪冠時(shí),隊(duì)中就有很多利物浦球員,和這次情況一致,因此他們確信英格蘭隊(duì)將在巴西奪冠。
  無獨(dú)有偶,英國(guó)最大的寵物連鎖店“家中寵物(Pets at Home)”,讓一只名叫Roo的會(huì)通靈的斗牛犬來預(yù)測(cè),結(jié)果它預(yù)測(cè)英格蘭會(huì)在決賽中擊敗意大利奪冠。
  他們得出了相同的結(jié)論,還真是可愛。
  8.數(shù)據(jù)新聞網(wǎng)站FiveThirtyEight:巴西粉
  天才數(shù)據(jù)分析師內(nèi)特·西爾弗(Nate Silver),曾經(jīng)在2012年美國(guó)總統(tǒng)大選中準(zhǔn)確預(yù)測(cè)了50個(gè)州的選舉結(jié)果,為了預(yù)測(cè)棒球選手的成績(jī)而開發(fā)了統(tǒng)計(jì)工具PECOTA,新創(chuàng)辦了一個(gè)使用統(tǒng)計(jì)數(shù)據(jù)來分析所有現(xiàn)象的新聞網(wǎng)站FiveThirtyEight。
  不過,專門從事比賽結(jié)果預(yù)測(cè)的平臺(tái),也沒有在世界杯的預(yù)測(cè)中保住節(jié)操。FiveThirtyEight預(yù)測(cè)巴西能擊敗德國(guó),并在決賽中捧杯。
  決賽結(jié)束后,黃健翔在微博上轉(zhuǎn)了他4月做出的預(yù)測(cè),巴西、阿根廷、德國(guó)、意大利、法國(guó)、荷蘭、英格蘭各隊(duì)命運(yùn)全都說中。大數(shù)據(jù)在世界杯期間的狂歡也不能代表其成熟,或許在足球領(lǐng)域還比不上專業(yè)人士的經(jīng)驗(yàn)分析。
  回想世界杯開賽前,機(jī)構(gòu)發(fā)布的預(yù)測(cè)結(jié)果大多是巴西大熱門,西班牙有希望等論調(diào)。而百度、微軟準(zhǔn)確率近乎100%的預(yù)測(cè),都是在基于上一場(chǎng)比賽結(jié)果的基礎(chǔ)上預(yù)測(cè)下一場(chǎng)。大數(shù)據(jù)的策略是發(fā)現(xiàn),以及猜測(cè)、印證的循環(huán)逼近過程,一般只會(huì)設(shè)定一個(gè)大方向,算法模型都可能在執(zhí)行的過程中做大幅度調(diào)整。這才有了他們?cè)谫惽邦A(yù)測(cè)巴西,賽中算準(zhǔn)德國(guó)的兩種預(yù)測(cè)。
  大數(shù)據(jù)時(shí)代分析的瓶頸不再是算法和存儲(chǔ),而是接近于總體的海量信息,以及如何與具體的命題相結(jié)合的模型建構(gòu)。在巨頭林立的今天,對(duì)于普通人海量信息首先是無法逾越的門檻,但是這正是大型網(wǎng)絡(luò)公司們的優(yōu)勢(shì)。特別是這次預(yù)測(cè)變現(xiàn)優(yōu)秀的百度、必應(yīng)和谷歌這類的搜索引擎,而百度也專門創(chuàng)立百度預(yù)測(cè),以期更多得干預(yù)到日常生活。
  人們一直想找到如何能更準(zhǔn)確認(rèn)識(shí)世界的方法,從樣本統(tǒng)計(jì)到大數(shù)據(jù)運(yùn)算,大家都談在概念,卻鮮有人能將其與真正的商業(yè)、生活結(jié)合,產(chǎn)生有意義的結(jié)果。對(duì)于正在玩大數(shù)據(jù)概念的互聯(lián)網(wǎng)公司而言,具體到怎樣建立有效模型,提高計(jì)算結(jié)果的準(zhǔn)確性,還在摸著石頭過河。
分享與收藏:  資訊搜索  告訴好友  關(guān)閉窗口  打印本文 本文關(guān)鍵字:
 
推薦圖文
贊助商鏈接
推薦資訊
贊助商鏈接