在2009年到2010年間,北京市的塞車問題非常嚴重;為此,北京市政府和微軟研究院合作,在該市的3萬3,000輛計程車上,裝置了GPS衛星定位系統,用來蒐集北京的交通路況,以便進行巨量資料分析。
分析後發現,北京最明顯的交通瓶頸出現在「北四環路」,因為天通苑、來廣營兩個地區的居民,皆以此為主要幹道。北京市政府就根據計程車加裝GPS後,跑出來的巨量資料,新建了長達1.7公里的「北湖渠西路」,這條新建道路可謂一舉中的,有效化解了北京的交通問題。這是巨量資料廣泛應用的具體案例之一。
事實上,巨量資料是拜雲端科技發展之賜,而開始有足夠大量的電腦可以運算它,誰能夠篩解出巨量資料裡頭的各種「含金量」,誰就能比別人早一步洞察商機並領先創新。
台灣微軟營運行銷事業群總經理康容表示,巨量資料可謂電腦資料演變下的第三部曲,初期的電腦資料是ERP/CRM等企業內部資料,在WEB 2.0時代網路資料變成雙向的來回,但僅政府、軍隊、超大型企業有解讀這些資料的能力;
到了雲端時代,全世界的資料都會在網路上留下紀錄,這些龐大無比同時可說是全人類的數據資料庫,就是巨量資料。
篩解含金量 抓住創新商機
到底多大的資料和數據才能稱得上是巨量資料?康容表示,巨量資料量的最小值,起碼也要有「5 PB」以上,1個PB是1024 TB,相當50%全美學術研究圖書館的藏書量,5 PB大概是全球圖書館藏書的總和。
感覺上,巨量資料是科技人才會去觸碰到的天文數字,其實在一般的網路應用上,你我都已經享受到巨量資料帶來的便利,例如在臉書上經常可以看見「這些人可能是你認識的朋友」,在Google搜尋資料時會出現「你要找的資料是不是…」,在網路書店買書時,也會出現「買了這本書的人,同時還買了…」,這些都是巨量資料的社群和商業應用之一。
Google台灣董事總經理簡立峰表示,全球許多企業已經關注到巨量資料的重要性,並利用分析後的結果,來制定營運策略或創造新的商業模式。
對企業來說,巨量資料可以協助他們進行趨勢預測和即時反應,而在資訊爆炸的時代,如何有效管理、分析這些潛藏商機的巨量資料,就是重要課題。
由於Google是網路搜尋引擎,透過龐大的關鍵字查詢數據,進一步分析全球使用者,可以將每月在Google進行的1,000億筆搜尋,列出熱門搜尋排行,甚至能夠預測股票市場的走勢和經濟指標。
解析大數據 制定商業模式
此外,政府、學校目前都漸漸意識到巨量資料庫的重要性,而開始建置「巨量資料平台」,就像是蘋果建立的App Store、Google的Play商店,同樣的思考和經營模式,未來所有的企業和個人,都可以在巨量資料平台上,擷取自己需要的資料,進行分析並做具商業或研究價值的應用。
像是在食品安全的威脅下,任何生鮮或食品都可以貼上微型晶片,晶片直接連接上雲端的食品履歷,消費者只要用手機一刷,馬上就知道食品的生產過程。
如果能夠利用巨量資料,分析過去地震和海嘯發生前的數據,將來就有可以更精確並提早鎖定震區和海嘯的級數,預防人命和財產的損失。
未來新工作─巨量資料科學家
在雲端運算時代,用大量的電腦運算巨量資料已非難事,重點在於資料跑出來之後,有沒有人可以正確判讀出它所代表的意義、做出趨勢判斷。
因此,可以預見未來能夠解讀巨量資料的人,將是政府和企業的搶手人才。
台灣微軟營運行銷事業群總經理康容表示,微軟將這些具備解讀資料能力的人才,稱之為「巨量資料科學家」,這些職位非IT技術人員,反而是社會、心理、語言學的相關人才,更能勝任解讀資料的任務。