導(dǎo)讀:不少人可能會奇怪地發(fā)現(xiàn),自己在購物網(wǎng)站關(guān)注過某類商品后轉(zhuǎn)去另一個門戶網(wǎng)站看新聞時,旁邊播放的居然是他剛剛表達(dá)過興趣的商品介紹!這并非偶然,隨著社會的日益數(shù)字化,大數(shù)據(jù)正在闖入每個人的日常生活。
不少人可能會奇怪地發(fā)現(xiàn),自己在購物網(wǎng)站關(guān)注過某類商品后轉(zhuǎn)去另一個門戶網(wǎng)站看新聞時,旁邊播放的居然是他剛剛表達(dá)過興趣的商品介紹!
這并非偶然,隨著社會的日益數(shù)字化,大數(shù)據(jù)正在闖入每個人的日常生活。
處處皆有大數(shù)據(jù)
今天,我們正處于一個大數(shù)據(jù)時代。
新浪微博在晚上高峰期一秒鐘接受100萬以上的響應(yīng)請求;百度每天要處理約60億次搜索需求;中國聯(lián)通用戶上網(wǎng)記錄一秒鐘就能收集83萬條……
在巨量信息中,可以明顯感受到大數(shù)據(jù)的來勢兇猛。而每一個受眾同時也是這巨量信息的制造者。不知不覺中,人們在電子操作時留下的“數(shù)據(jù)碎片”實時地向大眾日常生活的所有角落滲透。
在數(shù)字化社會中,當(dāng)人們在網(wǎng)上購物、下載音樂、發(fā)送電郵、檢索詞條、發(fā)微博時,都會在不經(jīng)意間留下一串串?dāng)?shù)字足跡。有統(tǒng)計表明,自人類文明開始到2003年,人類共創(chuàng)造了5TB(兆億字節(jié))的信息。而現(xiàn)在,這樣的數(shù)據(jù)量僅需兩天就能夠被創(chuàng)造出來,且速度仍在加快。
當(dāng)研究者把人們購買商品前的瀏覽價格、觀看電影前搜索影評等數(shù)據(jù)搜集進(jìn)一步分析后,便能夠獲得人們行為習(xí)慣的有效信息。
例如,商家通過分析客戶的購買行為了解客戶消費(fèi)取向和習(xí)慣后,即可進(jìn)行有針對的營銷以提升業(yè)務(wù);警方通過分析幾十年的犯罪記錄,可以預(yù)測犯罪行為模式與頻率,從而有針對地安排警力……
“100多年來,統(tǒng)計學(xué)家們一直依賴小規(guī)模數(shù)據(jù)樣本,因為他們沒有能力收集更多數(shù)據(jù)?!蔽錆h大學(xué)信息管理學(xué)院教授沈陽介紹說,電子網(wǎng)絡(luò)技術(shù)意味著我們可以“收集到大量數(shù)據(jù),而不是滿足于樣本”,“借助大數(shù)據(jù),分析者可以比以往任何時候都更加了解研究對象?!?/P>
大數(shù)據(jù)改變生活
更多人真正關(guān)心的是,大數(shù)據(jù)究竟能給自己帶來什么?
百度在大數(shù)據(jù)應(yīng)用方面的成果就是一例很好的證明——百度搜索整合了線上、線下的海量數(shù)據(jù),為百姓提供滿足民生需求的醫(yī)療、交通等服務(wù)。用戶可以在搜索引擎中很便捷地獲取相關(guān)病癥的原因、癥狀、治療等信息;甚至可以通過搜索引擎,在線咨詢醫(yī)生、在線掛號。這極大地降低百姓獲得醫(yī)療信息和服務(wù)的門檻。
事實上,通過運(yùn)用過去無法獲取的數(shù)據(jù)來催生新的服務(wù),無疑是人們對未來大數(shù)據(jù)時代的最大期望。
對個人用戶而言,大數(shù)據(jù)可以預(yù)測機(jī)票價格走勢,為自費(fèi)旅游者省錢;預(yù)測交通擁堵情況,幫助人們選擇更好的時段和路線節(jié)省出行時間;也可以提供更準(zhǔn)確的書單,幫你發(fā)現(xiàn)更多好書……
種種跡象顯示,從最初的大數(shù)據(jù)定義之爭,到挖掘大數(shù)據(jù)應(yīng)用價值、協(xié)商合作方向,大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)進(jìn)入務(wù)實發(fā)展階段,我國《“十二五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》明確提出“加強(qiáng)以海量數(shù)據(jù)處理軟件等為代表的基礎(chǔ)軟件的開發(fā)”。今天,這種務(wù)實發(fā)展不僅體現(xiàn)在大數(shù)據(jù)應(yīng)用的落地上,還表現(xiàn)在大數(shù)據(jù)價值向縱深層面延展上,從互聯(lián)網(wǎng)企業(yè)利用大數(shù)據(jù)提升自身服務(wù)質(zhì)量、企業(yè)利用自有數(shù)據(jù)提升經(jīng)營效率,發(fā)展到整合社會數(shù)據(jù),為百姓生活、產(chǎn)業(yè)發(fā)展提供服務(wù)。如北京公交一卡通每天產(chǎn)生4千萬條刷卡記錄,分析這些刷卡記錄,可以清晰了解北京市民的出行規(guī)律,以有效改善城市交通。
國家發(fā)展需要大數(shù)據(jù)
一組數(shù)據(jù),可能會發(fā)揮超出數(shù)據(jù)收集者想象的作用,也可能在另一個原本看起來毫無關(guān)聯(lián)的領(lǐng)域里產(chǎn)生巨大影響。在不久的將來,很多原來單純依靠人類自身判斷力的領(lǐng)域應(yīng)用,最終都將被計算機(jī)系統(tǒng)的數(shù)據(jù)分析和數(shù)據(jù)挖掘功能所改變甚至取代。
大數(shù)據(jù)將給各行各業(yè)帶來變革性機(jī)會。對此,作為國慶前夕中共中央政治局集體學(xué)習(xí)中關(guān)村課堂的現(xiàn)場講解者、百度公司董事長李彥宏感受至深。他認(rèn)為,國家層面要發(fā)展大數(shù)據(jù),就要促進(jìn)數(shù)據(jù)開放,扶持科研、培育人才。“大數(shù)據(jù)是新的起跑線,不僅會帶動我國信息產(chǎn)業(yè)在國際競爭中的超越,還會推動傳統(tǒng)產(chǎn)業(yè)升級發(fā)展。國內(nèi)大數(shù)據(jù)技術(shù)正通過自主創(chuàng)新而成為驅(qū)動中國發(fā)展的重要戰(zhàn)略資源?!?/P>
根據(jù)預(yù)測,大數(shù)據(jù)及其處理技術(shù)將會在未來10年改變幾乎所有領(lǐng)域的業(yè)務(wù)功能。從科學(xué)研究到醫(yī)療保險,從銀行業(yè)到互聯(lián)網(wǎng),都將面臨爆發(fā)式增長的海量數(shù)據(jù)及其派生的巨大經(jīng)濟(jì)收益。IDC發(fā)布的《中國大數(shù)據(jù)技術(shù)與服務(wù)市場2012-2016年預(yù)測與分析》顯示,中國大數(shù)據(jù)市場規(guī)模將會從2011年的7760萬美元增長到2016年的6.17億美元,未來5年的復(fù)合增長率達(dá)51.4%,市場規(guī)模增長近7倍。
“當(dāng)然,在大數(shù)據(jù)技術(shù)的研究和應(yīng)用開發(fā)中,也不可忽視安全和個人隱私保護(hù)等問題?!鄙蜿柋硎荆环矫嬉哟髮Υ髷?shù)據(jù)的處理能力、真正為百姓造福,另一方面也需要加強(qiáng)相關(guān)領(lǐng)域的監(jiān)管、防止負(fù)面影響,這些都是需要在發(fā)展中深入考量的。