人民網
人民網>>觀點

人民日報人民要論:用好大數據須有大智慧

——准確把握、科學應對大數據帶來的機遇和挑戰

徐宗本
2016年03月15日04:33 | 來源:人民網-人民日報
小字號

 

  擁有大數據是時代特征,解讀大數據是時代任務,應用大數據是時代機遇。大數據作為一個時代、一項技術、一個挑戰、一種文化,正在走進並深刻影響我們的生活。黨的十八屆五中全會提出,“實施國家大數據戰略”。實施國家大數據戰略,必須理性認識大數據,准確把握其帶來的機遇,科學應對其帶來的挑戰,用大智慧實現大數據的大價值。

  理性認識大數據

  信息技術革命與經濟社會活動的交融催生了大數據。大數據是經濟社會、現實世界、管理決策的片斷記錄,蘊含著碎片化信息。隨著分析技術與計算技術的突破,解讀這些碎片化信息成為可能,這是大數據成為一項新的高新技術、一類新的科研范式、一種新的決策方式乃至一種文化的原由。大數據是指數量特別巨大、種類繁多、增長極快、價值稀疏的復雜數據,簡而言之,是“大而復雜”的數據集。作為信息資產,大數據的價值需要運用全新的處理思維和解譯技術來實現。

  大數據具有大價值。在日常生活中,大數據的價值主要體現在:提供社會科學的方法論,實現基於數據的決策,助推管理革命﹔形成科學研究的新范式,支持基於數據的科學發現,減少對精確模型與假設的依賴,使過去不能解決的問題變得可能解決﹔形成高新科技的新領域,推動互聯網、物聯網、雲計算等行業深入發展,形成大數據產業﹔成為社會進步的新引擎,深刻改變人類的思維、生產和生活方式,推動社會變革和進步。大數據的價值主要通過大數據技術來實現。大數據技術是基礎性信息技術,它刻畫了新一代信息技術中機器與機器、機器與人之間信息交換的內容特征,構成了現代信息技術的基本信息處理模式。因此,大數據從信息載體這一底層捕捉到了信息化的共性基礎、未來發展與普適技術。這說明,大數據熱潮的來臨是一種必然,大數據技術不會是過眼雲煙。

  科學理解大數據的“大”。數據的積累是一個從量變到質變的過程。當數據積累不夠多時,沒有人能讀懂這些“碎片”背后的故事。但隨著數據的積累,特別是超過某個臨界值后,這些“碎片”整體所呈現的規律就會在一定程度上被顯現出來。可以認為,這一從量變到質變的臨界值是區分數據“大”與“不大”的標准。所以,大數據的“大”是相對的,是與所關注的問題相關的。隻有這樣理解,才能避免產生大數據能解決所有問題的誤讀。

  科學理解大數據的“復雜”。由於具有海量性、快變性、異構性和分布性等復雜特性,大數據技術是一項不斷發展的技術,並非已經成熟。這當然並不妨礙運用現有大數據技術從現實的各種大數據中獲得價值,但我們必須清楚:大數據的價值實現是無止境的,大數據理論、技術和產業將相伴而行。這是大數據發展的基本形態。

  准確把握大機遇

  大數據必將引領未來生活新變化、孕育社會發展新思路、開辟國家治理新途徑、重塑國際戰略新格局。實施國家大數據戰略,是對大數據意義、價值與作用的深刻認識與准確把握。那麼,大數據到底能給我們帶來什麼機遇?目前來看,大數據至少能在管理創新、產業發展、科學發現、學科發展四個領域為我們帶來前所未有的機遇。

  管理創新機遇。管理和決策問題通常是難以建模的。如今,基於大數據和大數據技術,人們可以使用極為豐富的數據資源對經濟社會發展進行實時分析,並幫助政府更好地對社會和經濟運行作出反應。大數據技術可以幫助我們實現夢寐以求的科學決策,實現科學決策具體化,從而推動管理理念、方式與方法的革命。在實踐中,運用大數據對國家政策進行預評估已成為可能。

  產業發展機遇。大數據是解決眾多國家重大現實問題的共性基礎,能夠為產業發展升級提供幫助。特別是大數據技術的底層性使得它很容易與其他行業、技術嫁接,從而形成以數據為資產、以現代信息基礎設施為基礎、以數據價值挖掘為創新要素的大數據產業。大數據可以為大眾創業、萬眾創新提供絕好平台。應用好大數據這一基礎性戰略資源,可以推動傳統產業改造升級,培育經濟發展新引擎和國際競爭新優勢。

  科學發現機遇。數據收集、處理與分析能力的提升,將顯著拓展人們對客觀世界洞察的深度和程序化探究問題的廣度。隨著數據積累和計算能力的提升,直接從大數據中獲取知識成為可能。這種基於大數據分析的探究方式彌補了過去單純依賴模型和假設解決問題方法論的不足,形成了一種新的科學研究范式:基於數據的科學發現。運用新的范式,一些過去不能解決或解決不好的問題現在變得可能解決。

  學科發展機遇。大數據時代,數理科學與人文社會科學、管理科學等學科的深度交叉融合將徹底打破和革新學科領域,統計學面臨革命,計算科學的內涵與外延將發生重大改變。一種融合統計、計算、信息與數學的數據科學正在形成。“解讀大數據是時代任務”的要求也將深刻改變和影響各門學科。這一改變勢必對大學的學科設置和人才培養產生重大影響,尤其將為大學培養國家創新發展急需的人才提供難得機遇。

  科學應對大挑戰

  大數據為國家創新發展帶來了大機遇,但要真正實現大數據的大價值,特別是將大數據轉化為現實生產力,還面臨一系列挑戰。

  科學基礎的挑戰。對大數據而言,分析才能出價值,關聯才能出價值。傳統用於分析關聯數據的統計學方法以抽樣數據為對象、以樣本趨於無窮的極限分布為基礎﹔而大數據所處理的對象是自然數據,既無明確的抽樣機制,也不大可能存在穩定的極限分布。這樣,傳統分析數據的科學基礎遭到動搖,必須重建統計學基礎、計算基礎與邏輯基礎。

  計算技術的挑戰。大數據的核心技術除了依賴解譯數據自身的方法論,採取什麼樣的計算架構去存儲,採取什麼樣的計算模式去支持快速查詢與處理,採取什麼樣的程序語言和算法去完成計算、分析和挖掘,這些都面臨技術上的挑戰,必須革新計算模式和計算方法。

  真偽性判定的挑戰。大數據具有大價值是無疑的,但如果從大數據中產生結論、形成決策的方法論基礎不堅實,直接運用大數據結論就可能是不可靠的甚至是危險的,難免讓大數據變成“大忽悠”。比如,國外一家企業發明的通過媒體、電商數據預測一個城市發生流感的大數據技術,近來就被科學家發現存在過分高估的情況,其原因正在於分析模型的偏差與統計科學基礎的缺失。所以,真偽性判定仍然是我們面臨的一個大挑戰。

  科學應對這些挑戰,需要大智慧。當前從政府層面看,應著力抓好以下5個方面:

  抓宏觀規劃與政策引導。國家大數據戰略讓我們明確了發展與運用大數據是國家意志,是實施創新驅動發展戰略的重大舉措之一。這個戰略應由一系列的規劃、政策、布局等構成。國家應在戰略上特別是在促進數據資源開放和共享、重點行業先行、產業轉型升級等方面統籌規劃、出台政策、扎實推進。

  抓數據資源管理與國家數據資源庫建設。在“人人都產生並希望擁有數據、人人都希望從數據中獲益”的大背景下,必須強化數據是國家資源的意識,重視建立國家數據資源庫。這樣的建設,首先應作為一項國家工程,統一規劃﹔其次應切實解決分級、分層、分行業建設與管理體制問題。當前,應特別注意大數據資源意識所誘發的行業數據保護以及數據資源流失與濫用問題,切實將大數據資源用於服務人民、服務國家建設。

  抓行業引領與重點示范工程。實施國家大數據戰略,可從抓重點行業、重點工程入手。一些行業如電力、交通、金融服務、互聯網、制造業等,對國家經濟發展影響巨大,數據積累豐富,並且有專屬性、共享相對容易等特點。率先推動這些行業運用大數據加快發展,有重要的帶動性和示范性。另外,作為整體布局,在國家層面推動一批大數據應用工程也是重要和必要的。例如,推進稅務、財政、投資監管等大數據應用工程,都可能產生意想不到的效果。

  抓共性基礎與核心技術研發。投資大數據、應用大數據已是當下大眾創業、萬眾創新的熱情所在與價值選擇。誰為這樣的大眾熱情負責?誰來保証各行各業大數據應用的健康可持續發展?這無疑是國家責任。擔負這一責任,最重要的就是推動大數據科學基礎的夯實和大數據關鍵技術的研發。我們不能再走“拿來主義”的老路,不能沒有規劃而任其自由發展。國家應組織力量,下大力氣解決大數據應用的共性基礎和關鍵技術突破。

  抓大數據人才隊伍培養。推動大數據產業發展,提升國家大數據運用能力,人才是第一位的。“懂數據、會分析”的復合型人才缺乏是當下國內外面臨的共同困難。在這種情形下,我國應發揮體制優勢,迅速動員各高校、研究機構快速設立一批適應各層次需求的大數據人才培養項目,加快形成支撐國家大數據戰略實施的強大科學研究與應用人才隊伍。

  (作者為中國科學院院士、西安交通大學教授)


  《 人民日報 》( 2016年03月15日 07 版)

(責編:白宇、文鬆輝)

分享讓更多人看到

返回頂部