未來的商業競爭,是數據的競爭。
隨著數字經濟在全球的加速推進以及 5G、人工智能、物聯網等相關技術的快速發展,數據影響商業競爭的關鍵戰略性資源地位的觀點,已經獲得普遍認可。只有獲取和掌握更多的數據資源,才能在新一輪的全球商業競爭中占據主導地位。
2014年3月,“大數據”一詞首次被寫入政府工作報告,大數據開始成為國內社會各界的熱點。2016年3月,《十三五規劃綱要》正式提出“實施國家大數據戰略”,國內大數據產業開始全面、快速發展。隨著國內大數據相關產業體系日漸完善,各類行業融合應用逐步深入,國家大數據戰略走向深化階段。
2020年,數據正式成為生產要素,數據要素市場化配置上升為國家戰略。可見,“大數據”已經不僅是大量的數據,更進化成一種全新的思維方式和時代標志。從數據到“大數據”,數據之大,究竟何為?
從體量之大到價值之大
大數據,顧名思義,可以解釋為大量的數據。大數據技術,則是通過獲取、存儲、分析,從大容量數據中挖掘價值的一種全新的技術架構。
從數據的體量來看,傳統的個人電腦、處理的數據,是GB/TB級別的數據。其中,1 KB = 1024 B (KB - kilobyte) ;1 MB = 1024 KB (MB - megabyte) ;1 GB = 1024 MB (GB - gigabyte) ;1 TB = 1024 GB (TB - terabyte) 。比如,硬盤就通常是1TB/2TB/4TB的容量。
而大數據則處理的是PB/EB/ZB級別的數據體量。其中,1 PB = 1024 TB (PB - petabyte) ;1 EB = 1024 PB (EB - exabyte) ;1 ZB = 1024 EB (ZB - zettabyte)。
如果說一塊1TB的硬盤可以存儲大約20萬張的照片或20萬首MP3音樂,那么1PB的大數據,則需要大約2個機柜的存儲設備,儲存約為2億張照片或2億首MP3音樂。1EB,則需要大約2000個機柜的存儲設備。
當前,全球數據量仍在飛速增長的階段。根據國際機構 Statista的統計和預測,2020年全球數據產生量預計達到 47ZB,而到2035年,這一數字將達到2142ZB,全球數據量即將迎來更大規模的爆發。換言之,大數據時代已真正降臨。
除了體量之大,大數據真正的“大”還在于其發揮的價值之大。早在1980年,著名未來學家阿爾文·托夫勒在他的著作《第三次浪潮》中,就明確提出“數據就是財富”這一論斷,大數據的核心本質,就是價值。
事實上,社會各界之所以對大數據抱以極大的熱情,認為引入大數據能夠提高自身的競爭力,是因為通過大數據處理與分析,人們能夠洞悉客戶、友商、產品、渠道在各個維度的信息情報和知識洞見,借此為創新應用模式及商業模式的設計提供研判線索和技術基礎。
以芝麻信用為例,其從身份特質、行為偏好、人脈關系、信用歷史、履約能力等多個角度對一個自然人的相關數據進行搜集和匯聚,在此基礎上對個人進行信用研判。根據信用評級就可以進一步進行信用騎行、便利交通、基礎通信、信用借還、信用回收等一系列產品的設計和運維。
此外,作為一種商品,數據可以買賣,可以增值,這也是大數據時代的一個基本特征。
國外數據交易大致開始于2008年,一些前瞻性的企業開始加大對數據業務的投入。初見端倪的數據應用新業態包括“數據市場”、“數據銀行”、“數據交易公約”等,知名數據服務商則有Microsoft數據市場、Amazon公共數據集、Oracle在線數據交易等。
國內數據交易則起步于2010年左右。2015年9月,我國發布的《促進大數據發展行動綱要》中明確提出要引導培育大數據交易市場,開展面向應用的數據交易市場試點,探索開展大數據衍生產品交易,建立健全數據資源交易機制和定價機制。
可以說,不同利益主體迥異的價值期望都是大數據價值實現的目標,也正因為大數據的“大價值”,才引發了社會各界對大數據的普遍關注。
在向好里審慎大數據的未來
大數據的價值在2020年疫情的強壓力測試下得以彰顯。
比如,通過大數據可以對疫情監測追蹤和防控救治。在疫情趨勢研判、流行病學調查、輿情信息動態、人員遷徙和車輛流動、資源調配和物流運輸等方面,通過政企合作開發大數據分析產品或服務,為政府、企業和公眾提供實時動態的信息以輔助決策。
諸多大數據企業和互聯網平臺發揮了大數據技術的優勢,為人們提供線上教育、在線醫療、遠程辦公、無接觸外送、在線娛樂等服務,大批中小微企業開啟數字化轉型。
在大數據技術一片利好的景況下,大數據實現狂飆突進。但也正因為如此,我們才更應認真審視大數據的發展和未來。
其中,數據的品質——數據的準確性、完整性、可追溯性、持續性、真實性和共享性,決定了大數據價值實現的最終成果。針對特定領域的數據集越龐大、越真實、越準確、越可追溯、維度越豐富、越協同共享,越能得出最佳算法并帶來競爭優勢。
然而,從準確度來看,盡管用戶源源不斷地產生數據,對于企業來說,數據的收集和存儲能力并不構成障礙,但90%的數據沒有被真正利用起來,成了“廢數據”。
數據的準確性,特別要強調與特定場景的相關度。比如,傳媒、金融、醫療等各行業需要的細分數據不同,具體到同一行業的子領域也不同。比如,在醫療領域,心血管疾病和癌癥診斷所要的細分數據就不一樣。但現下,大部分人工智能的應用場景,都是針對一個具體的任務。
就融通和共享來看,數據的品質也并不理想。政府服務方面,來自各個部門、各個渠道的數據口徑不規范、標準不統一、時間不準確、可信度不高等問題較為普遍。并且,數據質量堪憂,數據資源統籌管理不足,導致數據散而不聚、聚而不通、通而難用。
而促進政務數據、公共數據共享開放的制度規章和政策措施也還不健全,限制數據有序安全流動的體制機制障礙仍然存在,信息孤島、數據壁壘問題突出。分級分類、權責清晰的數據管理制度體系還未建立。數據要素市場培育發展滯后,數據交易流通體系建設尚處探索初期,企業間、行業間數據共享開放不理想。
除了數據的品質外,大數據的最大挑戰,就是安全。數據是資產,也是隱私。沒有人愿意自己的隱私被暴露。所以,人們對自己的隱私保護越來越重視。對數據安全和個人隱私的保護,是大數據行穩致遠的重要因素。
然而,現階段,卻尚未建立起適用于大數據環境下的數據分類分級安全保護制度。個人信息保護和數據安全管理跟不上快速發展的形勢需要,存在個人隱私泄漏、數據泄露以及數據濫采濫用、不當使用和違規違法交易數據等風險。而即使企業合法獲取數據,也要擔心是否會被惡意攻擊和竊取。
最后,數據監管仍相對滯后。行業、企業及機構數據龐雜分散和集中集聚現象并存,互聯網巨頭存在利用數據不公平競爭、限制競爭的壟斷風險,針對大數據“殺熟”、平臺“二選一”等問題的數據和算法監管相對空白。
近年來,大數據技術的內涵伴隨著大數據時代的發展產生了一定的演進和拓展,從基本的面向海量數據的存儲、處理、分析等需求的核心技術延展到相關的管理、流通、安全等其他需求的周邊技術,逐漸形成了一整套大數據技術體系,成為數據能力建設的基礎設施。
如今,大數據已進入一個新的發展階段,一個需要技術、產業和制度、標準協同推進的新階段。大數據作為一個時代熱詞,更代表了一種全新的思維方式和時代標簽。時代誕生了大數據技術,大數據技術也正重塑著時代。
評論