政府部門、BAT為代表的互聯(lián)網(wǎng)企業(yè)、運營商是當前中國大數(shù)據(jù)的主要擁有者。除此之外,利用網(wǎng)絡爬蟲或公開應用程序接口API等途徑對網(wǎng)絡數(shù)據(jù)進行采集也是一大重要來源。在大數(shù)據(jù)時代,擁有數(shù)據(jù)就擁了核心資源:工業(yè)時代,石油是最大的巨頭,數(shù)據(jù)時代,BAT等因為擁有最多、最全的搜索、電商和社交數(shù)據(jù),也成為絕對的王者。此外,一些在細分領域擁有入口資源的公司也是稀缺標的,如已發(fā)布位置大數(shù)據(jù)平臺的四維圖新等。
其中,數(shù)據(jù)存儲是產(chǎn)業(yè)鏈的支撐,參與者以傳統(tǒng)數(shù)據(jù)庫企業(yè)為主,國際上有IBM、Oracle、Intel、Green-plum等;國內(nèi)主要有華為、中興、同有、浪潮、中科曙光等,各家企業(yè)針對大數(shù)據(jù)應用的具體領域開展數(shù)據(jù)庫架構(gòu)和數(shù)據(jù)組織管理研究,形成各自的優(yōu)勢產(chǎn)品。數(shù)據(jù)安全是產(chǎn)業(yè)發(fā)展的重要保障,滲透數(shù)據(jù)存儲、傳輸、交互的各個環(huán)節(jié),主要參與方包括賽門鐵克、360、啟明星辰、綠盟科技、美亞柏科等。而產(chǎn)業(yè)鏈最核心的當屬數(shù)據(jù)分析與挖掘,其能力直接決定著大數(shù)據(jù)應用的推廣程度和范圍。數(shù)據(jù)分析一是從大量的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)中分析出計算機可以理解的語義信息或知識,二是對隱性的知識,如關聯(lián)情況、意圖等進行挖掘。當前Hadoop、Spark是使用較為廣泛的兩種開源處理框架,算法層面除分類、聚類、關聯(lián)規(guī)則挖掘、序列模式挖掘等常用方法外,神經(jīng)網(wǎng)絡算法受益人工智能關注度再次高漲,國際上主要參與者包括谷歌、亞馬遜、Facebook、IBM、甲骨文、微軟等,國內(nèi)主要包括海康威視、科大訊飛、BAT、網(wǎng)易、智慧星光、思必馳等。
應用為王,對大數(shù)據(jù)分析結(jié)果進行應用是完成產(chǎn)業(yè)商業(yè)化目標,實現(xiàn)價值的終點。經(jīng)過近幾年的發(fā)展,大數(shù)據(jù)應用已滲透政府、電信、金融、人力資源、醫(yī)療、物流、等多個行業(yè)。分析認為應用市場的成熟程度與數(shù)據(jù)的完備性息息相關,當前,政府、BAT、運營商是數(shù)據(jù)源的主要擁有者,因此為這些領域服務的數(shù)據(jù)應用廠商擁有部分先天優(yōu)勢,對比市場空間、政策傾向及惠及民生等方面,目前市場更為看好政務大數(shù)據(jù)及醫(yī)療大數(shù)據(jù)市場。而從產(chǎn)品形態(tài)看,整體解決方案商掌握多元技術、跨場景服務能力強、可解決客戶的綜合性需求,因此更容易樹立標桿案例,燈塔效應明顯。
大數(shù)據(jù)時代對企業(yè)的存儲架構(gòu)、數(shù)據(jù)中心的基礎設施等提出了挑戰(zhàn),為了更快、更好、更準確地按需存儲數(shù)據(jù),需要企業(yè)提高存儲性能和計算能力,這些潛在需求的存在為存儲器和服務器等硬件提供商提供了一個不錯的發(fā)展機會。但是,由于國際巨頭在存儲和服務器市場壟斷優(yōu)勢明顯,中國本土企業(yè)很難獲得較大的市場機會。
雖然近幾年,在傳統(tǒng)數(shù)據(jù)庫軟件市場,國產(chǎn)數(shù)據(jù)庫比重持續(xù)提升,但Oracle、IBM、Microsoft和Sybase依然牢牢占據(jù)國內(nèi)數(shù)據(jù)庫軟件市場的前四位,擁有超過90%的市場份額。而大數(shù)據(jù)時代的數(shù)據(jù)庫軟件將更多是基于新一代的Nosql架構(gòu),中國企業(yè)無論是技術積累還是市場開拓離國際企業(yè)仍有較大差距。因此,短期內(nèi)不看好中國企業(yè)在基礎軟件層的投資機會。