6月20日至21日,《中國企業(yè)家》雜志社在2020(第二十屆)中國企業(yè)未來之星年會(huì)暨中國企業(yè)家生態(tài)大會(huì)上公布了2020年度“中國科創(chuàng)企業(yè)百強(qiáng)”(簡稱“科創(chuàng)百強(qiáng)”)評(píng)選結(jié)果。作為國內(nèi)領(lǐng)先的HTAP國產(chǎn)數(shù)據(jù)庫與人工智能底層軟件提供商,天云數(shù)據(jù)從眾多企業(yè)中脫穎而出,榮登榜單。
本屆大會(huì)聚焦“共享數(shù)智化紅利”,挖掘推動(dòng)人類社會(huì)生產(chǎn)生活新一輪變革的創(chuàng)新科技。新技術(shù)的聚變,加速了以數(shù)字化和智能化為主要特征的產(chǎn)業(yè)轉(zhuǎn)型,一場影響深遠(yuǎn)的變革正在發(fā)生。
回顧數(shù)據(jù)科學(xué)的發(fā)展歷史,重新審視一下數(shù)據(jù)科學(xué)的現(xiàn)狀及未來,嘗試發(fā)現(xiàn)數(shù)據(jù)科學(xué)成功在工業(yè)界應(yīng)用的銀色子彈。2015年,斯坦福大學(xué)統(tǒng)計(jì)學(xué)教授David Donoho在普林斯頓大學(xué)舉辦的John Tukey百年紀(jì)念大會(huì)上做了《數(shù)據(jù)科學(xué)50年》的報(bào)告。該文回顧了數(shù)據(jù)科學(xué)50年來的發(fā)展歷史,并對(duì)數(shù)據(jù)科學(xué)的現(xiàn)狀做了總結(jié),報(bào)告指出:數(shù)據(jù)科學(xué)包括六個(gè)重大分支:數(shù)據(jù)探索和準(zhǔn)備、數(shù)據(jù)表示與轉(zhuǎn)換、數(shù)據(jù)計(jì)算、數(shù)據(jù)建模、數(shù)據(jù)可視化與表示以及數(shù)據(jù)科學(xué)的科學(xué)性。數(shù)據(jù)科學(xué)家往往會(huì)發(fā)現(xiàn),他們工作的一個(gè)中心步驟是通過適當(dāng)?shù)霓D(zhuǎn)換,將原始的數(shù)據(jù)表示重構(gòu)成新的,更具有啟發(fā)性的形式。而完成這一中心步驟,需要數(shù)據(jù)科學(xué)家發(fā)展兩種能力:
NewSQL:當(dāng)今數(shù)據(jù)表示的方式非常多樣,從文本文件、電子表格到SQL、NoSQL數(shù)據(jù)庫、分布式數(shù)據(jù)庫、流式數(shù)據(jù)庫等,數(shù)據(jù)科學(xué)家需要熟悉使用所有這些數(shù)據(jù)表示形式相關(guān)的數(shù)據(jù)結(jié)構(gòu)、轉(zhuǎn)換和算法
特征工程:對(duì)于特定類型的數(shù)據(jù),如聲音、圖像、傳感器和網(wǎng)絡(luò)數(shù)據(jù),采用特定的數(shù)學(xué)表示形式將會(huì)對(duì)數(shù)據(jù)分析非常有益。如,為了獲取聲音數(shù)據(jù)特征,往往需要對(duì)其進(jìn)行同態(tài)濾波或進(jìn)行傅里葉變換;為了獲取圖像數(shù)據(jù)特征,往往進(jìn)行小波變換或其他多尺度變換(例如,深度學(xué)習(xí)中的圖像金字塔等)。數(shù)據(jù)科學(xué)家研究出了各種成熟的算法以及相關(guān)的評(píng)價(jià)準(zhǔn)則。
天云數(shù)據(jù)的AI系列產(chǎn)品,完美的滿足了報(bào)告指出的數(shù)據(jù)科學(xué)家必須發(fā)展的兩種能力 :
HTAP混布數(shù)據(jù)庫充當(dāng)AI應(yīng)用的底座,完美滿足各種不同格式、不同規(guī)模的數(shù)據(jù)存儲(chǔ)與查詢的需求,使得數(shù)據(jù)科學(xué)家無需掌握多種數(shù)據(jù)庫的使用,即可滿足工作需求。

天云依靠新型分布式數(shù)據(jù)庫與特征工程平臺(tái),這兩個(gè)平臺(tái)引擎的巨大動(dòng)能,正在幫助這些企業(yè)實(shí)現(xiàn)知識(shí)再生產(chǎn)的規(guī)模性變革,創(chuàng)造出多元機(jī)會(huì);同時(shí),天云也在和這些積極利用AI的企業(yè)并駕齊驅(qū),好風(fēng)憑借力,雙雙實(shí)現(xiàn)彎道超車。