Kaleido是一款基于分布式存儲(chǔ)架構(gòu)和分布式計(jì)算框架的特征工程平臺(tái),可以最大限度地從原始數(shù)據(jù)中提取特征以供算法和模型使用。數(shù)據(jù)科學(xué)家的工作中,有80%的時(shí)間都在獲取、清洗和特征處理,Kaleido通過分布式存儲(chǔ)架構(gòu)和分布式計(jì)算框架,快速完成這80%的工作量,將數(shù)據(jù)轉(zhuǎn)換為能更好的表示業(yè)務(wù)邏輯的特征,從而提高機(jī)器學(xué)習(xí)的性能。??