精品无码一区二区三区,无码一区二区三区免费,国产精品9999久久久久,亚洲熟妇av一区二区三区宅男

2023年10月21日,作為“全球資產管理中心 上海國際活動周2023”最后一場(第十天)重要活動,“第四屆1024資管科技開發者大會(ITDC 2023)——資產管理垂直領域大模型開發與應用”(智能投研技術聯盟ITL成員機構發展年會),在上海臨港的“世界頂尖科學家論壇永久會場”(臨港中心)圓滿舉行。

這是一個首創的集聚當今國內有影響力的通用大模型和資產管理垂直領域大模型開發應用的數智金融前沿技術發展大會,也是一個在上海國際金融中心城市集聚當今金融資管領域有影響力數智技術專家學者的大會,強烈吸引了業內外、海內外專業技術人士。全天大會歷時9個多小時,線上參會約230萬人次、現場參會近500人。

大會集中創新優勢,突出數智科技前沿性和垂直領域應用性。ChatGLM(智譜AI)、文心一言(百度云)、訊飛星火認知大模型(科大訊飛)、書生·浦語大模型(上海AI Lab)、盤古大模型(華為云)、孟子大模型(瀾舟科技)、百川大模型(百川智能)等國內主要通用大模型以及LightGPT(恒生電子)、文因大模型(文因互聯)和天云Elpis(天云數據)等金融資管垂直領域大模型在大會上分別作技術、功能與金融應用等交流。來自銀行、保險、券商、資管、科技企業、高校、專業技術社團等數智科學專家結合自身開發實踐作研討分享。
集聚通用大模型與資管垂直大模型

ITDC 2023現場檢驗大模型回答資管行業問題的能力

會上,中國計算機學會(CCF)上海分部主席、智能投研技術聯盟(ITL)首席高級技術顧問、恒生電子股份有限公司首席科學家、研究院院長白做了技術報告分享,并在現場隨便拋出一個問題:“中國有幾個證券交易所?”邀請各家大模型廠商現場回答。

提問完,白院長也做了總結:定式回答是2家;但是比較新的回答是3家,還需要加上北交所;但是加上北交所就完事了嗎?還有港交所、臺交所,港臺也是中國的一部分。

天云數據專注私域大模型,支撐證監會全部法規(不含更新數據),針對證券行業問題回答正確且有完整溯源。

(天云數據的回答)

為什么天云數據大模型能精準回答且做到溯源?

Elpis已經從Training 步入Serving實現大模型2.0階段

如今,國內已進入百模大戰階段。通用模型和私域模型一直是行業熱門探討的問題。那么試問,什么是私域模型?

私域模型不是小模型,不是通用模型版的裁剪版,從通用模型到私域模型,是從“造輪子”到“造車”的過程。天云數據大模型已經實現從1.0的造輪子(Training)2.0的Serving(造車)階段,結合企業自己的私域數據、算力,保障行業數據的安全性,完成行業大模型實現大模型的新階段。

天云數據私域大模型Elpis基于遷移學習對大語言模型進行微調,使模型語境更適用于當前私域數據場景,并且做到答案可精確溯源,最后通過模型管理進行服務的發布供用戶使用。在生成時可以引用原有法條做準確嚴謹回答,對比通用大模型,更適合機構私有數據。

為什么大模型火爆之后資本將重點都轉向了向量數據庫?為什么云原生越來越重要?為什么OpenAI做大模型要外采Ray和Wandb,自動化機器學習對大模型有什么價值?通過一體機訓練的邏輯能不能走向大模型的未來?針對這一系列問題,天云數據CEO雷濤會上分享的《去除幻像的大模型落地路徑》給了我們答案。

1、為什么大模型火爆之后資本將重點都轉向了向量數據庫?

大模型的語料需要預處理轉化為向量數據,向量化數據的存儲還需要一個分布式向量數據庫進行支撐,這也是非結構化數據大模型場景工程化落地必然路徑。

那么到底是做向量數據庫還是在現有數據庫中加上向量引擎?北美的向量數據庫創業公司Chroma,底層使用是實時分析數據庫ClickHouse。“僅僅”是在著名實時分析數據庫ClickHouse上封裝了一層而已,Chroma便一躍成為新晉向量數據庫,由此可見一斑。與其投資新的向量數據庫項目,還不如關注現有數據庫中哪些加上向量引擎可以變得更加強大。

2、為什么云原生越來越重要?

AI原生數據庫在實現數據庫的向量化有先發優勢。以天云數據Hubble為例,向量化Retrieve是Hubble數據庫和Kaleido特征工程的一個組合,也就特征工程產品里的十幾種的向量方法,比如高斯距離、最短近鄰的算法,將這十幾種的向量方法封裝在Hubble數據庫的解析層,實現數據庫的向量化能力構建。

這也是Databricks用AI釋放數據潛力的方法。因為Databricks歷來都有自研的AI產品,具備技術能力發布大模型產品釋放數據價值。

3、為什么OpenAI做大模型要外采Ray和Wandb,自動化機器學習對大模型有什么價值?

在國內大談大模型的時候,硅谷資本已經開始熱追向量數據庫、強化學習平臺、機器學習平臺,因為OpenAI ChatGPT模型迭代訓練用的技術棧唯一依賴第三方開源的技術框架Ray/Wandb就是兩個機器學習框架,這也是LLM生態的必不可少的技術。

天云數據在行業率先發布了私域數據大模型Elpis,其背后的技術支持框架是天云數據AI-PaaS平臺除了自身的機器學習平臺套件外,還兼容集成開源機器學習框架,Pytorch/TensorFlow/ Ray/Wandb/MXnet/Padddle等, 可以快速訓練及發布推理服務。強化學習完成大模型的有監督學習,實現大模型正確理解人類意圖。

4、通過一體機訓練的邏輯能不能走向大模型的未來?

今年第一季度,“LLaMA 7B/13B+指令=GPT 3.5Level”是否過度炒作?從其結果來看,OpenLLaMA-7B和LLaMA-7B得分都是0.55,主打一個勢均力敵。如此可見,OpenLLaMa 7B和13B的分工展現出開源社區在核心項目突破上正在變得更團結。而且從全鏈路來看,開源社區已經發展到了全覆蓋的階段,每個環節都有頭部的開源項目可用。

大模型行業將整個注意力轉向了Pre-Train環節,但試問,用預訓練模型finetune能不能走出大模型的未來?目前國內市場上的大模型大多通過微調finetune的方式實現,也就是依靠一眾的開源小模型。預訓練模型主導的“百模大戰”,天花板非常低,因為微調的方法只是決定了讓語言模型更適合于人類意圖,但是它不能夠決定模型的正確邏輯,因此同質化嚴重。

5、“百模大戰”的終點是“造車”核心看產業側誰能提供完整的生態服務!

“百模大戰”都是在造輪子,但最后誰家的“輪子”能夠成為基礎設施?事實上,我們都知道,無論“輪子”多好,但只有“輪子”是肯定不行的。產業側的企業需要理性看待市場并合理分工,LLM需要組建自己的生態環境,這樣才能最快的呈現Agent服務。

能提供Agent服務一定會有一個前提,就是產業有完善的AI Infra。近期人工智能的熱點主要體現在生成式模型上,但無論是將私域數據遷移,還是需要一些向量化的數據庫支撐還是Generative Agents以及強化學習RLHF都需要借助傳統機器學習的方法和流水線來完成。甚至在BERT小模型階段還依賴于知識圖譜KG的嚴謹推理方式的工程組合,這些都需要科創公司就緒全棧AI的能力。

面向大模型的訓練和開發部署,一定是更強的Base Model和比SFT指令數據更進一步反饋的數據是突破瓶頸的方向。開源社區模型不具備真正智能,更好的小模型來自大模型的Scale Down。

在中國的市場,一個新事物落地要想完成最小級閉環很難通過生態的之間的合作來完成,因此需要一個全棧技術的持續投入,尤其是LLM之上的AI Infra,沒有所謂秘方和捷徑。

主站蜘蛛池模板: 岳普湖县| 普定县| 房产| 南阳市| 康平县| 缙云县| 普定县| 九寨沟县| 丘北县| 海丰县| 霍邱县| 镇坪县| 土默特右旗| 尖扎县| 邵武市| 筠连县| 卓资县| 南康市| 乌鲁木齐县| 阿尔山市| 砀山县| 泰兴市| 庄河市| 太白县| 阿坝县| 理塘县| 庐江县| 卓尼县| 民权县| 东乌珠穆沁旗| 南平市| 阜康市| 利津县| 靖州| 晋中市| 青田县| 九江县| 政和县| 修水县| 广昌县| 屏东市|