青草青草久热精品视频在线观看 ,暴力调教一区二区三区,日韩夜夜高潮夜夜爽无码 http://www.heke.net.cn 獲取機器智能像讀書一樣簡單 Tue, 15 Jul 2025 06:10:48 +0000 zh-CN hourly 1 讓專業投資更簡單 金融領域探路AI大模型應用 http://www.heke.net.cn/?p=7263 Thu, 12 Dec 2024 04:48:03 +0000 http://www.heke.net.cn/?p=7263 天云數據CEO雷濤表示,大模型運用到監管領域也是一個比較可行的方案。如利用人工智能技術識別場外配資等,同時用AI構建全市場資管信托債類產品風險關聯圖譜。

]]>
AIGC推動 “人工智能新聞時代”到來 http://www.heke.net.cn/?p=7296 Fri, 06 Dec 2024 03:00:26 +0000 http://www.heke.net.cn/?p=7296 天云融創數據科技(北京)有限公司CEO雷濤從新聞生產速度、新聞語境共鳴、AI組織的思維鏈觀點流等方面作了系統闡述,分享了AI自動“拍攝”的宏大場面,AI自動生成的多場景、劇情豐富的電影,AI創意巧克力廣告片,短劇自動將中文翻譯成英文、韓文,能實現數小時音/視頻自動解析、多人對話自動區分發言人、精準定位關鍵內容和視頻片段等功能的AI采訪助手等實踐產品。

]]>
解碼“夢工廠”|天云數據:夯實基礎設施服務 讓AI為萬物賦靈 http://www.heke.net.cn/?p=7288 Sat, 30 Nov 2024 00:40:51 +0000 http://www.heke.net.cn/?p=7288

 

]]>
AIGC與“人工智能新聞時代”科學傳播活動舉辦 http://www.heke.net.cn/?p=7280 Fri, 29 Nov 2024 09:30:32 +0000 http://www.heke.net.cn/?p=7280 雷濤就“無真相,無共識”這個話題發表了自己的觀點。此外,雷濤從新聞生產速度、新聞語境共鳴、AI組織的思維鏈觀點流做了內容闡述,并分享了AI自動“拍攝”的宏大場面、AI自動生成多場景劇情豐富的電影劇情等實踐效果,重點推出了面向媒體的產品——AI采訪助手。

]]>
AIGC讓“人工智能新聞時代”到來 http://www.heke.net.cn/?p=7255 Thu, 28 Nov 2024 09:53:29 +0000 http://www.heke.net.cn/?p=7255 11月27日,由北京市科協主辦,北京科技記協承辦,天云融創數據科技(北京)有限公司協辦的AIGC與“人工智能新聞時代”科學傳播活動在京舉辦,活動由北京市科協宣傳文化部二級調研員、北京科技記協副理事長兼秘書長李磊主持。

活動邀請CCDI廣電云規劃專家、寶聯科技創始人?席利寶、天云融創數據科技(北京)有限公司CEO 雷濤、中國傳媒大學人工智能系副教授 陶竹林、中國科學報社原副總編輯、《醫學科學報》總編輯 張明偉分別作主題報告。

席利寶表示AI是新時代的新質生產力,AI高質量發展從能源+算力+算法+數據+網絡+安全都需要協同;廣電在AI時代應該緊握機會,塑造數字經濟中的獨特優勢,CCDI項目將對中國廣電發展起到樣板和示范作用;未來已來,中國廣電作為文化數字化國家隊、主力軍和排頭兵,當仁不讓為數字經濟發展注入動能,為中國特色的新型算力事業貢獻力量,為網絡強國、數字中國建設提供強有力的支撐。

雷濤就“無真相,無共識”這個話題發表了自己的觀點,他認為在這個碎片化信息時代,信息溯源和取證有待考證;此外,信息背景、知識背景、文化背景、邏輯判斷都難以讓人類達成共識。人工智能走到今天,爭論與分歧始終如影隨形,可以說AI的命運,正是在這些爭議與分歧中找到了真正的邊界與可能性,滿足了不確定時代不確定人群確定性的需求。此外雷濤從新聞生產速度、新聞語境共鳴、AI組織的思維鏈觀點流做了內容闡述,并分享了AI自動“拍攝”的宏大場面、AI自動生成多場景劇情豐富的電影劇情、AI森林巧克力廣告片、短劇自動完成中文轉英語韓語日語等實踐效果。重點推出了面向媒體的產品——AI采訪助手,該產品能實現數小時音/視頻自動解析;多人對話自動區分發言人、匯總發言觀點;此外可以通過“你問我答”的相識,精準定位關鍵內容和視頻片段,無需反復觀看視頻便快速定位采訪對象重點發言內容;最后,還可以多形態素材輸出,輕松復制文字素材或下載新合成的視頻素材。

陶竹林表示未來媒體即智能媒體,既要堅守內容的真實與價值,也要以創新引領時代變革。AI技術正在深刻重塑媒體生態,從精準內容生成到智能傳播路徑優化,為行業賦能無限可能。守正,是堅守媒體的社會責任與傳播倫理;創新,是運用AI等新技術推動媒體形態的升級與進化。擁抱AI,就是擁抱媒體的未來,它不僅是工具,更是智能時代的必然選擇。以技術為翼,守住初心,未來的智能媒體將更高效、更智慧、更有溫度。

張明偉介紹了中國科學報社開發出的“小柯”論文新聞寫作機器人的相關情況。他認為,將人工智能運用到科學新聞寫作能夠有效滿足科研人員更好了解國際前沿科研進展的需求,也能為科學傳播工作者提供初步選題線索。他建議媒體開發人工智能產品時要瞄準用戶需求,善于借用外力,大膽擁抱新技術。

中央廣播電視總臺、光明網、工人日報、中國財經報、未來網、北京廣播電視臺、北京日報、北京科技報等新聞媒體,北京科普發展與研究中心、北京科技記協及科技企業、科研機構等部門40余人參加活動。

]]>
大變革已來,數據驅動,金融數據與模型深度融合 http://www.heke.net.cn/?p=7273 Fri, 25 Oct 2024 01:00:04 +0000 http://www.heke.net.cn/?p=7273 天云數據CEO雷濤接受財聯社采訪時表示:關于大模型與數據之間的關系,核心在存量數據和增量數據。關于存量數據,核心需要關注的技術是大模型to DB,去解決如何跟上萬張表且高價值密度的企業數據庫的數據發生關系;關于增量數據,去解決如何持續的供給大模型以及大模型真正的算力出口在哪里,是提供服務還是提供新興的生產資料。供給我們更多的數據資源,也就是合成數據的概念。

]]>
第五屆1024資管科技開發者大會,天云數據CEO雷濤談大模型和數據的連接 http://www.heke.net.cn/?p=7241 Fri, 18 Oct 2024 11:00:57 +0000 http://www.heke.net.cn/?p=7241 2024年10月18日,作為“全球資產管理中心 上海國際活動周2024”壓臺活動,“第五屆1024資管科技開發者大會”在上海·臨港中心圓滿舉行。在媒體采訪環節中,天云數據CEO雷濤針對財聯社、上海證券報、21世紀經濟報道等媒體提問,核心談了對大模型和數據的連接問題。

在過去一年您的機構的實踐中,大語言模型在哪些場景上落地取得了成功?

您問題的核心在大語言模型,其實在基模(基礎模型)上,市場已經在第二代視覺多模態大模型和第三代空間認知大模型上取得了非常大的成果和突破。

當然,大語言模型是知識的容器,在整個流水線中扮演非常關鍵的位置,可以有效地處理視覺和空間感知的多維信號擴展人類的融合認知。

咱們現場舉例,就今天的采訪視頻,我們要如何去編輯處理?還是傳統的定位到每一幀每一秒去剪輯?大語言模型在多模態在空間認知上取得了非常大的一個成果,已經可以基于語言模型抽象出每一個嘉賓的核心觀點,還可以基于內容選擇,所見、所選及所得,把勞動力從重復性的工作中解放出來,實現場景式理解視頻內容。

Agent、RAG、GraphRAG,新大模型生態鏈技術層出不窮,在未來發展中,您看好哪些新的發展方向?它們會如何在資管領域取得應用?

針對這個問題,我想先談一下大模型和數據的關系。因為我們天云數據本身就同時做數據供給側的混合負載數據庫和數據消費側的機器學習平臺。

那么,為什么我們要關注大模型和數據?

這個可以從存量和增量兩個方向上去看:存量是這兩年的主流,就是把已有的知識做知識封裝和知識移動,一種端到端的訓練方法;增量是用RAG、用向量數據庫外掛在模型之上,將增量的信息全部訓練進去,我們去年在ITL發布的證券法規助手就是這種方法。現在的企業數據,不僅僅只有文檔、手冊這些靜態的科技文獻內容,更多的是流動的、數據價值密度更高的信息,這些是存在數據庫里的。

針對存量的一個核心關鍵詞就是大模型to DB,也就是我們怎么對高價值密度的數據,在不用精密地組織語言的同時,還能作出準確數字類問題的回答,比如客服里的定價問題、價格交易等問題。

我們服務于券商的數字人,播報的內容是來自于實時交易系統的數據和研報文本內容的結合。針對這樣的場景,就需要把大模型的模糊意圖匹配和精確的SQL操作形成連接。這種連接不是一對一的,面涉及到非常復雜的工程技術。如何保證像ASR語音識別這些機器學習模型回答一個準確的答案?比如現在的銷量是多少,是產品的銷量還是區域的銷量。像這樣模糊的意圖匹配,怎么和數據庫里精確的字段完成匹配?在后臺,需要準備大量的密集計算操作。傳統的MPP數據庫是沒有并發能力的,可能只能支撐一句話十幾個token的內容。但高并發任務,成百上千個寬表的OLAP執行對數據基礎設施的要求非常高,只有HTAP數據庫能勝任這種大模型的高并發AP類業務的底座。

存量突出解決的場景就是針對密集計算的跟數據相關的大語言模型的交互。

第二個方向就是增量,這里面一個核心關鍵詞是合成數據。供給大模型的數據資源從哪里來?這里面涉及到非常多的場景,最早我們使用合同數據更多地是面向專業領域的大模型微調,需要有非常精準的且合適的數據才能提供準確的大模型服務。

Lora是一種常見的微調方法,它對輸入給模型的數據的要求也非常高。

我們如何獲取這種數據?比如做一個客服系統,每家企業都有各自的產品手冊、規章制度,但是客戶會提什么樣的問題呢?傳統的方法是用人工標注采集的方式去獲取這些Q&A,現在我們可以針對產品手冊的大模型來生成Q&A,這就是典型業務場景的合成數據。

那么lora的數據生成從哪里來?我們用不同版本的大模型去完成同樣問題的回答,他們的差異性就是權重分布,可以用來做精確的模型訓練數據生成。

合成數據已經開始從模型訓練數據的生成到直接場景數據生成,大模型進入到了數據飛輪效應,就像Robot讓我們看到的里程碑式技術是機器在供給自己,可以簡單類比理解一下,就是供給給機器訓練所需要的數據就像汽車要加的油一樣,開始變成是自己生產出來的。

客觀說針對駕駛而言,一些極端災害、路況交通事故是不可能通過大規模的路面采集獲取的。我們管它叫CoreData,CoreData是可以通過模型來生產的。現在我們在項目上就已經開始交付合成數據數據集。

總結一下大模型和數據之間的關系,一個是在存量上,一個是在增量上。關于存量,我們關注到的核心技術是大模型to DB,它來解決如何跟上萬張表的、高價值密度的企業數據庫里的數據發生關系的問題;第二個是增量,他來解決如何持續的供給大模型,大模型的真正的算力出口在哪里,是提供一個服務還是提供一種新興的生產資料,供給我們更多的數據資源,也就是合成數據的概念。

]]>
天云數據CEO雷濤:關注大模型中的數據“飛輪效應” http://www.heke.net.cn/?p=7267 Fri, 18 Oct 2024 10:00:48 +0000 http://www.heke.net.cn/?p=7267 天云數據CEO雷濤在接受記者采訪時表示:目前大模型已經從理論和測試階段,逐步向現實業務中加速落地,值得關注的是,目前數據生成呈現出明顯的“飛輪效應”。

]]>
北京科博會 天云數據CEO雷濤談人工智能技術服務數字資產建設 http://www.heke.net.cn/?p=7191 Thu, 01 Aug 2024 09:00:17 +0000 http://www.heke.net.cn/?p=7191 7月13日,第二十六屆中國北京國際科技產業博覽會(簡稱北京科博會)在國家會議中心開幕。本屆科博會年度主題為“實施創新驅動發展戰略 增強高質量發展動能”。會上,天云數據CEO雷濤發表《人工智能技術服務數字資產建設》主題演講。

 

近期非常引人注目的事件OpenAI宣布終止對中國提供API服務為了維護服務質量和安全性,將采取額外措施來限制來自當前不支持的國家和地區的API流量。

對國內基于OpenAI的大模型所構建的很多創業應用生態無疑是一個巨大的打擊兩個世界正在逐步脫鉤,越來越多的商業鏈條被切斷這不僅僅發生在物理世界,也發生在數字世界的線上連接。與此同時,市場上還存在另外一種聲音,把這個信號看成一種巨大的機遇,剛好趁此機遇培養國內的搜索引擎。

從“深藍”到AlphaGo,再到今天的ChatGPT人工智能走過了符號主義的知識封裝連接主義的知識學習,和今天生成式泛化表達能力開始參與到生產實踐。OpenAI的PPT式大模型作為人工智能的明星項目,我們聽到太多追捧的聲音,過度的神秘化和與之伴隨的自我矮化,加上7月9日關停面向大陸市場的API服務接口服務,再次加重自我矮化且,失敗感撲面而來。

其實在北美市場,基礎大模型的發展已經從單一模型訓練Trainging發展為Serving多元化工業化基礎設施化中國人工智能的發展如何擺脫依賴、實現優勢破局和定義自己的生態位?這需要找到我們技術的獨特演進路徑。

前人工智能市場有兩條核心路徑,一種是無條件相信scalinglaw路徑,相信只要把數據喂進去就會有涌現機制。用算力和數據堆積給已有的算法實踐Transformer,這種路徑就是在已知的知識結構里去尋找未知拼接的方法,能力是有限的,就像在陸地上看著教科書學游泳一樣,一定會遇到模型基礎理論的天花板。在已知中組合篩選(條件概率)獲得的知識,只能是補齊現有的知識拼圖,例如通過大量的實驗發現新的元素,可以補全門捷列夫發現元素周期表,但是不能誕生量子力學對基本粒子的理論和元素生成公式,更不可能產生牛頓的“加速度”阿拉伯數字“零和無窮大”這樣的觀念革命的知識。從學外語到學母語建立認知再到推理和邏輯的路徑完全不同

谷歌微軟亞馬遜HuggingFace等云廠商開始不再依賴單一大模型,而是跟更多的系統架構配合,來組成一個務實的AGI的工程架構。谷歌上個月發布的大模型成熟度參考架構,定義了從L0到L6 的分級,調用GPT直接使用單一大模型的能力僅僅是L0水平。加入提示詞工程,精調模型Lora的意圖理解,向量數據庫尋回私域數據的記憶,Agent規劃拆解,plugin執行和反思等等,逐步完善大模型成熟度到更高等級。這是人工智能市場的第二條路徑。

可以這樣類比,大模型是西方發明的輪子,而今天中國已經進入了造車的時代。蒸汽機在英國誕生,但在北美被Nobody裝到木船上造就了輪船業的輝煌。中國人工智能的發展如何從重新發明輪子到快速引領智能產業的“造車運動”,需要抓住基礎ABC問題本質才能實現實現優勢破局和定義自己的生態位?

C算力——自力更生策略硬件芯片是最早投入布局的,英偉達在生態的壟斷和貿易禁運,給了國產芯片獨立發展空間。

A算法——跟隨融合的纏斗策略人工智能最底層核心邏輯是以數學的形態在論文上得以表達,包括數據處理的方法和數據集。甚至實踐代碼都在以科學共享的形式爭相發表,科學無國界。為了更多的索引,論文往往會以最快的速度在跨國別的形式傳播。陸奇曾經講過,我們從中關村到硅谷的距離是一個小時的時差。其實指的就是基礎算法層級和開源技術框架。數據科學家們為了使自己的研究成果盡快地發表,甚至跳過了像IEEE、CVPR大型頂會論文的審核機制,直接在arXiv網站上注冊發表,學術論文開始以天為單位在更新。打破中美科技壁壘的不是拿來主義的開源軟件套殼封裝,而是高索引引用的論文。論文不僅提供研究的方法路徑,依賴的基礎模型組件也提供了數據的流動,像指南一樣。

B數據——優勢破局策略硬件芯片所遵循的摩爾定律還是一個線性增長邏輯,但生成式合成數據遵循的卻是冪律指數型增長,只有抓住數據工程的冪律才能超越硬件的發展速度。

近日,前美軍四星上將加入了openAI董事會。毫無疑問他的崗位職責肯定不是指導研發的,那必定是瞄向兩年來OpenAI沉淀的提示數據。我們和大模型對話的內容蘊含大量的信息,據SBS等韓媒報道:三星剛引入ChatGPT還不到20 天,就發生了3起機密數據泄漏事件,其中涉及三星半導體設備測量資料、產品良率等信息。

問題往往導向答案獲得信息的過程本身也是信息。無獨有偶,近期,英偉達發布大模型一下子擠到第一陣營,為什么?英偉達沒講算力而是將重點放在了核心數據的介紹上,其模型訓練使用了98%是合成數據,是機器生產模型生產的數據。

如何讓國內AI領跑世界是一道綜合考題,但歸根結底必須從骨髓里就是硬核科技企業。在產品線上,不能拿來主義,不能被卡脖子,不能有明顯的短板而且要有顯著的長板,才有肯能在國際競爭中跑出來。此外,外部環境對于技術成長、人才培養、產業生態的形成也很關鍵,不單是一家企業的事,也需要政府、生態共同去匹配發展的進程。

人才破局相關數據顯示,2023年就業形勢嚴峻,失業8700萬,畢業1158萬,是讓普通人是無工作還是讓這些人群進入新技能藍海?政府應該提早布局AI版的“藍翔技校”。AIGC內容生產,培養新技能藍領改變算法生成的猜盲盒過程,打造人機交互的流水線。

產業鏈破局AI Pin、?Vision Pro等可穿戴的個人智能代理Personal Agent的出現,Figure具身機器人的探索,這些EdgeAI的新興都需要整合全新的智能硬件產業鏈。AI pin融合了電容觸摸、HUD、手勢識別、數模喚醒等成熟的硬件技術,大模型服務的載體,可以發揮中國全產業鏈精密制造的優勢,快速跨界發明迭代一批GenAI的智能硬件。要想推動產業變革,實現產業組織的深刻調整,政府部門、教育機構、高校研究機構的角色和商業必須要發生一些變化。

就政府角色而言,充分發揮產業園區的優勢,把企業、高校、科研院所等創新資源產業鏈上下游“整合”在一起,協同攻關科技難題。

]]>
天云數據參編行業標準|《Maas模型服務協議要求》標準正式發布 http://www.heke.net.cn/?p=7183 Fri, 26 Jul 2024 07:00:05 +0000 http://www.heke.net.cn/?p=7183 隨著各行業對大模型的應用需求日益增多,模型即服務(MaaS)發展迅速,MaaS將AI模型以服務的方式提供給用戶,降低模型使用門檻。當前產業界已推出諸多MaaS產品,并集成和提供了大量模型服務,然而對于服務的可用性、穩定性、質量保障等方面仍然缺少統一、系統的規范要求,用戶在使用服務時存在諸多不確定性。中國人工智能產業發展聯盟MaaS工作組積極關注MaaS領域發展動態,聯合業內30余家單位共同編制《Maas模型即服務技術與應用要求 第1部分:模型服務協議要求》標準并正式發布,天云數據參編單位之一

MaaS模型數據市場,是天云數據為了進一步推動AI技術普及和應用創新發展而構建的一個綜合性平臺,為用戶提供了一個便捷的渠道,輕松地獲取、購買和部署各種預訓練的AI模型,同時也為模型開發者提供了一個展示和銷售模型的平臺。

MaaS模型數據市場上,涵蓋了從圖像識別、自然語言處理、語音識別到預測分析等多個領域,能夠滿足不同行業和場景的應用需求。首先,用戶可以根據自己的需求,采購合適的模型;其次,省去模型用戶從零開始訓練時間和計算資源,直接將模型集成到自己的產品和服務中,加快模型創新的速度。

MaaS模型數據市場還為模型開發者提供了一個廣闊的展示和銷售空間,開發者將訓練好的模型上架到市場,通過平臺的流量和影響力讓更多的潛在用戶了解并實現知識的商業化。與此同時,模型市場還為開發者提供了工具和服務,幫助他們更好地管理和優化自己的模型,提高模型的性能和可靠性。

生態建設也是天云數據的MaaS模型數據市場的使命之一,鼓勵開發者之間的合作和交流,減少重復勞動推動模型的共享和復用,提高行業的研發效率。

]]>
主站蜘蛛池模板: 全南县| 长兴县| 陕西省| 陵水| 胶南市| 岳阳县| 昭觉县| 扶绥县| 英山县| 许昌市| 宿迁市| 博湖县| 常州市| 陕西省| 花垣县| 凤凰县| 阳朔县| 万载县| 四川省| 光山县| 商城县| 遂川县| 托克逊县| 柘荣县| 定日县| 鹤峰县| 砀山县| 边坝县| 慈溪市| 尼木县| 平阴县| 黄平县| 侯马市| 英山县| 乐都县| 灵山县| 诸城市| 文水县| 杭锦旗| 闵行区| 城市|