国产suv精二区69,2022国产成人精品视频人,国产精品久久久av久久久 http://www.heke.net.cn 獲取機器智能像讀書一樣簡單 Tue, 15 Jul 2025 06:10:48 +0000 zh-CN hourly 1 國產數據庫的血脈覺醒 信創數據庫的偉大復興之路 http://www.heke.net.cn/?p=6955 Tue, 26 Dec 2023 09:01:06 +0000 http://www.heke.net.cn/?p=6955
黨的十九大以來,習近平總書記多次指出,“當今世界正經歷百年未有之大變局”?!鞍倌晡从兄笞兙帧?strong>變在什么地方?何為“百年未有之大變局”?
變:第四次工業革命勢必是一場全方位的爆發
眾所周知,第一次工業革命的代表性機器是蒸汽機,解決了物質的自由移動;第二次工業革命的代表性機器是電機,解決了能量的自由移動;第三次工業革命的代表性機器是電腦,解決了信息的自由移動;前三次工業革命都是在局部領域率先突破進而推動了人類社會之進步。但第四次工業革命截然不同,它是一個全方位的爆發,在社會的方方面面同步開啟一場新革命,影響之廣、影響之深前所未有。
因為:大國博弈,世界格局在發生深刻改變
世界之變,時代之變。在“百年未有之大變局”之時,習近平總書記提出高水平科技自立自強。大國崛起的時候,不要有一絲一毫“把自己的成功寄托在別人幫助之上”的想法。形勢逼人,使命逼人。真正的大國崛起,必須依靠自己的高水平科技自立自強,然后才有可能去推動自身乃至整個人類社會進步發展。

2023年度科技行業“競爭力”評選 ,多層次展現科技互聯行業在 2023 年內所取得的一系列精彩突破和超越,通過聚焦科技互聯行業在人工智能、電商、新零售、在線教育、企業社會責任等方面的動作,分享科技互聯行業企業、平臺、品牌在實現各種“遙遙領先”過程中的故事和經驗。北京晚報《科技》評:天云數據,國產數據庫走向自立自強。

根據墨天輪中國數據庫流行度排行,共有288個數據庫廠商在排行榜上排名。根據甲子光年的不完全統計,僅2020年新成立的數據庫公司就有110家。數據庫市場繁榮程度可見一斑,源其本質是市場需求旺盛,一方面全球競爭日益激烈,一方面國產化“替代”勢在必行。但繁榮的數據庫市場核心支撐技術仍是“拿來主義”,要么基于開源系統改進,要么從廠商購買源碼授權,起點雖然高但產品架構幾乎不可能調整,想掌握核心技術更是難上加難。

國產數據庫的昨天以分布式為主,只能做單項突破,核心解決算力拓展問題,這個賽道以開源調度封裝為主。

國產數據庫的今天是混合負載的HTAP數據庫,核心面向互聯網的產銷合一邏輯,解決場景融合問題實現全場景覆蓋。這里面有兩個核心關鍵點:使用什么時間的數據?面向誰提供數據服務?

使用什么時間的數據?你在消費什么時間的數據?是在消費以天、小時級、分鐘級、秒級還是百毫秒級的數據?有一篇論文《我的HTAP系統有多好?》,談到的第一個技術指標就是Freshness(新鮮度)。

面向誰提供數據服務?傳統BI以報表、可視化更多是面向決策層。但互聯網帶來服務下沉,數據驅動業務推到了C端客戶。個性化的數據服務的核心技術指標就是高并發。

既能滿足新鮮度又能支撐高并發的必須是HTAP數據庫。信通院2023可信數據庫發展大會上,何寶宏所長指出:HTAP數據庫助力用戶降本增效。而天云數據是HTAP數據庫廠商代表,也是首批通過信通院“可信數據庫”-HTAP數據庫產品評測的三家單位之一。

數據庫的明天一定是AI原生,通過數據智能替代經驗和規則。目前數據庫與大模型的連接還處于第一階段,需要的是面向靜態常識性數據的向量數據庫。下一階段就是發揮更鮮活的實時數據的價值,就是通過大模型把寬泛的、動態的、模糊的數據與企業級高價值密度的數據庫鏈接。比如天云數據在某股份制商業銀行實現庫內在線反欺詐,每天千萬級交易數據數據實時并發入庫,接近100個復雜欺詐規則分析,毫秒返回分析結果;在某能源的“分布式光伏發電預測”,實現了在真實環境中對區域內發電用電情況的優化匹配,可為自發自用企業節省10%的電費;通過知化將數據變成可操作的檔案、可解讀的政策、可計算的情緒、可度量的運營等,實現了萬物皆可計算。

這也是Databricks用AI釋放數據潛力的方法。因為Databricks歷來都有自研的AI產品,具備技術能力發布大模型產品釋放數據價值。

科技競爭就像短道速滑,最后比拼的是誰速度更快、更能持續。因此必須摒棄拿來主義,要緊緊扭住技術創新這個戰略基點,掌握更多關鍵核心技術,創新中國堅定前行。產替代整體的推進進程注定不是一場分蛋糕的游戲,而是一場殘酷的淘汰賽。

正如習近平總書記關于企業社會責任的重要論述:“社會是企業家施展才華的舞臺。只有真誠回報社會、切實履行社會責任的企業家,才能真正得到社會認可,才是符合時代要求的企業家。”

]]>
再獲黨媒認可!天云數據以“信創”為標簽和千億大廠一起躋身2023科技行業“競爭力”榜單 http://www.heke.net.cn/?p=6960 Mon, 25 Dec 2023 09:00:26 +0000 http://www.heke.net.cn/?p=6960
2023年是具有里程碑意義的一年。在經歷了逆全球化、三年疫情的考驗之后,在這一年里,我們迎來了改革開放45周年,并見證了一帶一路10周年。值此之際,北京晚報《科技》再次推出“競爭力”系列盤點,這也是連續第8年推出年終系列盤點,為年內頻頻閃現的“遙遙領先”振臂高呼。

北京晚報稱:值得一提的是,在這個并不平凡的2023年,人工智能、大模型、大數據等細分行業在銳意進取中不斷提升著各自的競爭力——讓我們有幸看到一個科技行業繁花似錦和“遙遙領先”的2023年。

秉持著多年來包容、開放的基本原則,北京晚報《科技》一如既往地以客觀公正的視角,全面系統的審視這并不平凡的一年。?天云數據以“信創”數據庫為標簽,和千億大廠一起躋身科技競爭力榜單!

新一代國貨之光的數字經濟基座必須是國產自研

當數字資產化,數據庫技術不僅成為數字資產建設的核心關鍵技術,同時也是構成數字經濟基礎設施的堅實底座。面對世界百年未有之大變局,國家在“十四五”期間把科技創新擺在發展全局的核心位置,并提出要加快關鍵核心技術攻關,中國的數據庫廠商需要和世界頂級數據庫廠商同臺競技、“一決雌雄”。

天云數據自主研發的Hubble數據庫,從技術層面實現了去中心化的分布式架構可以更加高效、快速、靈活地處理大規模數據:基于Go語言實現,天然云原生支持、基于AI優化、面向連接的多源異構能力,面向物化視圖的虛擬緩存技術等,這些技術的應用使得系統在大規模數據處理方面具有獨特的核心競爭力。無論是在性能、可靠性還是靈活性方面,該系統都具備出色的表現,為用戶提供了高效、快速、穩定的數據處理服務。此外,天云數據就緒全棧AI的能力,其大模型多模態領域的NeRF技術,大大加速數字孿生空間的生成和構建,率先帶領行業開啟了數實融合的時代帷幕。成為新一代國貨之光的數字經濟基座。

天云數據——黨媒認可的信創廠商

北京晚報在榜單稱:信創基礎軟件領域2023年可謂是收獲滿滿。今年,天云數據自主研發的Hubble數據庫大放異彩。在業內人士看來,Hubble不僅摒棄了MySQL、PG的開源封裝,具有多項創新性的特點和獨特的核心競爭力,從技術層面實現了去中心化的分布式架構可以更加高效、快速、靈活地處理大規模數據。

國內能夠做原創測試的屈指可數。工信部開展源代碼自主度測試方案,在400W+開源項目、10000W+組件數、160TB源碼進行代碼以每10行檢測粒度進行一一比對。天云數據公司通過測試,系統自主研發率99.62%。

天云數據Hubble數據庫已成為國內第一陣營數據庫,Gartner、Forrester、IDC等國際頭部報告全部就位。

]]>
天云數據榮耀登榜2023「Cloud 100 China」 同時提供數據庫和AI基礎平臺及服務 http://www.heke.net.cn/?p=6822 Fri, 08 Sep 2023 10:10:48 +0000 http://www.heke.net.cn/?p=6822
9月7日,2023 Cloud 100 China 榜單于上海中心正式發布,這是靖亞資本和崔牛會聯合推出的第二屆榜單,天云數據憑借數據庫和AI基礎平臺及服務能力再度登榜。據悉,本屆調整了?Top 100 公司的數據指標的權重因子,基于過去一年資本市場融資環境的起伏,降低估值權重因子(從 35% 降到 20%),相應地增加對企業運營指標的關注,更多地考察 Cloud 企業的業務增長能力和盈利能力,從而呈現出一份能代表2023年最優秀的中國 Cloud 企業的榜單。

數據庫基礎平臺Hubble?邏輯計劃融合Vector支撐大模型服務

從年初ChatGPT的火爆,到如今的百模大戰,盡管熱點還在大模型,但媒體和公眾似乎不再像幾個月前那般對大模型產品“上頭”,注意力開始關注到底層技術。目前大模型主要基于的語料數據主要是非結構化數據,各種類型的文檔、圖片、音視頻等訓練出來多模態模型,對于訓練模型本身,這些非結構化數據就需要預處理轉化為向量數據。此外,向量化數據的存儲,需要一個分布式向量數據庫進行支撐,這是非結構化數據大模型場景工程化落地必然路徑。

那么到底是做向量數據庫還是在現有數據庫中加上向量引擎?向量數據庫廠商Zilliz在自己的官方賬號中對向量數據庫的2023做了8 個預測,第3點便是:向量數據庫與傳統數據庫的進一步融合。當一家公司擁有強大的技術基礎和需要先進的向量搜索功能的大量工作負載時,他們真正需要的是一款特化的向量數據庫,所以行業媒體InfoQ發文:與其投資新的向量數據庫項目,還不如關注現有數據庫中哪些加上向量引擎可以變得更加強大。

事實上,很多數據庫都可以直接添加索引模塊來實現高效向量搜索。這個可以對標北美的向量數據庫創業公司Chroma,底層使用是實時分析數據庫?ClickHouse。“僅僅”是在著名實時分析數據庫 ClickHouse 上封裝了一層而已,?Chroma便一躍成為新晉向量數據庫。由此可見一斑,要想使現有數據庫支持向量搜索功能并非很難實現,而大量現有數據庫很有可能已經實現或在在不久的未來實現數據庫的向量搜索功能。

天云數據AI原生數據庫Hubble 有先發優勢,向量化Retrieve是天云Hubble 數據庫和Kaleido特征工程的一個組合,也就特征工程產品里的十幾種的向量方法,比如高斯距離、最短近鄰的算法,將這十幾種的向量方法封裝在Hubble數據庫的解析層,實現數據庫的向量化能力構建。

這也是Databricks用AI釋放數據潛力的方法。因為Databricks歷來都有自研的AI產品,具備技術能力發布大模型產品釋放數據價值。

天云數據AI Infra基礎平臺?提供完整的生態服務

以大模型為例,當大模型回歸理性,市場必然要經歷一場大浪淘沙。關乎技術,更關乎商業模式。

行業已關注到:目前幾乎所有的大模型預訓練都基于Transformer架構,雖是“百模大戰”,但各家大模型之間同質化嚴重,實質性的創新相對較少。同時,訓練大模型所耗費的計算資源非常龐大,需要超級算力的支撐,很多公司沒有過往的研究履歷,發布的產品多是“套殼”或者接入其他研發機構的模型,投機現象泛濫。

當下的大模型競爭早已超過了技術的范疇,更多是一種生態層面的比拼,如果沒有良好的可循環生態,那么無論在模型的持續迭代,抑或變現攤薄巨額研發成本方面,都會面臨可預見的重大困境,對于創業型公司來說更是如此。

很多AI技術因為LLM變得炙手可熱,但這些技術本身并不是新興事物。國內起家的自研技術廠商天云數據,一直堅持數據供給與數據消費雙輪驅動。大模型面向工程領域的落地,去除預訓練模型的同質化,遷移學習和強化學習缺一不可。預訓練模型依靠強大的數據工程完成,模型即數據,數據即模型。遷移學習和強化學習是AI Infra技術工程架構,依靠向量化數據庫實現私域數據的工程落地。強化學習需要繼承依賴有監督學習的模型訓練流水線,天云數據作為MLops廠商有強大優勢。?MaximAI-PaaS機器學習強化平臺穩居全球資訊機構Forrester魔力象限圖“認知層”第一象限公司,IDC技術圖譜“遞增型”、“變革型”產品提供商。此外,天云數據私域大模型Elips成為入圍中國信通院白名單,入選2023可信AI案例;作為新產品榮獲新2023全球數字經濟大會“產業創新成果”。

越是面對如大模型落地這種復雜的問題,就越是要回歸更本質的層面去思考,考驗的不僅是技術力,更重要的還是要落實在“服務”二字上,更高效、更便捷、更人性化將會是未來可持續探索的重要方向。

]]>
天云數據入圍2023中國信創-基礎軟件行業優秀廠商圖譜 http://www.heke.net.cn/?p=6817 Thu, 13 Jul 2023 08:03:52 +0000 http://www.heke.net.cn/?p=6817
1999年,時任科技部部長徐冠華指出“中國信息產業缺芯少魂”,“缺芯少魂”成為中國信息產業數十年的痛處,也開啟了中國信創產業的萌芽期。

近年來,在國際環境變化、國內數字經濟高速發展等多重因素推動下,信創產業進入爆發階段。依托國家相關政策支持,國內一批芯片、操作系統、數據庫、信息安全、辦公軟件廠商迎來了發展機遇期,自主創新的技術實力和競爭力得到顯著提升,營收和利潤也均實現快速增長。因此,第一新聲研究部通過對信創-基礎軟件市場進行調研后正式發布《2023年度中國信創-基礎軟件行業優秀廠商圖譜》,天云數據作為自研基礎軟件廠商成功入選。

中國基礎軟件信創產業的現狀究竟如何?未來又將會走向何處?

基礎軟件是信創產業的四大核心模塊之一。據公開數據顯示,2022年基礎軟件的市場規模為93.6億元,近五年復合增長率為28.5%。與此同時,第一新聲調研也對信創-基礎軟件市場進行調研,受79號文件的影響,2022年該行業規模遠超于公開數據。根據第一新聲調研分析,2022年,基礎軟件信創市場中,數據庫的市場規模占比約為33%。

今年4月,第一新聲研究部正式發布《2023年度中國信創-基礎軟件行業優秀廠商圖譜》,綜合考慮企業技術背景與技術創新度、產品矩陣與產品成熟度、服務標桿企業數量、甲方/投資人口碑等要素進行評估,篩選出受資本市場關注、受客戶認可的高科技、高成長、好口碑、穩交付、跨周期的優秀基礎軟件廠商,為2+8+N行業進行信創產品篩選及采購時提供借鑒與參考。天云數據入選2023中國信創-基礎軟件行業優秀廠商圖譜。

根據第一新聲調研分析,2023年基礎軟件市場規模預計為1538.03億元,到2025年將達到4327.6億元,2020年-2025年復合增長率為47.94%。未來幾年將是“大信創”發展的關鍵時期,行業發展空間廣闊。信創產業已經從 “試點實踐期”進入到“規模化推廣期”的關鍵階段,與此同時,隨著“數字中國”建設規劃的推進,信創產業需求正在全面打開,市場訂單正在井噴式增長,產業規模正快速增長,產業紅利預計將會持續到2027年前后。

信創之根為自主研發天云數據Hubble數據庫系統自主研發率99.62%

軟件是新一代信息技術的靈魂,是數字經濟發展的基礎,是制造強國、網絡強國、數字中國建設的關鍵支撐。基礎軟件的發展已不單單是一個行業的發展,更關乎著國家產業結構轉型。基礎軟件是支撐信息產業升級的“根技術”。

談到信創,任何資質和獎項都要先讓位國產自研技術。作為信息的聚集體,數據庫是計算機信息系統的核心部件,其安全性至關重要。如何有效地保證數據庫系統的安全,實現數據的保密性、完整性和有效性,這不僅關系到企業的興衰,更關乎國家的安全。天云數據,在沒有行業經驗可借鑒的情況下,潛心耕耘另辟蹊徑布局國產自研數據庫,輸出近四百萬行自研Go語言代碼。

2021年,工信部印發的《“十四五”軟件和信息技術服務業發展規劃》明確指出,要聚力攻堅基礎軟件,關鍵基礎軟件補短板,夯實開發環境、工具等產業鏈上游基礎軟件實力。在此背景下,工信部開展源代碼自主度測試方案,在400W+開源項目、10000W+組件數進行多維度自主度分析。天云數據公司自主研發的Hubble數據庫源代碼國產化率93%,系統自主研發率99.62%,是真正意義上信創數據庫。

根據Slintel網站的統計數據,在全球關系型數據庫市場中,MySQL市場份額最高,達到43.04%,僅次于MySQL份額的便是PG。Hubble數據庫源代碼國產化率為93%,其開源率便是為了兼容這些開源產品而服務的。

信創,是基于改變中國信息產業“缺芯少魂”現狀、建立中國自主完整信息產業鏈、提升國內信息產業競爭力、保障國家信息安全的戰略考慮,逐漸發展演變出的創新產業。2006年,國務院發布《國家中長期科學和技術發展規劃綱要(2006-2020年)》,將“核高基”列入16個重大科技專項之一,被普遍認為信創的起點;2020年央行成立金融信創生態實驗室,第一批“金融信創解決方案”出現,被公認為信創產業的應用實踐元年。

樹高葉茂,系于根深。數據時代,作為各行各業的發展記錄和決策依據,數據庫的根基作用不容忽視。只有根扎得深咬得牢,才能汲取更多向上生長與向外延伸的力量。

]]>
信創實力再獲認可!天云數據入選《2023年中國最佳信創廠商》榜單 http://www.heke.net.cn/?p=6813 Wed, 12 Jul 2023 10:03:26 +0000 http://www.heke.net.cn/?p=6813
1999年科索沃戰爭爆發,中國駐南聯盟大使館遭遇轟炸,時任科技部部長徐冠華指出“中國信息產業缺芯少魂”,這也成為中國信息產業數十年的痛處,開啟了中國信創產業的萌芽期。近年來,在國際環境變化、國內數字經濟高速發展等多重因素推動下,信創產業進入爆發階段。為了更好地了解中國信創產業發展現狀、行業格局,2023年2月,【第一新聲】聯合【天眼查】啟動2023年中國最佳信創廠商系列榜單評選征集工作。本次最佳信創廠商系列榜單,包括綜合榜、細分行業榜、優秀案例榜三大類。在超過3個月的時間里,第一新聲團隊收到數百份企業報名和問卷,基于【天眼查】大數據優勢,并通過調研問卷、電話訪談等多種形式,最終評選出相應榜單。天云數據信創實力再獲認可,成功入選《2023年中國最佳信創廠商》榜單。

國產化替代是一場殘酷的淘汰賽,到底該做數據庫工程還是數據庫產品?

根據第一新聲調研分析,2023 年信創產業市場規模預計為18710.59億元,到2025 年為33777.02億元,2020年-2025年復合增長率達到26.99%。2022年信創市場規模中,基礎設施的市場規模占比54.54%,應用軟件的市場規模占比37.08%,基礎軟件的市場規模占比6. 49%,信息安全的市場規模占比1.89%。基礎軟件市場空間廣闊。
做數據庫工程還是數據庫產品?眾所周知,做一個數據庫工程并不難,把某個用戶的應用場景打磨好,一兩年時間就可以完成了。但數據庫產品研發是要奉行長期主義的,沒有十年二十年的沉淀是無法開發出一款成熟的數據庫產品的。數據庫工程只是在MySQL等開源集群的架構的一種工程化綁定,這樣的服務工程并未觸及到數據庫的技術核心,從根本上是一種套殼模式,并沒有建設出基礎軟件的核心。產品是面向原創的,是下一代產品的核心命脈;工程只是在上一代產品上做延續性創新,無法支撐基礎設施。

面向基礎設施而生,天云數據Hubble數據庫輸出近四百萬行自研Go語言代碼

很久以來,國產基礎軟件都停留在被“卡脖子”的印象里。軟件再好,但若是都使用美國的軟件開發工具開發,則意味著無法徹底擺脫美國的制裁風險。國內軟件廠商在核心技術被壟斷的情況下,想要實現彎道超車十分困難。但是,軟件行業為各行業全方位賦能的過程中,高速增長加快創新,逐步追趕、甚至局部超越國際一流水平。天云數據,在沒有行業經驗可借鑒的情況下,潛心耕耘另辟蹊徑布局國產自研數據庫,輸出近四百萬行自研Go語言代碼。自主研發的Hubble數據庫產品經過中國軟件測評中心評測源代碼系統自主研發率99.62%,面向基礎設施而生。國產替代整體的推進進程注定不是一場分蛋糕的游戲,而是一場殘酷的淘汰賽。國產替代也只是第一步,最根本的目的就在于培養一批真正能夠走出國門不怕外國制裁的公司。誰能夠抓住寶貴的“窗口期”,誰就具備了被扶持和發展壯大的資格與條件。反觀現在很多軟件公司產品包含大量開源組件,短期內產品各方面可能會有顯著提升,但其安全性仍然有待考量,在后續的評估測試中有很大概率會被淘汰。只有真正代碼自主可控的企業長遠看才值得被推崇,這也是企業未來面對國際巨頭能夠立足的底氣與根本。

]]>
2023可信數據庫|天云數據成功入選《中國數據庫產業圖譜(2023)》,HTAP能力獲信通院官方背書 http://www.heke.net.cn/?p=6806 Tue, 11 Jul 2023 08:11:16 +0000 http://www.heke.net.cn/?p=6806
7月4日,由中國通信標準化協會和中國信息通信研究院主辦,大數據技術標準推進委員會承辦,InfoQ聯合主辦的“2023可信數據庫發展大會”主論壇在北京國際會議中心隆重召開。大會以“自主 創新 引領”為主題,邀請行業內近百位演講專家圍繞數據庫技術、產業和生態熱點進行研討,并重磅發布了多項中國信通院及中國通信標準化協會大數據技術標準推進委員會(CCSA TC601)在數據庫領域的最新研究和實踐成果。憑借在分布式數據庫領域的優異表現和突出成果,天云數據成功入選《中國數據庫產業圖譜(2023)》。

會上,中國信通院云計算與大數據研究所所長何寶宏指出:HTAP數據庫助力用戶降本增效。天云數據是HTAP數據庫廠商代表。

年初,中國信通院公布了第十五批“可信數據庫”評測結果。天云數據Hubble數據庫憑借過硬的技術實力順利通過“HTAP數據庫基礎能力”評測,成為三家通過測評單位之一。

和IT時代對比,DT時代有哪些重要變化?需要什么技術能力支撐?

去年一篇論文《我的HTAP系統有多好?》,談到的第一個技術指標就是Freshness(新鮮度)。就你在消費什么時間的數據?用什么樣的一個方式?如果基于傳統BI架構的話,我們需要從Oracle、MySQL這些交易型的生產系統里把數據同步出來,用ETL的方式或者是批處理的方式加工到數據倉庫里頭。所以在數據倉庫里,待分析的原材料已經是以天為時間的信息了。

你是在消費以天、小時級、分鐘級、秒級還是百毫秒級的數據?我們怎么去把一些從最早的Storm、Spark Streaming這些流計算的框架到現在比較成熟的像Kafka、Flink的框架來驅動一個流數據作業?比如量化交易里,我們怎么去對沖擊成本?對實時的掛單數據去做一個預測?這個肯定要基于3秒之內的掛單數據來完成。

現在的一些開源框架,通過工程化的手段能夠被市場接受了。把TP和AP做融合,成為湖倉一體的概念;然后把MPP數據庫與湖倉一體融合,成為新技術趨勢。實際上就是將MPP數據庫加Hadoop開源。

這種現象會帶來什么風險?MPP數據庫不能單獨支持湖倉一體,它需要 Hbase和ES來配合,本質還是屬于數據集。在某大型股份制銀行,為了支持手機銀行端的個性化數倉,實現手機端對大屏小屏化的趨勢,傳統MPP結構根本沒法滿足剛才說的這種服務價值,還要配套數百個節點,所以現在市場上湖倉一體的本質還是一個集成方案,需要在傳統MPP數據庫和開源Hadoop之間做大量的數據同步和一致性校驗。既然要有數據同步,就必然有時間窗口、數據的不及時性、不一致性。

所以第一個變化,就是數據新鮮度的變化。我們在使用什么時間的數據,是在消費以天、小時級、分鐘級、秒級還是百毫秒級的數據?HTAP現在作為一種主流的技術框架,已經開始進入到核心數據驅動業務的前端,支撐我們消費最新鮮的數據。我們怎么用數據,流的形式跟庫發生關系HTAP就是Hybrid Transaction and Analytical Process就是混合負載架構。

此外,我們在面前誰提供數據服務?這個問題是非常關鍵。

傳統BI以報表、可視化更多是面向C-Level的決策,所以是宏觀的、共性的、統計趨勢性的問題。但互聯網帶來的金融服務的業務化,越來越多地把數據驅動業務推到了理財經理,推到了營業廳一線,甚至推到了C端客戶。從大屏演示轉向了C端客戶的小屏操作,這種個性化的數據驅動和要求對后臺的技術設施提出了一個非常關鍵的、很難逾越的技術指標就是:高并發。

我們以前在數據消費的時候更多的都是在數據倉庫里完成。數據倉庫是OLAP分析型業務,通過侵占更多的資源來完成一個大IO操作。所以MPP數據庫有一個很大的挑戰就是它不能夠支持高并發,它的作業是排隊機制。當遇到個性化服務下沉時,它就碰到了一個瓶頸。

市場提出了一個新概念Lakehouse(湖倉一體),就是把數據倉庫處理結果再同步到一個大數據平臺,比較受歡迎的方式就是MPP再加上Hbase。我曾經看到一個國產化項目,真的把MPP數據庫給替代了。但是面向1億多用戶的小屏服務的時,它不得已還要同步到一個大規模的Hbase里頭,Hbase來支撐MPP數據庫的個性化的駕駛艙與提交,又變回開源且復雜的工程。就這個項目大概300多個節點Hbase、600多個運維開發人員,每年的運維費用、開發服務費用大概3個多億的人力成本。

所以用產品級基礎設施架構去替代開源工程和大規模人力外包服務是一個很典型的一個技術平臺趨勢。無疑又是HTAP混布型數據庫,可以支撐替代MPP加Hbase這個結構來實現服務下沉。

所以第二個變化,我們面向誰在提供數據服務?互聯網的數據產銷合一方式帶動了流程驅動向數據驅動的數據庫架構轉型,數據從服務決策者轉向服務一線人員,HTAP系統才能保障每個人都能實時看到同樣高質量的數據。

因此,新一代硬核基礎設施必須是HTAP數據庫。

新一代數字基礎設施必須是立足當下且面向未來與此同時必須堅持自研道路

今天IT向DT的遷移,流程驅動轉向數據驅動,并不僅僅是一個概念的迭代。而更多的是,很多基礎的核心組件發生一些變化。這些組件從嚴謹的執行人類指令的這些系統架構、代碼程序,轉向了由數據驅動的供給和消費。這不是簡單的替代邏輯,是產業鏈升級邏輯。所有支撐市場服務的開源工程必將轉向原創產品,國產數據庫必須摒棄利用開源封裝的偽軟殼技術,才能掌握硬核技術核心突破外部限制,實現技術創新科技創新。

很久以來,國產基礎軟件都停留在被“卡脖子”的印象里。軟件再好,但若是都使用美國的軟件開發工具開發,則意味著無法徹底擺脫美國的制裁風險。國內軟件廠商在核心技術被壟斷的情況下,想要實現彎道超車十分困難。但是,軟件行業為各行業全方位賦能的過程中,高速增長加快創新,逐步追趕、甚至局部超越國際一流水平。天云數據,在沒有行業經驗可借鑒的情況下,潛心耕耘另辟蹊徑布局國產自研數據庫,輸出近四百萬行自研Go語言代碼。自主研發的Hubble數據庫產品經過中國軟件測評中心評測源代碼系統自主研發率99.62%,面向基礎設施而生。

國產替代整體的推進進程注定不是一場分蛋糕的游戲,而是一場殘酷的淘汰賽。國產替代也只是第一步,最根本的目的就在于培養一批真正能夠走出國門不怕外國制裁的公司。誰能夠抓住寶貴的“窗口期”,誰就具備了被扶持和發展壯大的資格與條件。反觀現在很多軟件公司產品包含大量開源組件,短期內產品各方面可能會有顯著提升,但其安全性仍然有待考量,在后續的評估測試中有很大概率會被淘汰。只有真正代碼自主可控的企業長遠看才值得被推崇,這也是企業未來面對國際巨頭能夠立足的底氣與根本。數據庫作為一個具有國家屬性的產品,必然與屬國命運與共。

]]>
天云數據再獲2023全球數字經濟大會背書 大模型產品同類選優入選 “產業創新成果” http://www.heke.net.cn/?p=6801 Mon, 10 Jul 2023 06:47:47 +0000 http://www.heke.net.cn/?p=6801
7月7日,2023全球數字經濟大會圓滿落幕。作為2023全球數字經濟大會的收官活動,閉幕式“干貨滿滿”,重磅發布、合作簽約等接連登場。在新品發布環節,從全國180家企業申報的230余項成果中脫穎而出的一批具有自主創新性、科技領先性、重大突破性的首創首發新產品、新技術和解決方案共37項。天云數據私域大模型Elpis作為新產品成功入選產業創新成果。

《北京市關于加快建設全球數字經濟標桿城市的實施方案》提出,到2030年,將北京建設成為全球數字經濟標桿城市。以大數據、云計算、人工智能等為代表的新一代信息技術加速融合蝶變,數字經濟正在成為引領創新發展的核心動能、促進社會轉型的重要力量。

2023全球數字經濟產業創新成果天云數據私域大模型Elpis把能力應用在產業原生動力上

數字經濟浪潮奔流不息,科技創新如火如荼。全球數字經濟大會“新品發布”全力推動數字技術與產業端深度融合發展,助力北京建設全球數字經濟標桿城市。征集成果經市場調研、專家評審,秉承一企一項、公開透明、公平公正原則,聚焦關鍵領域,兼顧賽道均衡,依據同行業產品領先性和市場發展前景等標準,選出具有自主創新性、科技領先性、重大突破性的首創首發新產品、新技術和解決方案。數字新品作為科技進步的見證,不斷帶動產業升級,引領創造人類文明發展新圖景。天云數據私域大模型Elips把能力應用在產業原生動力上而獲“產業創新成果”殊榮。

在某大型股份制商業銀行支持金融科技扶持政策精準匹配解決方案,6萬+政策使用Transformer框架技術抽取政策核心要素,利用智能模型將政策文本(5000+)轉化為可執行策略并形成知識包上線,將政策通過大模型做抽取,再把這些規則寫到專家系統里面,這就可以把政策快速下達。用這種方式賦能給到前端營業廳的對公業務經理,讓業務經理能夠直接跟客戶對話。實現免代碼交付的方式,把一個大量、復雜的文本框架變成了一個可自動執行的結構。為企業提供政策解讀服務達到5433次,匹配超過1000家企業和400條政策。

天云數據大模型獲中國信通院實力背書入選2023可信AI案例

5月底,由中國信息通信研究院主辦的通用人工智能發展論壇,展示當前大模型和生成式人工智能等前沿技術的實際成果,中國信通院在會上發布了「?大模型研發應用和工具平臺優秀案例名單」,?天云數據憑借著在人工智能領域的創新探索及應用實踐成功入選標桿案例。

在某大型股份制證券公司的金融文本要素識別場景中做了實踐驗證,天云數據的文檔要素抽取平臺通過利用在千萬級規模數據集上進行訓練的大模型,業務人員所做的工作只需要針對于少量報告數據進行標注,大模型進行微調后即可得到較好的輸出效果,可以從長達幾百頁的金融報告中直接抽取金融事件信息要素。因為該大模型是帶有空間感知自注意力機制的,利用文本、圖像、布局三種模態信息的多模態Transformer編碼器網絡結構。

ChatGPT的火爆讓相關從業人員已經開始的擔心自己的工作崗位。一句話說得好:“AI will not repalce you. A person who’s using AI will replace you.”?試問,是不是我們沒有1500萬的GPU集群,無法有組織有序列地去收集全文本空間的數據,我們就不能夠做到OpenAI這樣?再問,那我們有什么樣的機制,我們能做到什么樣?三問,除了ChatGPT的意圖理解和文本生成以外,我們在還能學習什么?

我們必須客觀看待每一次科技進步,科技行業所有的機遇無外乎三個要素:第一個是技術。Transformer架構其實是公開論文上的,國內很多高校和產業的初創公司都可以去使用它;第二個是數據資源。中國有什么數據資源?中國有機器數據、傳感器、物聯網數據,明顯踩著第三波數字紅利,具有得天獨厚的優勢;第三個是算力。我想依靠國家的資源完全能將算力資源有效地組織起來。我們不要把能力構建在一個線上應用上,要把我們的能力應用在產業的原生動力上,正確看待科技進步。

]]>
中國信通院2023可信AI案例,天云數據入選大模型及生成式人工智能標桿案例 http://www.heke.net.cn/?p=6794 Tue, 06 Jun 2023 11:43:30 +0000 http://www.heke.net.cn/?p=6794
5月30日-31日,由中國信息通信研究院(以下簡稱“中國信通院”)、浙江省經濟和信息化廳、杭州市人民政府及中國人工智能產業發展聯盟等主辦的杭州通用人工智能發展論壇在浙江杭州舉行,研討大模型基礎設施、大模型賦能行業應用、大模型安全可信等產業重點關注問題。為展示當前大模型和生成式人工智能等前沿技術的實際成果,中國信通院在會上發布了「?大模型研發應用和工具平臺優秀案例名單」、「?生成式人工智能技術和應用優秀案例名單」?,?天云數據憑借著在人工智能領域的創新探索及應用實踐成功入選標桿案例。

大模型百花齊放把能力應用在產業原生動力上才是真正的科技進步

要縮小行業與AI之間的鴻溝,需要將人的知識轉化為AI可計算的模型,打通知識與數據、模型之間的界限。那么從技術角度來說,如何通過工程化的方式釋放AI紅利?如何實現AI與行業智慧的融合,最終形成人工智能的經濟和社會價值?

一系列行業實踐和探索指明了答案:“AI大模型”建立一套通用的流水線提升企業AI開發效率,“知識計算”將AI知識與行業知識相結合,雙管齊下,解決AI在行業落地中的建模復雜、求解困難等問題,將AI真正融入行業的核心業務流程。

為鼓勵大模型技術落地應用,AIIA人工智能產業發展大會評選「?大模型研發應用和工具平臺優秀案例」,天云數據大模型的落地應用案例“金融文本信息要素抽取”作為標桿案例入選。天云數據大模型Elpis,基于私域數據,通過遷移學習和RLHF人類反饋強化學習對模型微調,將大模型能力應用在產業的原生動力上。

以某大型股份制商業銀行要整理400+萬篇科技文獻為例,這些科技文獻中的知識如何指導生產操作,讓文獻可計算相關操作工藝?天云數據大模型惠企政策解讀系統,從惠企政策中自動化識別抽取政策申請相關信息,與企業信息進行精準匹配,實現政府政策與企業的鏈接橋梁,做到精準識別、精準匹配。在實踐中,上線首周解析政策超400+,匹配企業超1000+,提供服務次數超5400+。

賦能個體知識生產者生成式AI技術助力數字資產要素的養成

肉眼難辨的數字人分身已經在行業廣泛應用,并在許多場景中得到了應用,數字人分身在解放生產力的同時也成為了新的生產力。

為鼓勵生成式AI技術落地應用,AIIA人工智能產業發展大會同樣評選了「?生成式人工智能技術和應用優秀案例」,天云數據“數字人視頻合成系統”作為標桿案例入選。

如何賦能個體知識生產者,進行數字資產要素的養成?天云數據AIGC虛擬數字人,作為生產數字人的“代工廠”,通過“數據+數字人”的方式自動生成視頻,整體將物理世界人的主觀能動性、感染力映射到虛擬的平行空間,通過授權讓虛擬人在數字化世界里表達,讓美麗的皮囊擁有有趣的靈魂。

(天云數據生成式AIGC虛擬數字人系統)

在這種賦能路徑下,必須借助強大的基礎設施能力,通過基礎設施能力服務于場景,才能催生下一個知識時代的場景輸出的個體知識生產者。天云數據就是這樣的基礎設施設計師,賦能個體知識生產者,就像Android賦能 App市場的繁榮一樣。

天云數據CEO雷濤稱:“未來人工智能相關技術,會帶給我們根本性變革,可能就像之前的印刷術一樣。事實已經證明,法律方面的AI小助手可以比人類律師助理更高效地閱讀文件。現在人類用手的肌肉力量即可開動250馬力汽車,我們假設將250馬力的車轉換成250種思想,那么開的就不是車而是自動化的電腦。人類未來的目標,是將智力作為一種服務,可以像電力一樣傳輸。從數據、信息到知識再到智慧,這個層級天云數據可以快速實現,構建企業自主的知識封裝和使用能力?!?/strong>

]]>
重磅!天云數據智能AI軟件平臺MaximAI榮獲第二屆AI解決方案大賽三獎 http://www.heke.net.cn/?p=6790 Wed, 24 May 2023 07:40:27 +0000 http://www.heke.net.cn/?p=6790
近日,歷經數月的“第二屆AI解決方案大賽”專家評審會成功落下帷幕,獲獎榜單重磅出爐。天云數據憑借“MaximAI智能AI軟件平臺”榮耀登榜。

第二屆AI解決方案大賽由光合組織舉辦,聚焦人工智能領域的新興技術與創新應用。大賽基于國產異構加速芯片開設了“AI技術”和“AI應用”兩大賽道,致力于搭建科技創新的平臺,攜手眾企業協同推進人工智能產業升級。本屆大賽自開賽以來得到了行業企業、科研機構和高校等單位的積極響應,報名的方案近百個。經過評審專家及大賽組委會調研、初篩、評比等多個環節評審,最終30余家單位進入決賽圈,共同角逐各大獎項。

天云數據公司“MaximAI 智能AI軟件平臺”方案榮耀登榜,該平臺適用銀行、保險、證券、能源、醫療、政務、運營商等行業:

  • 在銀行業,方案可以幫助客戶在交易時進行結匯風險識別、歷史數據查詢;在用戶管理方面可以進行用戶違約概率預測和用戶流失預警等;
  • 在證券業,可以幫忙客戶完成異常交易監測模型訓練等相關工作;
  • 在能源石油開采、政務金融平臺建設、運營商大數據數據分析等多個方面,打造的智能AI-PaaS化平臺軟件產品,用于數據管理、數據標注、模型訓練、計算資源調度、模型發布、服務模型監控等閉環模塊,為企業提供智能、高效、穩定的數據建模環境。
針對AI技術,方案已完成基于國產異構加速芯片的開發、適配、優化工作,技術方向包含但不限于AI框架、訓練、推理、編譯、算子融合等。

此外,該平臺支持分布式模型訓練及部署方式,可以有效的提高模型訓練能力和保證產品的高可用性;算法組件方面可支持幾十種不同領域的優質算法,還支持多種目前主流的深度學習框架。

未來,天云數據將繼續深耕數據庫及人工智能軟件領域,充分發揮天云數據公司的技術優勢及行業經驗,并依托光合組織的生態伙伴資源,聯合打造更加完善人工智能解決方案,推動人工智能技術的發展,共同助力信息行業高質量發展和產業數智化升級。

]]>
天云數據榮獲2023“蓉漂杯”高層次人才創新創業大賽一等獎 AI原生數據庫向量能力可支撐大模型服務 http://www.heke.net.cn/?p=6773 Wed, 10 May 2023 09:33:52 +0000 http://www.heke.net.cn/?p=6773 4月28日在成都市舉行的2023“蓉漂人才日”高峰薈活動,吸引到來自國內外的專家學者為成都的創新人才集聚高地建設出謀劃策,助力成都打好人才強市“組合拳”?;顒蝇F場,來自國內外的專家、學者共商人才強市之策、共謀創新發展之計。天云數據董事楊帆表示:我們現在已經跟天府新區有些落地項目簽約機會,也希望能夠在成都成立分公司,結合成都當地更好的產業資源,配合產業互聯網落地項目,能夠在國產數據庫領域,為成都當地帶來更好的這種未來項目結合的機會?!?/span>

 

2023“蓉漂杯”吸引在蓉高校院所、企業、博士博士后代表,成都科創投、賽富高鵬等9家知名投資機構嘉賓等300余人參加活動,來自北京、西安等地60個優秀人才項目現場進行巔峰對決,天云數據榮獲2023“蓉漂杯”大賽一等獎。

天云數據100%云原生Go語言編寫的硬核產品,AI原生數據庫Hubble系統自主研發率99.62%

基礎軟件的發展已不單單是一個行業的發展,更關乎著國家產業結構轉型,基礎軟件是支撐信息產業升級的“根技術”。

軟件是新一代信息技術的靈魂,是數字經濟發展的基礎,是制造強國、網絡強國、數字中國建設的關鍵支撐。2021年,工信部印發的《“十四五”軟件和信息技術服務業發展規劃》明確指出,要聚力攻堅基礎軟件,關鍵基礎軟件補短板,夯實開發環境、工具等產業鏈上游基礎軟件實力。

在此背景下,工信部開展源代碼自主度測試方案,在400W+開源項目、10000W+組件數進行多維度自主度分析。核心功能包括源代碼開源率分析、軟件成分分析、開源安全漏洞風險分析、開源許可證合規性風險分析。天云數據公司自主研發的Hubble數據庫源代碼國產化率93%,系統自主研發率99.62%,是真正意義上信創數據庫。

根據Slintel網站的統計數據,在全球關系型數據庫市場中,MySQL市場份額最高,達到43.04%,僅次于MySQL份額的便是PG。Hubble數據庫源代碼國產化率為93%,其開源率便是為了兼容這些開源產品而服務的。

談到信創,任何資質和獎項都要先讓位國產自研技術。Hubble數據庫走更貼近企業數據中心的Oracle路徑,實現數據庫的替代升級邏輯,可以規?;鎿Q。實踐中,在銀行A類核心系統國產化成功替換Oracle一體機。對比Oracle,單表3億記錄數量級下的用戶業務場景性能突破Oracle800并發瓶頸,1600并發下依然保持線性穩定服務。同等并發下,平均響應時間和最大響應時間均優于Oracle,具有穩定的線性橫向擴展能力。

在國有四大銀行之一中行就企業級架構相關項目組件入圍選型項目第二包:具備HTAP能力商用分布式數據庫進行采購,天云數據是第一名身份中標。在某股份制商業銀行數字化智能營銷營銷平臺項目,Hubble數據庫處于該銀行系統架構的最核心層—數據中臺層,負責給數據采集、加工、服務、治理,提供數據最安全、最健全的保障,支撐數字化智能營銷平臺月均觸客人次4億+。

云原生時代已來,國內有幾款數據庫是在Go語言上做的?

我們知道,PC時代的產品語言是C/C++,C語言的理念是信任程序員,但應對大規模問題還是會捉襟見肘;互聯網時代換成了Java語言,雖然Java語言跨平臺異構的能力強,但因其編碼繁瑣,所以運行效率很低。

Hubble數據庫是基于最適合云原生的GO語言編寫,已通過邏輯計劃融合SQL、Graph、ML、3D 點云、NL2SQL等實現AI-Native數據庫,支持36種AI原生算法;支持158種量化分析函數;支持圖邏輯計劃;支持3D點云。

縱觀市場上,80%以上的產品語言是Java,能實現50%Go語言的也是鳳毛麟角。Hubble數據庫100%基于GO語言編寫,可編排、可調度、運維量小,適合云原生時代,彈性伸縮,按需分配。

簡單做一個運維量評估:C/C++ 100萬行代碼約等于Java60-70萬代碼,對應到Go語言大概也就是20~30萬行代碼,其運維量可見一斑。

AI原生數據庫Hubble用向量能力即可支撐大模型服務

天云數據Hubble數據庫通過Hubble-vector基于私域數據通過遷移學習和RLHF(人類反饋強化學習)對模型微調,完全可對標托管向量數據庫Pinecone。

Hubble-vector支撐大模型服務,使模型語境更適用于當前私域數據場景,并且做到答案可精確溯源,最后通過模型管理進行服務的發布供用戶使用。在生成時可以引用原有法條做準確嚴謹回答,對比通用大模型,更適合機構私有數據。

隨著云計算平臺的逐漸成熟,應用上云已經成為一個不可逆轉的趨勢了。云目前是朝著云原生架構的方向演進的,云原生架構中有具有統治力的云原生項目都是用Go來構建的。因此,Go是云計算時代的語言,它既適應于互聯網應用的極速開發,又能在高并發、高性能的開發場景中如魚得水。

]]>
主站蜘蛛池模板: 恭城| 文成县| 永嘉县| 射阳县| 长寿区| 平舆县| 东兴市| 偏关县| 肇州县| 尉犁县| 宁陵县| 郧西县| 司法| 古蔺县| 玉山县| 略阳县| 临沭县| 许昌市| 灵山县| 湘乡市| 京山县| 霍林郭勒市| 隆回县| 屏南县| 南丹县| 登封市| 靖宇县| 太白县| 梓潼县| 汝阳县| 开远市| 嵊泗县| 商城县| 思茅市| 临安市| 栾川县| 凤山县| 驻马店市| 遂溪县| 贞丰县| 金湖县|