2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。
ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。
大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對算力的需求急劇增長,技術(shù)層面從單一云架構(gòu)向“多云架構(gòu)”轉(zhuǎn)變的趨勢日益顯著。
2022年,字節(jié)跳動旗下云服務(wù)品牌“火山引擎”對4000多家在云上消耗超過100萬的企業(yè)客戶進行調(diào)研,他們發(fā)現(xiàn),目前有88%的企業(yè)采用多云架構(gòu),平均每家企業(yè)會使用“五朵云”。
在多云架構(gòu)趨勢與大模型持續(xù)迭代的背景下,火山引擎總裁譚待認為,未來將是“多云多模型”的時代。
不難理解,如今國內(nèi)云服務(wù)市場呈現(xiàn)多元化趨勢,企業(yè)從不同廠商采買云服務(wù)已是常態(tài),而大模型也不會一家獨大,最終會形成多模型共生甚至協(xié)作的生態(tài)。
“在多云方面的實踐,字節(jié)可以說是經(jīng)驗最豐富的一家。”譚待說。
具體到技術(shù)與業(yè)務(wù)層面,在“多云多模型”時代下,火山引擎如何為企業(yè)提供針對性的解決方案?
做好大模型的“基礎(chǔ)設(shè)施”
大模型是人人都想摘得的“玫瑰枝”,但在國內(nèi)落地實現(xiàn)的壁壘依然很高。
大模型的訓練與迭代是對算力和數(shù)據(jù)的雙重考驗,也是對企業(yè)資金儲備與戰(zhàn)略定力的挑戰(zhàn);有業(yè)內(nèi)人士估算過,OpenAI 訓練 GPT-3 一年,算力成本就高達 2000 萬美元。
尤其對中小科技企業(yè)或初創(chuàng)公司而言,建設(shè)大模型更具體的挑戰(zhàn)在于,企業(yè)缺乏足夠的應(yīng)用場景實踐和行為分析數(shù)據(jù),在訓練和迭代升級上也存在壁壘。
譚待也認為,國內(nèi)很多科技公司投入到大模型建設(shè)中,他們有優(yōu)秀的技術(shù)團隊、豐富的行業(yè)知識和創(chuàng)新想法,但往往缺乏經(jīng)過大規(guī)模場景實踐的系統(tǒng)工程能力。
對此,火山引擎的解法是:為大模型客戶提供高穩(wěn)定性和高性價比的AI基礎(chǔ)設(shè)施。
如何為大模型提供基礎(chǔ)設(shè)施?據(jù)譚待透露,國內(nèi)大模型領(lǐng)域七成以上企業(yè)是火山引擎客戶,火山引擎將為他們提供關(guān)鍵的算力支持和技術(shù)平臺,并為消費者帶來更豐富的AI應(yīng)用。
具體到產(chǎn)品端,近日,火山引擎發(fā)布新版機器學習平臺:支持萬卡大模型訓練、微秒級延遲網(wǎng)絡(luò),讓大模型訓練更穩(wěn)更快。
同時,火山引擎發(fā)布了基于自研DPU的Intel CPU計算實例、AMD CPU計算實例、NVIDIA GPU計算實例,以其中“DPU+AMD Genoa CPU平臺的計算實例”為例,整機性能最高提升138%,單核性能最高提升39%。
算力是實現(xiàn)大模型迭代的關(guān)鍵一環(huán),而火山引擎通過與字節(jié)跳動國內(nèi)業(yè)務(wù)并池,將抖音等業(yè)務(wù)的空閑計算資源極速調(diào)度給火山引擎客戶使用,確保企業(yè)在大模型建設(shè)中的數(shù)據(jù)支持與算力保障。
字節(jié)跳動副總裁楊震原表示,“并池”意味著可以調(diào)度一些資源,去錯峰互用,把運力提上去,“比如其實也有波峰和波谷,凌晨用的人少,這種資源就很適合科學計算的能力。”
字節(jié)跳動副總裁楊震原分享抖音的機器學習實踐
基于字節(jié)系的算力資源和生態(tài)能力,火山引擎所提供的大模型基礎(chǔ)設(shè)施,在運算效率和性價比方面更有優(yōu)勢。
以火山引擎的合作客戶MiniMax為例,這是一家已經(jīng)推出自研大模型產(chǎn)品的獨角獸公司,其與火山引擎合作建立的超大規(guī)模推理平臺,擁有萬卡級算力池,支撐單日過億次調(diào)用。
再比如抖音的推薦系統(tǒng),在火山引擎的算力支持下,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本只有5000元。
“火爆全網(wǎng)的抖音’AI繪畫’特效,從啟動到上線只用一周多,模型由一名算法工程師完成訓練。”楊震原介紹說。
楊震原還認為,業(yè)務(wù)創(chuàng)新需要試錯,試錯要大膽、敏捷,但試錯也一定要控制成本。
效率更優(yōu)、算力資源豐富、成本可控的大模型訓練與迭代方式,往往是初創(chuàng)型科技公司最為看重的模式,也是火山引擎努力實現(xiàn)的目標。
譚待指出,火山引擎要服務(wù)好那些立志做好大模型的公司,為其提供基礎(chǔ)算力支持和技術(shù)平臺。“如何在工程上幫它們優(yōu)化,提高效率,穩(wěn)定性,都是我們關(guān)注的重點。”
當然,不同企業(yè)在不同應(yīng)用場景下,對云服務(wù)和大模型的需求千差萬別,火山引擎又如何做好個性化的企業(yè)級解決方案?
數(shù)據(jù)驅(qū)動,升級企業(yè)解決方案
從2020年成立至今,火山引擎基于內(nèi)部業(yè)務(wù)的技術(shù)生態(tài),已經(jīng)向外開放機器翻譯、視覺智能等能力,業(yè)務(wù)覆蓋金融、汽車、消費、文娛等行業(yè)場景。
不過,事情正在起變化,“多云多模型”時代對云廠商提出更復(fù)雜的挑戰(zhàn)。
一方面,企業(yè)加速搭建“多云架構(gòu)”,以實現(xiàn)算力的快速增長;另一方面,多模型意味著多場景應(yīng)用,企業(yè)在不同的業(yè)務(wù)場景中需要差異化的AI應(yīng)用。
早在2022年,火山引擎就提出“體驗創(chuàng)新、數(shù)據(jù)驅(qū)動、敏捷迭代”的云上增長三要素,基于企業(yè)不同的應(yīng)用場景,利用數(shù)據(jù)驅(qū)動搭建云增長模型。
譚待認為,“過去很多企業(yè)花費了大量時間構(gòu)建數(shù)據(jù)中臺,但最后失敗了,找不到數(shù)據(jù)應(yīng)用的場景,價值也沒有發(fā)揮出來。其本質(zhì)在于,企業(yè)沒有將數(shù)據(jù)驅(qū)動整個體系設(shè)計好。”
火山引擎總裁譚待宣布支持“多云多模型”的未來架構(gòu)
火山引擎非??粗財?shù)據(jù)驅(qū)動為企業(yè)降本增效、技術(shù)升級所帶來的作用,內(nèi)部對數(shù)據(jù)使用的價值也有一個明確標準——“0987”,即零事故、滿足90%的需求、80%的需求能夠通過技術(shù)優(yōu)化實現(xiàn)秒級調(diào)用、通過業(yè)務(wù)部門評價達到70分以上。
堅持以數(shù)據(jù)驅(qū)動為增長核心,火山引擎能在內(nèi)容、營銷等領(lǐng)域提供更多個性化的企業(yè)級應(yīng)用,比如在內(nèi)容領(lǐng)域通過算法和AI平臺幫助創(chuàng)作更優(yōu)質(zhì)內(nèi)容、在內(nèi)部運營方面通過數(shù)據(jù)平臺優(yōu)化供應(yīng)鏈和庫存管理等。
如今,火山引擎的解決方案已經(jīng)在各行各業(yè)落地,進一步帶動產(chǎn)業(yè)的數(shù)字化升級。
2022年卡塔爾世界杯期間,火山引擎就用AI的方式做出窄帶高清,一方面提升視頻幀率,另外還能降低帶寬。
同時,針對網(wǎng)絡(luò)觀眾收看比賽最頭疼的直播延時問題,火山引擎通過RTM超低時延直播技術(shù),將直播畫面的端到端延遲最低降到1s,電視觀眾和網(wǎng)絡(luò)觀眾幾乎都能“同頻”觀看賽事直播。
此外,在公益領(lǐng)域,火山引擎與字節(jié)跳動公益將聯(lián)合推出公益版的電子票據(jù)服務(wù)與公有云服務(wù),為符合條件的公益組織提供為期3年的免費服務(wù)。
據(jù)地歌網(wǎng)了解,字節(jié)跳動公益電子票據(jù)服務(wù)已于今年2月上線,目前中華社會救助基金會、中國聽力醫(yī)學發(fā)展基金會已申請使用該服務(wù)。
中華社會救助基金會相關(guān)負責人表示,該基金會2022年開票量超過1萬張,電子開票可以節(jié)約0.5個財務(wù)人力成本。
從直播體驗升級到公益票據(jù)服務(wù),火山引擎通過數(shù)據(jù)驅(qū)動,努力在不同行業(yè)的不同業(yè)務(wù)場景中落地數(shù)字化應(yīng)用。
火山引擎所處的云計算領(lǐng)域是大市場,專業(yè)機構(gòu)估算,國內(nèi)云計算市場規(guī)模預(yù)計在今年突破3000億元。
但,“多云多模型”時代逐步變?yōu)楝F(xiàn)實,企業(yè)對云服務(wù)的差異化能力提出更高要求,并且需要將云計算與大模型賦能到實際業(yè)務(wù)中,帶來整體業(yè)務(wù)升級。
行業(yè)正在起變化,云計算企業(yè)“不得不變”。
在海外,亞馬遜AWS于日前為企業(yè)客戶推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分類、開放式問答和信息提取等任務(wù)的生成式大語言模型等。
在國內(nèi),云計算領(lǐng)域競爭激烈,阿里云、華為云等均在行業(yè)內(nèi)深耕多年,火山引擎作為“后發(fā)之人”,依托于字節(jié)生態(tài)“溢出”的2B能力,持續(xù)升級企業(yè)數(shù)字化解決方案。
當然,為適應(yīng)“多云多模型”時代,為大模型客戶提供AI基礎(chǔ)設(shè)施,火山引擎有著“任重道遠”的目標。好在,基于多年的資源儲備和場景實踐,火山引擎已經(jīng)摸索出了一條自己的云增長道路。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
7月5日,由艾瑞咨詢主辦的第15屆2023iResearchAwards金瑞獎獲獎名單正式揭曉。廣州九四智能科技有限公司(簡稱:九四智能)創(chuàng)始人、CEO劉嗣平憑借在企業(yè)服務(wù)領(lǐng)域創(chuàng)新的智能用戶運營方法論及細致的場景解決方案,從眾多候選人中脫穎而出,榮獲本屆金瑞獎“數(shù)字服務(wù)年度人物”。金瑞獎于2006年
2023年上海世界移動通信通信大會(簡稱“MWC上海”)上,思特奇以“智啟萬物數(shù)轉(zhuǎn)賦能”為主題,通過300m2超大展位、8大展臺板塊,全面呈現(xiàn)公司自主創(chuàng)新原生技術(shù)和應(yīng)用案例,賦能千行百業(yè)數(shù)智化轉(zhuǎn)型。產(chǎn)業(yè)數(shù)字化是指以數(shù)字技術(shù)為引領(lǐng)、數(shù)據(jù)賦能為主線、平臺為支撐,對產(chǎn)業(yè)鏈上下游全要素數(shù)字化升級改造的過程,
6月28-30日,2023上海世界移動通信大會(MWC)在上海新國際博覽中心舉辦,作為行業(yè)領(lǐng)先的數(shù)字化轉(zhuǎn)型產(chǎn)品及解決方案服務(wù)商,北京思特奇信息技術(shù)股份有限公司(簡稱:思特奇;股票代碼:300608.SZ)以“智啟萬物數(shù)轉(zhuǎn)賦能”主題強勢亮相展會,從運營商服務(wù)升級、政企產(chǎn)業(yè)服務(wù)創(chuàng)新、科技創(chuàng)新引領(lǐng)、數(shù)字生
在過去的兩個多月時間里,MAXHUB2023全國新品品鑒會已先后走進廣州、北京、西安、重慶、武漢、上海、杭州、深圳、石家莊、鄭州、長沙、成都、呼和浩特、南京、哈爾濱、烏魯木齊等城市,舉辦121個場次,吸引超一萬名嘉賓參加,構(gòu)建產(chǎn)業(yè)人士與MAXHUB三大空間數(shù)字化解決方案近距離體驗的平臺,打造令眾人眼
描述:2023年華映資本年度大會以“無限新成皆繁星”為主題。企企通作為數(shù)字化采購與供應(yīng)鏈領(lǐng)域的專家,受邀出席本次大會,其創(chuàng)始人&CEO徐輝作為華映資本的被投企業(yè)代表進行了數(shù)字生態(tài)與數(shù)字化供應(yīng)鏈等核心內(nèi)容進行了精彩分享。6月16日,2023年華映資本年度大會在杭州成功舉辦。2023年華映資本年度大會以
把脈中國數(shù)據(jù)智能化
2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數(shù)字化市場研究咨詢機構(gòu)愛分析發(fā)布了《2022愛分析·數(shù)據(jù)智能廠商全景報告》,愛分析從技術(shù)研發(fā)能力、服務(wù)客戶數(shù)量、收入規(guī)模等維度對廠商進行了全面專業(yè)的評估
2022年11月18日,首個國家級大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術(shù)發(fā)展司數(shù)字經(jīng)濟推進處處長張建倫,中國電子技術(shù)標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導(dǎo)下,以“數(shù)據(jù)確權(quán)”為主題的2022數(shù)據(jù)資產(chǎn)(廈門)論壇在廈門成功舉辦。本次論壇以“數(shù)據(jù)確權(quán)”為主題,由廈門市互聯(lián)網(wǎng)域名應(yīng)用服務(wù)產(chǎn)業(yè)協(xié)會和構(gòu)信網(wǎng)(公信.中國)聯(lián)合主辦
近日,國內(nèi)知名數(shù)字化市場研究咨詢機構(gòu)愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關(guān)注度、行業(yè)落地進展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數(shù)博會執(zhí)委會主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會“實踐先行觀公共數(shù)據(jù)價值與應(yīng)用”活動成功舉辦。
近日,由中國國際數(shù)字經(jīng)濟博覽會組委會主辦,中國電子技術(shù)標準化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數(shù)據(jù)大賽”(簡稱大數(shù)據(jù)大賽)正式啟動。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標準的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺