1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

生產(chǎn)力工具中的“六邊形戰(zhàn)士”:解密海螺AI“紅海突圍”的底氣

 2024-05-24 17:04  來(lái)源:A5專欄  我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

2023年可以說(shuō)是人工智能行業(yè)最振奮的一年,大模型的能力每隔一段時(shí)間就會(huì)上一個(gè)新臺(tái)階,洶涌澎湃的技術(shù)革命迅速影響著每一個(gè)人的生活,AGI不再是一種技術(shù)理想,而是觸手可及的現(xiàn)實(shí)。

到了2024年,人工智能的熱度不減,但口口相傳的“百模大戰(zhàn)”并未上演。資本市場(chǎng)罕見(jiàn)地“降溫”,不少大模型悄無(wú)聲息地消失,有機(jī)會(huì)進(jìn)入決賽圈的大模型創(chuàng)業(yè)者,僅剩下寥寥數(shù)家。

其中就有孵化出海螺AI的MiniMax,一家不為太多人所熟知,估值卻早已超過(guò)25億美元的現(xiàn)象級(jí)獨(dú)角獸。

01 技術(shù)路線幾乎沒(méi)有退路

目前國(guó)內(nèi)估值超過(guò)10億美元的大模型創(chuàng)業(yè)團(tuán)隊(duì)只有五六家,MiniMax恰恰又是其中最為特殊的存在:

1、月之暗面、百川智能、零一萬(wàn)物等均成立于2023年,MiniMax卻是一家誕生于2021年的企業(yè),比友商們?cè)缌藘赡陼r(shí)間。

2、有別于李開(kāi)復(fù)、王小川等人的“明星”身份和高調(diào)風(fēng)格,MiniMax的創(chuàng)始人閆俊杰不可謂不低調(diào),很少在公開(kāi)場(chǎng)合露面。

3、“搶算力”儼然是整個(gè)AI行業(yè)的常態(tài),MiniMax沒(méi)有夠購(gòu)買任何GPU,而是以相對(duì)便宜的價(jià)格找火山引擎租了大量GPU算力。

為何特立獨(dú)行的MiniMax能夠活下來(lái)?答案就藏在閆俊杰時(shí)常提及的一句話里:“我選的技術(shù)路線幾乎沒(méi)有退路”。

直接的例子就是MoE(混合專家模型)上的“豪賭”。

時(shí)間回到2023年夏天,國(guó)內(nèi)的大模型廠商們紛紛加快了研發(fā)進(jìn)度,擺在MiniMax面前的現(xiàn)實(shí)問(wèn)題是:自家2B和2C的產(chǎn)品已經(jīng)有很多用戶,傳統(tǒng)dense(稠密)模型生成token的成本太高,延時(shí)太嚴(yán)重;在計(jì)算資源有限的情況下,只有MoE才能訓(xùn)練完當(dāng)時(shí)的數(shù)據(jù)。

理論上講,MoE相較于dense模型的預(yù)訓(xùn)練速度更快,在相同參數(shù)的情況下,有著更快的推理速度,但在微調(diào)方面存在諸多挑戰(zhàn),比如泛化能力不足容易引發(fā)過(guò)擬合現(xiàn)象,屬于典型的“技術(shù)派才有的紅利”。

其他廠商選擇dense模型快速迭代的時(shí)候,MiniMax放了80%以上的算力和研發(fā)資源做MoE,而且沒(méi)有Plan B。

拐點(diǎn)出現(xiàn)在2024年初,MiniMax發(fā)布了國(guó)內(nèi)首個(gè)基于MoE架構(gòu)的abab 6,找到了越來(lái)越多加速實(shí)現(xiàn)Scaling Laws的途徑,包括改進(jìn)模型架構(gòu)、重構(gòu)數(shù)據(jù)pipeline等等,并在三個(gè)月后研發(fā)出了更強(qiáng)大的abab 6.5。

正如外界所熟知的,長(zhǎng)文本能力在2024年成為生產(chǎn)力工具的“勝負(fù)手”,萬(wàn)億參數(shù)的abab 6.5已經(jīng)200k tokens 的上下文長(zhǎng)度,綜合能力已經(jīng)不遜于國(guó)外主流大模型;使用同樣的訓(xùn)練技術(shù)和數(shù)據(jù)的abab 6.5s,進(jìn)一步提升了推理速度,可以在1秒內(nèi)處理近3萬(wàn)字的文本。

按照業(yè)界常用的“大海撈針”機(jī)制,即在很長(zhǎng)的文本中放入一個(gè)和該文本無(wú)關(guān)的句子(針),然后通過(guò)自然語(yǔ)言提問(wèn)模型,看模型是否準(zhǔn)確將這個(gè)針回答出來(lái)。在891次問(wèn)答中,abab 6.5均能正確回答。

現(xiàn)在,MoE模型已經(jīng)上升為行業(yè)共識(shí),被認(rèn)為是高性能AI大模型的必選項(xiàng),而MiniMax已經(jīng)在這條路上“搶跑”了一年。

02 技術(shù)驅(qū)動(dòng)的產(chǎn)品方法論

讓許多人沒(méi)想到的是,一群癡迷于技術(shù)的工程師,“意外”做出了多個(gè)日活用戶超過(guò)100萬(wàn)的產(chǎn)品,包括Glow、星野、海螺AI等,涵蓋內(nèi)容社區(qū)、生產(chǎn)力工具等不同方向。

曾有媒體在采訪時(shí)詢問(wèn)閆俊杰:“你們第一個(gè)模型還沒(méi)做出來(lái),就招了產(chǎn)品經(jīng)理,當(dāng)時(shí)你如何向他描述你想要一個(gè)怎樣的產(chǎn)品?”出乎預(yù)料的是,閆俊杰給出的回答只要三個(gè)字:“不知道。”

閆俊杰口中的“不知道”,源于對(duì)技術(shù)的敬畏:當(dāng)前AI原生的超級(jí)產(chǎn)品,無(wú)不源自突破性的技術(shù)進(jìn)步。

比如搜索問(wèn)答幾乎是所有對(duì)話式AI的標(biāo)配,也是我們使用生產(chǎn)力工具提升工作效率的剛需功能。但越是基礎(chǔ)的功能,越能驗(yàn)證生產(chǎn)力工具的價(jià)值,考驗(yàn)背后大模型的能力。

百度發(fā)布2024年Q1財(cái)報(bào)后,我們同時(shí)在海螺AI和國(guó)外的一款產(chǎn)品進(jìn)行了對(duì)比,用戶體驗(yàn)可謂高下立見(jiàn):

海螺AI整理出了百度的核心業(yè)務(wù)信息,包括營(yíng)收、利潤(rùn)等關(guān)鍵數(shù)據(jù),以及百度智能云、開(kāi)發(fā)者社區(qū)、百度APP、蘿卜快快等核心業(yè)務(wù)數(shù)據(jù),有著清晰的邏輯和側(cè)重,并且每條內(nèi)容都關(guān)聯(lián)了對(duì)應(yīng)的信息源,甚至在末尾附加了和百度財(cái)報(bào)相關(guān)的常見(jiàn)問(wèn)題。

另一款產(chǎn)品也準(zhǔn)確回答了財(cái)報(bào)的核心信息,但僅僅引述了一些媒體報(bào)道,輸出內(nèi)容的結(jié)構(gòu)化很弱,需要人工二次處理信息。和直接用搜索引擎查找信息的方式相比,并未節(jié)省太多的時(shí)間。

再比如長(zhǎng)尾內(nèi)容的檢索和生成能力。像百度財(cái)報(bào)這樣的熱門議題,很容易找到相關(guān)的媒體報(bào)道,一些小眾的長(zhǎng)尾內(nèi)容,似乎更能考驗(yàn)生產(chǎn)力工具的內(nèi)容檢索和生成能力。

我們的問(wèn)題是皮爾斯·布朗的代表作《火星崛起》,曾被《娛樂(lè)周刊》評(píng)為2014年度最佳圖書(shū),但知名度不如《火星救援》、《星球崛起》等可能被AI混淆的名著。海螺AI準(zhǔn)確理解了我們的需求,生成的故事梗概可圈可點(diǎn),并給出了深刻的評(píng)價(jià);豆包將我們的需求誤解為《星球崛起》,生成的內(nèi)容居然是《火星三部曲》的介紹。

技術(shù)的上限左右著產(chǎn)品的上限。

MiniMax之所以做出了海螺AI這樣“能打”的生產(chǎn)力工具,根源在于技術(shù)驅(qū)動(dòng)的產(chǎn)品方法論,只有具備足夠好的產(chǎn)品能力,才能承接和轉(zhuǎn)化取得的技術(shù)進(jìn)展,否則會(huì)落得一場(chǎng)空。

當(dāng)然,MiniMax也有自己的“野心”。就像閆俊杰所籌劃的:“在技術(shù)快速進(jìn)化的窗口關(guān)閉前,做出用戶量巨大的To C產(chǎn)品。”

03 做普通人每天用的產(chǎn)品

資本圈里流傳著一句話:判斷一位人工智能創(chuàng)業(yè)者是否真正的AGI信仰,就看這個(gè)人創(chuàng)業(yè)是在2023年之前還是之后。作為普通用戶,則有另一套判斷標(biāo)準(zhǔn),即能不能解決實(shí)際問(wèn)題,扎扎實(shí)實(shí)地提高工作效率。

行事低調(diào)的閆俊杰,很少圍繞AGI的話題高談闊論,但在媒體采訪時(shí)講述了自己樸素的信仰:Intelligence with everyone。

怎么理解“與用戶共創(chuàng)智能”?海螺AI無(wú)疑是最直觀的研究對(duì)象。

生產(chǎn)力工具作為當(dāng)下最擁擠的大模型賽道,市面上的產(chǎn)品已經(jīng)多達(dá)幾十款,豆包、文心一言、智譜清言、Kimi……哪怕是在高度內(nèi)卷的局面下,肩負(fù)MiniMax信仰的海螺AI,依然表現(xiàn)出了差異化和稀缺性。

首先是簡(jiǎn)潔的產(chǎn)品設(shè)計(jì)。

為了爭(zhēng)奪用戶的注意力和時(shí)長(zhǎng),越來(lái)越多的對(duì)話式AI產(chǎn)品在首頁(yè)上添加了豐富的菜單欄,努力向用戶表達(dá)功能的多樣性。海螺AI不可謂不克制,首頁(yè)上除了簡(jiǎn)單的功能引導(dǎo)和對(duì)話框外,并沒(méi)有其他影響注意力的元素。

不同的設(shè)計(jì)風(fēng)格,似乎談不上孰優(yōu)孰劣,但從生產(chǎn)力工具的定位來(lái)說(shuō),頁(yè)面的簡(jiǎn)潔與否和大模型能力不無(wú)關(guān)系。倘若大模型的能力足夠強(qiáng)大,哪怕沒(méi)有花里胡哨的功能露出,也可以通過(guò)生成的內(nèi)容占領(lǐng)用戶心智。刻意強(qiáng)調(diào)功能的多樣性和玩法的趣味性,反而在大模型的能力上漏了怯。

其次是過(guò)硬的產(chǎn)品能力。

諸如搜索問(wèn)答、語(yǔ)音對(duì)話、長(zhǎng)文總結(jié)等功能,早已是對(duì)話式AI產(chǎn)品的標(biāo)配,也是高度同質(zhì)化的主要誘因。但只要深入使用一段時(shí)間,或者進(jìn)行簡(jiǎn)單的結(jié)果對(duì)比,并不難判斷能力上的高下,找到最適合的生產(chǎn)力工具。

而產(chǎn)品能力的強(qiáng)弱,往往體現(xiàn)在一些細(xì)節(jié)中。以我們高頻使用的長(zhǎng)文總結(jié)為例,將第三方行業(yè)報(bào)告上傳到海螺AI,可以準(zhǔn)確梳理報(bào)告的核心信息,并根據(jù)報(bào)告內(nèi)容進(jìn)行對(duì)話。原先閱讀一篇報(bào)告需要至少兩個(gè)小時(shí)的時(shí)間,現(xiàn)在不到5分鐘就能完成,工作效率可以說(shuō)是實(shí)現(xiàn)了指數(shù)級(jí)增長(zhǎng)。

然后是多元的使用場(chǎng)景。

有些產(chǎn)品盡可能在首頁(yè)上推薦足夠多的“角色”,來(lái)告訴我們有很多使用場(chǎng)景,適合不同的用戶。僅僅在prompt下功夫,當(dāng)真可以滿足不同人群的需求嗎?市場(chǎng)初期也許奏效,可終歸不是解決問(wèn)題的最優(yōu)解。

海螺AI的答案是從能力上滿足不同人群的需求:幫研究人員快速總結(jié)和分析長(zhǎng)篇學(xué)術(shù)論文或研究報(bào)告、幫內(nèi)容創(chuàng)作者整合關(guān)鍵信息并生成爆款文章、幫知識(shí)工作者整理和回顧學(xué)習(xí)資料、為日常用戶提供生活中的即時(shí)幫助……就像是一個(gè)能打的六邊形戰(zhàn)士,背后是萬(wàn)億參數(shù)MOE大模型的底氣。

一言以蔽之,只有做出足夠產(chǎn)品化、能服務(wù)大眾的AI技術(shù)和產(chǎn)品,才可以給社會(huì)帶來(lái)足夠高的反饋。在MiniMax的認(rèn)知里,AGI不是原子彈那樣的大殺器,而是普通人每天會(huì)用的產(chǎn)品和服務(wù)。

04 寫(xiě)在最后

每一次代際演變的出現(xiàn),都會(huì)經(jīng)歷百花齊放到超級(jí)APP“統(tǒng)治”市場(chǎng)的過(guò)程。

大模型的產(chǎn)品化也不例外?,F(xiàn)階段AI產(chǎn)品的核心價(jià)值,主要來(lái)自模型性能和算法能力,不排除會(huì)上演“贏者通吃”的一幕。特別是對(duì)于尋求生產(chǎn)力的用戶,擁抱海螺AI這樣的超級(jí)APP,卸載掉“嘗鮮”時(shí)下載的幾十個(gè)APP,將是可以預(yù)見(jiàn)的結(jié)果。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • AI加速時(shí)代的“進(jìn)度條”,我們撥動(dòng)了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來(lái)了一系列不可思議的奇點(diǎn)。我們?cè)?jīng)熟悉的一切,都開(kāi)始變得陌生?!庇?jì)算機(jī)之父約翰·馮·諾依曼曾這樣說(shuō)到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說(shuō)《三體》里用來(lái)形容人類與三體人之間的戰(zhàn)爭(zhēng)的一句話。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場(chǎng)”與“算法進(jìn)化”,中美AI競(jìng)速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無(wú)法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒(méi)錄你,錄了個(gè)數(shù)字人。圖片來(lái)源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來(lái)越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開(kāi)始用上了“數(shù)字員工”。甚至很多中國(guó)人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡(jiǎn)單翻看一下全國(guó)各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人

編輯推薦