1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

當(dāng)開源進(jìn)入AI時(shí)代 百度打出一套組合拳

 2020-09-29 09:43  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

1997年,著名黑客埃里克·斯蒂芬·雷蒙在《大教堂與市集》一書中預(yù)測了兩種不同的自由軟件開發(fā)模式:

一種是大教堂模式,原始代碼是公開的,但每個(gè)版本的開發(fā)過程由一個(gè)專屬的團(tuán)隊(duì)管控;一種是市集模式,原始代碼同樣是公開的,不過是放在互聯(lián)網(wǎng)上供人檢視及開發(fā),最直接的例子就是Linux。

最終“市集模式”證明了開源比閉源更加高效,全球99%的組織在IT系統(tǒng)中使用了大量的開源代碼,開源的價(jià)值也被越來越多的企業(yè)重視。比如微軟在2018年以75億美元的代價(jià)將代碼托管平臺 GitHub 收入囊中,IBM則在2019年斥資340億美元收購了著名開源解決方案供應(yīng)商紅帽。

即便是開源文化一度貧瘠的中國市場,近幾年圍繞開源項(xiàng)目的討論也逐漸熱鬧了起來,BAT代表的科技巨頭們扛起了國內(nèi)開源的大旗,陸續(xù)加入到開源項(xiàng)目的建立和維護(hù)中,一次次釋放了涌動(dòng)的激情。

對于中國的開源文化從哪里來,又將要走向何處,百度這樣的開源力量可以說是不可錯(cuò)失的研究樣本。

01 聚焦AI的技術(shù)派

早在上世紀(jì)90年代末,開源力量就在太平洋的彼岸澎湃。但彼時(shí)的中國幾乎絕緣于互聯(lián)網(wǎng)之外,就連計(jì)算機(jī)都還是少數(shù)派的玩物。

時(shí)間上的遲到削弱了中國在開源世界中的存在感,缺少在硬件和底層技術(shù)上的話語權(quán),缺少自主的操作系統(tǒng)和軟件生態(tài),缺少通過開源實(shí)現(xiàn)商業(yè)化的成功案例,導(dǎo)致中國開發(fā)者在很長一段時(shí)間內(nèi)扮演著學(xué)習(xí)者的角色。

人工智能浪潮的興起,為中國開發(fā)者創(chuàng)造了追平前輩們的機(jī)會,何況人工智能和開源幾乎有著天然的關(guān)聯(lián)。

正如人工智能領(lǐng)域家喻戶曉的一個(gè)比喻:如果說AI是一場饕餮盛宴,數(shù)據(jù)是原材料,算力是天然氣,算法是菜譜,開源就如同無數(shù)廚師用經(jīng)驗(yàn)與智慧合著而成的烹飪百科全書。其他廚師可以從書中學(xué)習(xí)經(jīng)驗(yàn)制作菜肴,也可以指出書中存在的問題,并源源不斷地為百科全書貢獻(xiàn)新的菜譜。

百度則進(jìn)一步證明了這樣一個(gè)道理:開源不是論資排輩的武林江湖,而是屬于技術(shù)派的自由世界。

2013年百度率先開源了可視化庫ECharts,提供了直觀、生動(dòng)、可交互、可個(gè)性化定制的數(shù)據(jù)可視化圖表,并由此開始了百度的開源之路。

2016年是百度開源的破局之年,深度學(xué)習(xí)框架百度飛槳正式開源,填補(bǔ)了國產(chǎn)深度學(xué)習(xí)框架的市場空白。

2017年百度開源繼續(xù)兇猛發(fā)力,當(dāng)年發(fā)布了全球首個(gè)自動(dòng)駕駛開源項(xiàng)目——Apollo 自動(dòng)駕駛開放平臺,加速了智能駕駛的行業(yè)進(jìn)程。

2018年百度內(nèi)部應(yīng)用了十年的 Doris正式擁抱開源世界,孵化于百度鳳巢的交互式 SQL數(shù)據(jù)倉庫,至今仍是國內(nèi)唯一的分析型數(shù)據(jù)庫。

2019年百度開源項(xiàng)目持續(xù)刷新,扛住了數(shù)次春晚紅包流量波峰的七層流量轉(zhuǎn)發(fā)平臺BFE對外開源,并在2020年6月份被 CNCF接納為Sandbox Project。

截止到目前,百度已經(jīng)主導(dǎo)了上千個(gè)開源項(xiàng)目,在GitHub上收獲了超過30萬Star,社區(qū)貢獻(xiàn)者數(shù)量也已上萬。不過作為AI領(lǐng)域的技術(shù)派,百度的存在感儼然不只是建立在開源項(xiàng)目的數(shù)量上,同時(shí)還刷新了中國開源項(xiàng)目的高度。

注:2020/2019年度全球開源深度學(xué)習(xí)框架活躍度排名榜單

按照衡量深度學(xué)習(xí)框架活躍趨勢的權(quán)威性指標(biāo)pull request的數(shù)據(jù)顯示,百度飛槳PaddlePaddle均力壓谷歌TensorFlow,緊隨Facebook PyTorch之后,已經(jīng)成為了國內(nèi)第一、世界第二的深度學(xué)習(xí)開源框架;Apache ECharts (incubating) 在 Github 中的 star 數(shù)已經(jīng)超過 41.4k,每周 npm 下載量超過 22 萬;Doris被廣泛應(yīng)用于美團(tuán)、小米、京東、華為、快手等頭部企業(yè)的項(xiàng)目中……

開源創(chuàng)造了技術(shù)最大的公約數(shù),百度正成為這個(gè)時(shí)代的弄潮人。

02 社區(qū)中的建筑師

開源的世界里流傳著這樣一句格言:社區(qū)重于代碼。

這句話的題中之意,恰恰道出了開源世界的鐵律,開源社區(qū)的聚合和放大效應(yīng)比開源代碼更有價(jià)值。

正如開源社聯(lián)合創(chuàng)始人劉天棟給出的觀點(diǎn):“開源市場就像魔方,表面上看每個(gè)成員都是獨(dú)立的一面,但經(jīng)過排列、融合,會呈現(xiàn)出很多種組合可能。”這也是不少人為開源唱贊歌,并努力推動(dòng)中國開源進(jìn)程的直接原因。

開源的精神是自由的,可細(xì)究到開源世界里的話語權(quán),起決定性作用的往往不是精神,而是精神背后的市場規(guī)律,以至于常常出現(xiàn)開源社區(qū)被強(qiáng)權(quán)左右的現(xiàn)象。就連一向以“開源”自居的GitHub,也屢屢傳出封禁伊朗、俄羅斯等國籍開發(fā)者的消息,已然違背了開源社區(qū)存在的初衷。

注:全球范圍內(nèi)開源社區(qū)百花齊放

留給BAT們的挑戰(zhàn)在于,所要扮演的角色不只是“兩耳不聞身外事”的技術(shù)派,還要著實(shí)捍衛(wèi)中國開發(fā)者的權(quán)益。

在開源社區(qū)的運(yùn)作中,百度找到了兩個(gè)著力點(diǎn):

一是深度參與了國內(nèi)外頂級開源基金會和組織,成為了 Apache 基金會、Linux 基金會以及云原生計(jì)算基金會的金牌會員,以及開放原子基金會的理事單位。由于基金會擁有對開源軟件的管理和所有權(quán),積極參與到基金會的運(yùn)作有利于維護(hù)社區(qū)的中立,比如避免中國的開源項(xiàng)目被惡意孤立。

二是戰(zhàn)略投資中文開源技術(shù)社區(qū)開源中國,后者運(yùn)營的Gitee代碼托管平臺已經(jīng)是全球僅次于GitHub的代碼托管平臺,每日約增加5000名開發(fā)者、200家企業(yè)客戶、1.7萬代碼倉庫,已經(jīng)具備了在國際市場上與GitHub全面抗衡的基礎(chǔ),也是中國開源力量不可或缺的底牌所在。

注:Gitee代碼托管平臺

打一個(gè)比方的話,百度對開源的認(rèn)識并沒有局限于貢獻(xiàn)了多少代碼,還在一磚一瓦砌出中國的開源社區(qū)生態(tài)。

至于其中的原因,可以參考百度創(chuàng)始人李彥宏的觀點(diǎn):“開源并不意味著所有東西都是免費(fèi)的,還需要是我們自主可控的,很多開源的東西還是掌握在別人手里的,這個(gè)我們要有充分的認(rèn)識。”

無獨(dú)有偶,華為消費(fèi)者BG軟件部總裁王成錄也有著同樣的擔(dān)憂:“大家想一想,我們現(xiàn)在的軟件開發(fā),開源已經(jīng)是大家都無法再去把它忘掉的模式,那么這些開源社區(qū)的代碼就是離不開的資源。如果中國沒有自己的開源社區(qū)去維護(hù)管理這些代碼,我們中國的所有軟件行業(yè)將是非常危險(xiǎn)的。”

社區(qū)是開源協(xié)作精神與創(chuàng)新的搖籃,除了對技術(shù)的一腔豪情,還要勇于擔(dān)當(dāng)起秩序守衛(wèi)者的責(zé)任,畢竟現(xiàn)實(shí)世界不同于理想主義。

03 產(chǎn)業(yè)化的布道者

跳出開源中立與否的語境,中國開源的現(xiàn)實(shí)問題在于產(chǎn)業(yè)化。

整個(gè)商業(yè)的重心已經(jīng)從To C轉(zhuǎn)向To B,新基建、智能經(jīng)濟(jì)的浪潮再度為這種趨勢摁下了“快進(jìn)鍵”,開源平臺能否抓住產(chǎn)業(yè)智能化的窗口期,釋放出技術(shù)拓荒的生態(tài)紅利,將是打通戰(zhàn)略價(jià)值的關(guān)鍵一躍。

國內(nèi)開源生態(tài)存在的短板也不無明顯,比如開源軟件集中在數(shù)據(jù)庫、操作系統(tǒng)等應(yīng)用層,缺少深入產(chǎn)業(yè)細(xì)枝末節(jié)的生態(tài)協(xié)同,開源技術(shù)的落地應(yīng)用還有很長一段路要走。也就是說,中國的開源生態(tài)還集中在產(chǎn)業(yè)鏈上游,中游和下游的環(huán)節(jié)仍然有些薄弱,需要花費(fèi)一定的時(shí)間補(bǔ)課。

不過這并非是唱衰中國開源生態(tài)的借口。

一方面,中國有著全球最龐大的人口和市場,將是最好的開源項(xiàng)目孵化器。

特別是在新基建浪潮的驅(qū)動(dòng)下,將有越來越多的企業(yè)擁抱開源項(xiàng)目。百度、華為等行業(yè)領(lǐng)頭羊們也開始將開源軟件從技術(shù)與商業(yè)上形成合圍,提供各個(gè)層次的技術(shù)賦能,比如在飛槳和百度大腦的基礎(chǔ)上,通過與百度智能云的融合打通,向外界輸出智能交通、智能家居、智慧金融等場景化的解決方案。

注:百度智能云服務(wù)架構(gòu)

另一方面,源代碼并不是開源最重要的元素,而是人與人通過代碼的聯(lián)結(jié)。

百度代表的科技巨頭紛紛刮起了產(chǎn)學(xué)結(jié)合風(fēng),激勵(lì)國內(nèi)的大學(xué)生們參與到開源社區(qū)的建設(shè)中來,增強(qiáng)和激勵(lì)開源精神的同時(shí),也在為行業(yè)持續(xù)輸送高端人才??梢哉业降睦佑泻芏?,Gitee上的高校數(shù)量已經(jīng)超過1000所、百度飛槳推出了針對高校的生態(tài)激勵(lì)計(jì)劃……開源的產(chǎn)業(yè)化進(jìn)程正在以肉眼可見的速度推進(jìn)。

這個(gè)過程中,百度開源迎來了自己的第三個(gè)角色,即產(chǎn)業(yè)化過程中的布道者。

小凱(化名)是一名本科在校生,卻在飛槳社區(qū)中被稱為“GT大佬”。除了有一副為別人答疑的熱心腸,小凱還參與了大自然保護(hù)協(xié)會的野生動(dòng)物圖片篩選和標(biāo)注項(xiàng)目,找來自己比賽時(shí)的小伙伴,利用飛槳的監(jiān)督學(xué)習(xí)算法完成了大批量數(shù)據(jù)標(biāo)注的驗(yàn)證和調(diào)優(yōu),預(yù)計(jì)將在年底將項(xiàng)目交付大自然保護(hù)協(xié)會。

小鵬(化名)是飛槳社群中的一員,在社區(qū)里認(rèn)識了很多有趣的朋友,并且嘗試借助飛槳搭建自己的深度學(xué)習(xí)模型。小鵬的想法是通過攝像頭捕捉和識別手語,再將手語轉(zhuǎn)化成語音,從而實(shí)現(xiàn)和聾啞人交流的目標(biāo)。目前小鵬的模式已經(jīng)有了比較準(zhǔn)確的識別,并將項(xiàng)目代碼上傳到了社區(qū)開源,希望可以幫助更多的人。

小凱和小鵬都是百度開源社區(qū)中的一份子,或許他們的力量還有些稚弱,對社區(qū)的貢獻(xiàn)還非常有限。可當(dāng)00后的年輕一代都開始活躍于開源社區(qū)的時(shí)候,中國的開源生態(tài)已經(jīng)燃起了持續(xù)壯大的星星之火。

04 寫在最后

中國開源的崛起和擴(kuò)張,似乎并沒有什么捷徑可走。

需要更多聚焦AI的技術(shù)派,持續(xù)貢獻(xiàn)優(yōu)質(zhì)的開源項(xiàng)目,讓中國在開源世界的站位逐步從邊緣移向舞臺中央;

需要更多社區(qū)中的建筑師,不斷增強(qiáng)中國在開源社區(qū)中的話語權(quán),并一步一個(gè)腳印的打造中國的開源社區(qū);

還需要更多立足于產(chǎn)業(yè)化的布道者,將開源項(xiàng)目和產(chǎn)業(yè)需求深度融合,同時(shí)培養(yǎng)下一代年輕人的開源信仰。

至少在這條看得見的路上,百度們正在堅(jiān)定向前。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
百度
ai技術(shù)
第一條智能化高鐵

相關(guān)文章

  • 匯聚中國AI頂尖力量 云天勵(lì)飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)

    標(biāo)簽:
    ai技術(shù)
  • 用友大易:邁入AI招聘2.0時(shí)代,讓人力資源回歸本質(zhì)

    這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識別、聲音識別、語言處理等特

    標(biāo)簽:
    ai技術(shù)
  • 新發(fā)布的PaaS2.0,能否助力涂鴉智能再起飛?

    文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定

    標(biāo)簽:
    ai技術(shù)
  • 押注數(shù)字人,百度、科大訊飛“短兵相接”

    數(shù)字人的未來也將會非常值得期待。

  • 大模型難掩AI制藥的悲傷:越過山丘,無人等候

    美團(tuán)曾經(jīng)的二號人物王慧文對標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場對大模型的熱議。

    標(biāo)簽:
    ai技術(shù)
  • AI加速時(shí)代的“進(jìn)度條”,我們撥動(dòng)了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點(diǎn)。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇?jì)算機(jī)之父約翰·馮·諾依曼曾這樣說到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場”與“算法進(jìn)化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場,而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場,BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個(gè)數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會,反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺的應(yīng)用與未來

    瞄準(zhǔn)場景需求,打造國內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實(shí)力榮摘?jiǎng)?chuàng)業(yè)大賽一等獎(jiǎng)這個(gè)比賽5年培育出16家“獨(dú)角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個(gè)國家和地區(qū)的7406個(gè)創(chuàng)業(yè)項(xiàng)