雙方選擇“分而不裂”,以投資代替分歧,在新的結構下繼續共同探索AI的未來。
文|《中國企業家》記者 孔月昕
編輯|馬吉英
11月20日,圖靈獎得主、Meta AI首席科學家楊立昆(Yann LeCun)在領英上正式宣布,自己將于年底離開工作了12年的Meta。
這位“AI教父”還在帖子中透露,自己正在創建一家新的初創公司,繼續他過去數年與團隊推進的高級機器智能研究計劃。新公司的目標是構建能理解物理世界、具備持久記憶、推理并能規劃復雜動作序列的系統。
楊立昆的離職,也折射出他與Meta首席執行官扎克伯格在AI戰略上的深刻分歧。在Meta全力押注大語言模型(LLM),加速商業化落地的同時,楊立昆則長期堅持其“世界模型”研究路線,并愿意為此投入十年甚至更長的時間。
盡管存在理念分歧,雙方卻展現出了成熟務實的一面,開辟了一條“第三條路線”。楊立昆在公開感謝扎克伯格等高管的同時,更關鍵的是宣布Meta將直接成為其新公司的合作伙伴。這意味著雙方選擇“分而不裂”,以投資代替分歧,在新的結構下繼續共同探索AI的未來。
01 技術狂人
1960年,楊立昆出生于法國巴黎附近,他的父親是一位航空工程師,受其影響,他從小便對科學和工程產生濃厚興趣,經常親手制作飛機模型和電子玩具。17歲時,楊立昆擁有了第一臺個人電腦,并借此自學編程,掌握了扎實的計算機技能。
楊立昆大學就讀于巴黎高等電子與電氣工程師學校,并于1983年獲得工程師學位。在校期間,除了應用數學與物理學,他還廣泛閱讀神經科學與機器學習文獻,逐步明確了自己在可學習機器方面的研究方向。
隨后,他進入巴黎第六大學攻讀計算機科學,并于1987年取得博士學位。畢業后,他前往多倫多大學辛頓實驗室擔任博士后研究員。
1988年,楊立昆加入AT&T公司的貝爾實驗室,這也成為其職業生涯的重要轉折點。他在該實驗室主導開發了卷積神經網絡(CNN),使計算機能夠模仿人類視覺處理圖像信息。美國國家現金出納機公司(NCR)自90年代中期起將這項技術用于銀行支票讀取機,該技術巔峰時期處理了全美10%~20%的支票。
1989年,楊立昆將卷積神經網絡的理論與實踐進一步結合,提出了革命性的LeNet模型。然而,受限于當時硬件與算法條件,神經網絡研究陷入低谷,資本支持減弱,導致楊立昆與團隊的研究被迫中斷長達六年。
在這段“人工智能的第二次寒冬期”,楊立昆并沒有被挫折“打倒”,反而收拾心情轉而去主持開發了DjVu圖像壓縮技術。
直至1998年,他正式發布LeNet-5模型,這是世界上第一個完整的卷積神經網絡,為后來的深度學習革命奠定了堅實基礎。
2003年,楊立昆加入紐約大學擔任教授,并創立了數據科學中心。2013年,應Meta(Facebook)創始人馬克·扎克伯格邀請,他加入該公司,牽頭組建并領導FAIR實驗室(基礎人工智能研究實驗室)。
在楊立昆倡導的“開放研究”模式下,FAIR展現出強勁的創新能力:2015年發布ResNet,突破深度網絡訓練瓶頸;2016年推出PyTorch,成為深度學習主流開源框架;2017年在計算機視覺與自然語言處理領域均取得重大進展。2019年,楊立昆與約書亞·本吉奧、杰弗里·辛頓共同獲得圖靈獎。
不過,楊立昆與扎克伯格的“蜜月期”并未持續太久。早在2018年,扎克伯格就“擼掉”了其FAIR負責人職務,并任命原應用機器學習部門(AML)的負責人統管兩個AI團隊。楊立昆則轉任首席AI科學家,更專注于科研。
到了2022年,Meta全面轉向元宇宙,FAIR被并入新成立的Reality Labs,輔助AR/VR產品研發。兩年后,隨著Meta推出AI原生應用Meta AI,公司又將FAIR劃歸產品部門,與專注生成式AI的Gen AI團隊共同推進產品化。這一系列調整使團隊逐漸承擔起產品壓力,原先承諾的自由研究氛圍被自上而下的項目與KPI所取代。
02 分道揚鑣
在ChatGPT引爆行業初期,Meta憑借開源LLaMA系列模型迅速構建了龐大的開發者生態,與OpenAI、谷歌的封閉路線形成鮮明對比,這幫助Meta在大模型競賽中站穩了腳跟。
然而,作為Meta的AI首席科學家,楊立昆始終對大語言模型(LLM)的技術路線持保留態度,并在多個場合發表過對LLM技術路線的質疑。
在今年3月的美國2025年聯合數學會議上,他在演講中再次強調,“僅靠文本訓練,我們無法實現達到人類水平的AI”;他主張通過“聯合嵌入預測架構”(JEPA)構建“世界模型”,打造具備長期記憶和推理能力的系統,并建議放棄“生成式模型”。
對于這一技術路線,楊立昆自己也強調,如果未來五到十年里把“世界模型”的相關難題解決了,就有望構建真正智能的、能夠規劃和推理的AI系統。實現這一想法的唯一辦法就是讓底層的平臺保持“開源”。他強調自己是開源AI的鐵桿支持者,但這與扎克伯格如今在AI領域的戰略和技術路線幾乎完全相悖。
對扎克伯格而言,他需要的是能夠立即投入應用的技術,而非五年后才可能見效的理念。尤其在今年發布的Llama 4表現未達預期后,扎克伯格更加迫切地尋求能夠快速見效的產品方案。
于是在這之后,Meta進一步推進其AI戰略,并在組織架構上實施了一次重大調整。公司斥資143億美元投資了數據標注與治理公司Scale AI,獲得其49%股權,并以此為基礎組建了“超級智能實驗室”(MSL),將原有的FAIR團隊、基礎模型團隊及各應用AI團隊全部整合進該實驗室。
與此同時,Meta從Scale AI挖角了28歲的首席執行官汪滔(Alexandr Wang),由其出任首席AI官,并邀請前GitHub首席執行官納特·弗里德曼(Nat Friedman)負責產品團隊。
這次重組背后的核心邏輯十分明確,讓研究更直接地服務于產品落地,使科學家的工作更緊密地圍繞商業目標展開。過去FAIR團隊享有的“相對獨立的研究環境”被逐漸削弱,如今他們必須配合產品迭代的節奏,其研究方向也被要求聚焦于“個人AI助手”等具體業務目標。此外,Meta加強了對FAIR團隊論文發表的內部審核,這與楊立昆所倡導的開放、開源理念產生了直接沖突。據The Information報道,楊立昆曾強烈反對這項新的審核制度,甚至在今年9月因不滿而一度考慮辭職以示抗議。
今年10月,Meta再次對人工智能部門實施大規模裁員,約600名員工被裁,其中以FAIR實驗室為代表的長期基礎研究團隊成為“重災區”,包括強化學習專家田淵棟在內的多位核心研究人員也在此次調整中離開。值得注意的是,此輪裁員并未波及同年夏季新招募的頂尖AI人才,尤其是由汪滔直接管理的TBD實驗室成員。
耐人尋味的是,在裁員發生的同一天,楊立昆在社交媒體上發布了與吳恩達(Andrew Ng)的合照,并公開與備受爭議的Llama 4項目進行切割。他澄清道,自己除了早期間接參與Llama 1的開源推廣外,自2023年初以來,Llama 2、3及4均由TBD實驗室負責推進;而他本人仍在FAIR工作,專注于研究超越大語言模型的下一代AI系統。
扎克伯格主導的組織變革,其刀鋒雖未直指楊立昆,卻通過決策權的重構,實質上邊緣化了他在關鍵項目中的角色,這或許也是他最終選擇與Meta體面分手的重要原因之一。
不過,65歲的楊立昆并未選擇就此隱退,而是開啟了自己的創業征程。他的創業也并非從零起步,其團隊長期深耕的“世界模型”已在視頻預測、物理推理等關鍵技術上取得突破,且多位原FAIR實驗室的核心成員預計將隨他一同投身新事業。
憑借其在人工智能領域的學術聲望與行業影響力,楊立昆的創業項目早已吸引多家頂級投資機構關注。據媒體報道,有相關知情人士透露,他已與數家全球一線基金展開融資洽談,初步估值已達10億美元量級。
在AI產業面臨技術路線抉擇與頂尖人才爭奪深層矛盾的當下,楊立昆的離職創業不僅標志著一代“學院派”研究領袖的轉身,更可能為整個AI行業帶來新的技術路線競爭與生態變量。