Transformer 核心作者 Noam Shazeer 加入 OpenAI,谷歌重金未能留住
事件概述
近日,人工智能领域传出重磅消息:Transformer 架构的核心作者之一 Noam Shazeer 正式加入 OpenAI。这一人事变动迅速引发行业热议——尽管谷歌曾动用重金试图挽留这位天才研究员,最终仍未能将其留在内部。Shazeer 的离开不仅标志着谷歌在关键人才争夺战中的一次失利,更可能重塑下一代大模型技术路线的竞争格局。
人物背景与技术影响力
Noam Shazeer 是 2017 年划时代论文《Attention Is All You Need》的八位联合作者之一,该论文提出的 Transformer 架构彻底取代了 RNN/LSTM,成为当今所有大语言模型(如 GPT、Gemini、Llama 等)的基础。此外,Shazeer 还主导了混合专家模型(MoE)在语言模型中的早期应用,其 2017 年的论文《Outrageously Large Neural Networks》为稀疏激活的大规模模型奠定了基础。在谷歌期间,他深度参与了 Pathways 架构、GLaM 模型等关键项目,并在离开谷歌创办 Character.AI 后,又于 2023 年应谷歌重金邀约回归。此次二次离开,显示谷歌的薪资和资源承诺已无法抵消他在创新环境上的顾虑。
谷歌留人策略的深层困境
尽管谷歌为 Shazeer 开出了极为优渥的薪酬包(据悉高达数亿美元级别的股票期权),但金钱并非顶尖 AI 研究员的唯一考量。Shazeer 的离去暴露了谷歌在组织文化上的深层矛盾:一方面,谷歌的研究成果常常因产品化流程冗长、风险规避严重而难以快速落地;另一方面,Transformer 架构本由谷歌开发,却被 OpenAI、Meta 等公司率先在大模型产品上取得突破,这种“研发生态,产品为人作嫁”的挫败感长期困扰着谷歌的 AI 团队。此外,OpenAI 提供的“极速验证、大胆试错”的自由氛围,以及参与下一代多模态和推理模型前沿研究的机会,对 Shazeer 这类开拓型研究者具有不可替代的吸引力。
对 OpenAI 与行业格局的影响
Shazeer 加入 OpenAI,最直接的价值在于其 MoE 技术积累。当前 OpenAI 的 GPT-4 已被推测采用 MoE 架构,Shazeer 的加盟将进一步强化 OpenAI 在模型效率与扩展性上的技术护城河。同时,他的存在也可能吸引更多早期 Transformer 作者从其他机构流向 OpenAI——此前 Ashish Vaswani、Llion Jones 等核心作者已先后离开谷歌,或被新兴创业公司吸纳。这一趋势意味着,谷歌虽仍拥有大量深度学习基础设施专利,但在最前沿的模型设计思想上正面临“智库空心化”的风险。
结语
Noam Shazeer 的选择,本质上是一次对“创新权重”的投票:当大公司的重金薪酬与僵化壁垒并存,顶尖人才会更倾向于拥抱组织更扁平、速度更快的平台。对于 OpenAI 而言,这是继引进关键工程人才后的又一次战略收购;对于谷歌,这则是一个信号——仅靠薪资无法锁住思想的野马,要留住真正的创造者,必须重构研究文化与决策效率。