前谷歌DeepMind资深研究员,现在是马斯克的人了。
大佬叫DustinTran,他是GeminiDeepThink的共同创造者,该模型一经发布便展现出SOTA级别的推理能力,在过去两个月内连斩IMO和ICPC金牌
不仅如此,可以说是Tran一手成就了Gemini,帮助谷歌在后GPT失速时刻重新追回了AI的风口。
不过,谁能想到,Grok-4-fast的背后居然也有Tran的影子。
是的,就在Grok新模型发布当天,Tran便在X上发长文官宣已经加入xAI。
文章里,Tran回顾了自己8年来在谷歌的经历,还顺带给xAI和新老板点了个大大的赞。
目前,这篇小作文阅读量达13w,就连马斯克本人也亲自转发,表示热烈欢迎。
要知道,老马一向以极其严苛的高要求著称,能让他亲自夹道欢迎的人可没几个。
那Tran,究竟是什么来头?
实际上,Tran身上贴满了「里程碑」级别的标签,他可以说是帮助谷歌在AI时代一次次突围的关键人物。
不止是谷歌的推理模型,整条Gemini产品线跌宕起伏的成长故事都离不开Tran的身影
在GPT-3.5发布后,谷歌内部拉响“红色警报”,公司紧急调整优先级,把Tran所在的LaMDA团队(史上第一个指令式聊天机器人)列为最高任务。
短短100天里,Tran所在的团队基于LaMDA完成训练,推出了Gemini的前身Bard
然而由于仓促上马,Bard反响不佳。
发布当天,谷歌股价蒸发近千亿美元,外界几乎都认为谷歌会被搜索引擎的历史包袱和冗杂的内部组织拖垮。
但Tran所在的团队没有放弃。此后,他们不断打磨推理和深度思考能力,从2023年底开始,Tran与团队持续发力,陆续推出Gemini1、1.5、2、2.5
这一次,他们可谓做足了准备,Gemini系列的表现与Bard时期有天壤之别,谷歌一度屠榜各类AIBenchmark,其中,Gemini1.5Pro更是在LMArena霸榜一年多**,成为谷歌翻盘的标志性产品,谷歌也依靠Gemini再次成为了AI的风向标。
可以说,正是Tran所在的团队,在谷歌被OpenAI打得晕头转向时帮助公司重新找回了方向,一举扭转了悲观的市场预期。
Tran的谷歌之旅始于8年前。他从GoogleBrain起步,后并入GoogleDeepMind。
除了Gemini,Tran早期还参与了TensorFlow、Tensor2Tensor、ImageTransformer、VisionTransformer等多个重量级项目,这些论文在谷歌学术上都有不错的影响力。
在加入谷歌之前,Tran还曾在OpenAI有过短期实习,他将这段经历称为博士项目休假的「伪博士后」时期。
有趣的是,Tran在那段短暂的实习期里,正好赶上了OpenAI的Dota2AI项目,由此撞上了OpenAI成立初期的一次「小高光时刻」——基于该模型训练出的AIBot在1v1对战中击败了当时的世界顶级Dota职业选手Dendi。
在职业生涯开始之前,Tran的学术履历同样耀眼。
他本科毕业于加州大学伯克利分校,随后在哈佛大学取得了统计学硕士,后转校到哥伦比亚大学攻读计算机科学PhD,师从DavidBlei与AndrewGelman
除了搭建训练框架,Tran还在NeurIPS等期刊上发表了数篇有关模型评估的论文,尤其是2016年发表的《Measuringcalibrationindeeplearning》,这篇论文开创了深度学习中的校准度量基准,影响了LLM的可信度评估。
迄今,Tran在谷歌学术的引用次数超过2.4万。
尽管Tran在谷歌与老东家并肩奋战了8年,最终他还是选择跳槽到xAI。
这可不是冲动下的决定,Tran本人对此给出了大致三点理由。
第一,是算力。
Tran直言自己被“硅谷钢铁侠”的钞能力震撼了,即便在谷歌干了这么多年,他也没享受过这种挥「卡」如土的好日子。
第二,是数据。
Tran指出,Grok4已经在RL和后训练的规模化上押下最大赌注,而xAI还在数据、深度思维和训练配方上不断尝试新的扩展路径。
结合不久前xAI大规模扩充专业数据标注团队的动作,Grok训练方式将迎来一次重大升级应该是实锤了。
第三,是老板的硬核理念。
Tran对马斯克企业理念颇为认同。
他表示,除了xAI,没有任何一家公司能在如此短时间内实现后来者居上。
有了Gemini技术大脑的加持,再加上马斯克Allin,这下Grok5值得好好期待一下了。
没想到的是,除了夸奖xAI和老东家,Tran还顺手补刀了一下前司OpenAI:
[1]https://x.com/dustinvtran/status/1969183617881686405
[2]https://dustintran.com/
国内十大配资平台排名提示:文章来自网络,不代表本站观点。