OpenAI 终于坐不住了。
知情人士透露,OpenAI 计划在未来两周内发布推理大模型“草莓”(GPT4.5) 。(当然,这个时间不是绝对准确,随时可能发生变化)
“草莓”与其他对话式 AI 最大的区别在于它不是立即回答问题,而是能够在响应之前进行“思考”,思考阶段通常会持续 10 到 20 秒。
虽然一些使用过“思考” 原型的人会抱怨,与 OpenAI 目前发布的 GPT-4o 相比,“思考”的响应稍好一些,但并不值得多等待 10 到 20 秒的时间,但依旧值得期待。
从多方的爆料来看,OpenAI 这次可能不会再鸽了。
“草莓”的发布,或为OpenAI的多事之秋带来一丝亮色。因为OpenAI近期频繁被爆陷入:巨亏、Sora研究陷入困境、GPT-4o公布遥遥无期、GPT-5或推迟到2025年底、高盛错误曝出ChatGPT访问量下降等舆论旋涡。
OpenAI,又有关键技术人才离职
近日,前OpenAI 首席研究员,在OpenAI率先提出打造“Her”想法的“Her”技术负责人,GPT-4o实时音频技术背后的关键人物之一的Alexis Conneau (亚历克西斯・康诺)的离职也引起大家关注,他在X上宣布:“在OpenAI 打造Her的奇妙旅程结束后,我决定创办一家新公司”。
Conneau已从 OpenAI 离职创业,他也曾参与到了GPT-5的相关研发工作当中——Conneau 领英的个人简介中写道,“专注于多模态和音频 AGI 的人工智能研究员,在 OpenAI 领导了Her‘’的研究(GPT4-o 和 GPT-5),这是首个原生集成音频的 GPT 模型。”
Alexis Conneau的离职,让外界对GPT-4o模型的内幕更加浮想联翩。

5月OpenAI的那场发布会上展示的多模态能力让全网兴奋,但发布会第二天就有首席科学家Ilya Sutskever和首席安全研究员 Jan Leike离职。
如今,GPT-4o语音功能还没正式上线,“Her”项目负责人就官宣离职创业。
在加入 OpenAI 之前,Alexis Conneau在Facebook AI担任研究科学家,研究领域主要在深度学习、神经网络等。Alexis Conneau的主要成就有:
在 OpenAI 通过 GPT-4o 创建了第一个版本的“Her”。Conneau 表示,是他将这一愿景带到了 OpenAI,并与一位同事合作,(几乎)从零开始构建了这个音频 LLM 研究。在GPT-4o的致谢名单中可以看到,Conneau 具体领导了GPT-4o Audio Pre-Training、Encoders和Interruptions团队的研究工作,其中Interruptions团队的研究内容,是让GPT-4o可以像人一样被打断的关键。 创建了首个能够在没有任何监督的情况下翻译文本和转录语音的神经网络(无监督 MT 和 ASR)。 为文本和语音构建了通用的多语言掩蔽语言模型表示(XLM-R、Wav2vec 2.0 XLS-R)。在 Meta 和谷歌推广这些语言模型表示,通过文本分类、机器翻译和语音识别等各种应用影响了 10 亿用户。 发现了“零样本跨语言迁移”('zero-shot cross-lingual transfer)的概念,证明多语言语言模型在单一语言上经过微调后,可以在其他语言上有效运行XNLI、XLM。 开源 Facebook AI Research 最受欢迎的基础文本和语音掩蔽语言模型(XLM-R 和 Wav2vec 2.0 XLS-R),可在 Hugging Face 上获取。
此外,他还曾在 EMNLP(2017 年、2018 年)和 SLT(2022 年)上获得最佳论文奖,并在 JMLR、NeurIPS 和 ICML 等顶级期刊和会议上发表过论文。谷歌学术显示,Conneau的总引用量已经超过25k,其中绝大部分来自2019年及之后的文章。
2021年,华盛顿邮报曾对Conneau进行过一次专访,他在ChatGPT引发LLM热潮前就敏锐地察觉到了语言模型可能涉及的伦理道德和政策问题。
他当时提出,在一个完美的世界里,自己的工作可以让自动语音监管机构保护人们免受恶劣的侵害,并建立一个更友善、更快乐的互联网。
关于离职后的创业方向,Conneau 还没有透露详细信息。但在被问及“AGI 时间表”时,他回答说自己更想追求“通用情感智能(General Emotional Intelligence,AGEI)。”
Conneau 的离职的事件引起了很多人关注,相信很多 VC 已经开始行动了。
就在前几日,另一位OpenAI前首席科学家Ilya Sutskever 离开OpenAI 后的创业项目Safe Superintelligence(SSI) ,在仅有 10 人团队,产品都没有的情况下,正式完成了总规模为 10 亿美元(约合人民币 71 亿)的融资。
这或许是很好的 OpenAI 核心技术成员创业的前车之鉴。

OpenAI,离职背后发生了什么?
超级对齐团队成员纷纷跑路,现在新产品的背后功臣们也显现流失迹象。这不禁让大家对 OpenAI 浮想联翩,整件事从头到尾都透着不对劲。
这可能要从此前著名的“OpenAI 宫斗事件”说起,虽然当时大家质疑这家“世界上估值最高的人工智能企业”,是不是马上就要散伙,结果大家都已知晓。
虽然没有“散伙”,但在发展路线上,OpenAI 的内部俨然分成了两派,一派是以 Sam Altman 为代表的工程派,认为需要遵循科技企业的发展规律,周期性地对外部署、发布,在过程中解决问题;另一派是以联合创始人、首席科学家 Ilya Sutskever 为代表的技术派,认为“研发”与“商业”是天然的此消彼长关系,过多过早地接触商业只会带来更多麻烦。
就像SSI 所认为的,构建安全的超级智能是我们这个时代最重要的技术问题,SSI 的存在就是确保人工智能技术会成为“人类社会中一股向善的力量”。对于未来的投资人,SSI 希望团队在未来的工作中可以不受“运营费用或产品周期的干扰”,并且允许他们寻求一种安全、有保障的商业模式,以保证团队都不会因为短期商业压力的影响研发进程。
OpenAI 核心技术人员离职创业,都会提及到在下一代模型做的准备,包括安全性、可监控、保密性、社会影响等相关主题。潜台词或许是,作为目前“商业层面”比较优秀的企业,“安全超级人工智能”在OpenAI 的“商业层面”上或许已经被淘汰。
实际上,在山姆·奥特曼看来,AI 安全并没有利益和金钱重要。他已将安全部门视为“乱党党羽”,一一肃清。Ilya Sutskever 负责的超级对齐团队,原本是为能够智胜和压倒创造者的超级智能人工智能的出现做准备,在他离开后,团队直接解散,几名相关研究人员离职。
但这些并不能满足山姆·奥特曼,为了排除异见,让关于“安全性”的秘密保留在公司内部。
山姆·奥特曼强制性要求员工离职后一周内签署一份极其严格的“离职协议”:
前OpenAI 员工必须遵守的“保密条款”和“不贬低条款”,禁止任何时间、任何场合批评OpenAI,而且即使承认保密协议的存在也是违反该协议的行为;如果离职员工拒绝签署,或者违反协议规定,他们可能会失去既得股权,价值数百万美元。
同时,这份“离职协议”的期限是:终身,直至死亡。如果把这份“警惕员工”的保密精神,用在 AI 安全上,可能就不会有所谓的人类 AI 危机了。但在互联网巨企眼中,市场份额远远比“虚无缥缈”的安全性更为关键。
OpenAI 近日风波不断,加上近日又有外媒曝出 Sora 模型的研发也陷入了困境,因此这个2 月发布的模型至今也没兑现。7 月末,OpenAI 已官宣开启 GPT-4o 语音模式的灰度测试,目前不确定他们是否赶得上“秋季发布”的 flag。
据投资机构预测,OpenAI 今年预计还会继续亏损,继续训练更强大模型,在造血能力还不够的情况下,如何持续融资也是OpenAI 不得不考虑的问题,OpenAI 或许已经开始考虑上市的事情了。“草莓”的到来,是否能为OpenAI下滑的口碑,挽回些“面子”呢?
OpenAI 的路最终会走向何方?未来是否会带来颠覆性的产品呢?
据彭博社9月11日报道,OpenAI正在与投资者洽谈筹集新一轮65 亿美元的融资,或将推助公司估值达1500 亿美元。如果完成此轮融资,OpenAI 将跻身千亿美元俱乐部。
但如果无法继续保持领先地位,这千亿美元估值,或许真的只不过是向人类表明,AI 就是一场梦。
OpenAI 核心技术人员的离开,让一部分人联想到曾经的仙童半导体。不知道大家怎么看?
本文链接:https://gpt-4o.cc/chatgpt/26.html
GPT-4o第一波反馈来了GPT-4o 在中国能不能用gpt3.5和4.0区别GPT4O 手机GPT4O下载GPT4O中文OpenAI发布GPT40GPT4o将免费使用gpt4o将免费提供给所有用户gpt4o可以在232毫秒内响应对话
网友评论