CHATGPT计划在未来两周内发布推理大模型“草莓”（GPT4.5）

GPT4o2024-09-12 22:24:01230

文丨寄语

OpenAI 终于坐不住了。

知情人士透露，OpenAI 计划在未来两周内发布推理大模型“草莓”（GPT4.5） 。（当然，这个时间不是绝对准确，随时可能发生变化）

“草莓”与其他对话式 AI 最大的区别在于它不是立即回答问题，而是能够在响应之前进行“思考”，思考阶段通常会持续 10 到 20 秒。

虽然一些使用过“思考” 原型的人会抱怨，与 OpenAI 目前发布的 GPT-4o 相比，“思考”的响应稍好一些，但并不值得多等待 10 到 20 秒的时间，但依旧值得期待。

从多方的爆料来看，OpenAI 这次可能不会再鸽了。

“草莓”的发布，或为OpenAI的多事之秋带来一丝亮色。因为OpenAI近期频繁被爆陷入：巨亏、Sora研究陷入困境、GPT-4o公布遥遥无期、GPT-5或推迟到2025年底、高盛错误曝出ChatGPT访问量下降等舆论旋涡。

OpenAI，又有关键技术人才离职

近日，前OpenAI 首席研究员，在OpenAI率先提出打造“Her”想法的“Her”技术负责人，GPT-4o实时音频技术背后的关键人物之一的Alexis Conneau （亚历克西斯・康诺）的离职也引起大家关注，他在X上宣布：“在OpenAI 打造Her的奇妙旅程结束后，我决定创办一家新公司”。

Conneau已从 OpenAI 离职创业，他也曾参与到了GPT-5的相关研发工作当中——Conneau 领英的个人简介中写道，“专注于多模态和音频 AGI 的人工智能研究员，在 OpenAI 领导了Her‘’的研究（GPT4-o 和 GPT-5），这是首个原生集成音频的 GPT 模型。”

Alexis Conneau的离职，让外界对GPT-4o模型的内幕更加浮想联翩。

5月OpenAI的那场发布会上展示的多模态能力让全网兴奋，但发布会第二天就有首席科学家Ilya Sutskever和首席安全研究员 Jan Leike离职。

如今，GPT-4o语音功能还没正式上线，“Her”项目负责人就官宣离职创业。

在加入 OpenAI 之前，Alexis Conneau在Facebook AI担任研究科学家，研究领域主要在深度学习、神经网络等。Alexis Conneau的主要成就有：

在 OpenAI 通过 GPT-4o 创建了第一个版本的“Her”。Conneau 表示，是他将这一愿景带到了 OpenAI，并与一位同事合作，（几乎）从零开始构建了这个音频 LLM 研究。在GPT-4o的致谢名单中可以看到，Conneau 具体领导了GPT-4o Audio Pre-Training、Encoders和Interruptions团队的研究工作，其中Interruptions团队的研究内容，是让GPT-4o可以像人一样被打断的关键。
创建了首个能够在没有任何监督的情况下翻译文本和转录语音的神经网络（无监督 MT 和 ASR）。
为文本和语音构建了通用的多语言掩蔽语言模型表示（XLM-R、Wav2vec 2.0 XLS-R）。在 Meta 和谷歌推广这些语言模型表示，通过文本分类、机器翻译和语音识别等各种应用影响了 10 亿用户。
发现了“零样本跨语言迁移”（'zero-shot cross-lingual transfer）的概念，证明多语言语言模型在单一语言上经过微调后，可以在其他语言上有效运行XNLI、XLM。
开源 Facebook AI Research 最受欢迎的基础文本和语音掩蔽语言模型（XLM-R 和 Wav2vec 2.0 XLS-R），可在 Hugging Face 上获取。

此外，他还曾在 EMNLP（2017 年、2018 年）和 SLT（2022 年）上获得最佳论文奖，并在 JMLR、NeurIPS 和 ICML 等顶级期刊和会议上发表过论文。谷歌学术显示，Conneau的总引用量已经超过25k，其中绝大部分来自2019年及之后的文章。

2021年，华盛顿邮报曾对Conneau进行过一次专访，他在ChatGPT引发LLM热潮前就敏锐地察觉到了语言模型可能涉及的伦理道德和政策问题。

他当时提出，在一个完美的世界里，自己的工作可以让自动语音监管机构保护人们免受恶劣的侵害，并建立一个更友善、更快乐的互联网。

关于离职后的创业方向，Conneau 还没有透露详细信息。但在被问及“AGI 时间表”时，他回答说自己更想追求“通用情感智能（General Emotional Intelligence，AGEI）。”

Conneau 的离职的事件引起了很多人关注，相信很多 VC 已经开始行动了。

就在前几日，另一位OpenAI前首席科学家Ilya Sutskever 离开OpenAI 后的创业项目Safe Superintelligence(SSI) ，在仅有 10 人团队，产品都没有的情况下，正式完成了总规模为 10 亿美元（约合人民币 71 亿）的融资。

这或许是很好的 OpenAI 核心技术成员创业的前车之鉴。

OpenAI，离职背后发生了什么？

超级对齐团队成员纷纷跑路，现在新产品的背后功臣们也显现流失迹象。这不禁让大家对 OpenAI 浮想联翩，整件事从头到尾都透着不对劲。

这可能要从此前著名的“OpenAI 宫斗事件”说起，虽然当时大家质疑这家“世界上估值最高的人工智能企业”，是不是马上就要散伙，结果大家都已知晓。

虽然没有“散伙”，但在发展路线上，OpenAI 的内部俨然分成了两派，一派是以 Sam Altman 为代表的工程派，认为需要遵循科技企业的发展规律，周期性地对外部署、发布，在过程中解决问题；另一派是以联合创始人、首席科学家 Ilya Sutskever 为代表的技术派，认为“研发”与“商业”是天然的此消彼长关系，过多过早地接触商业只会带来更多麻烦。

就像SSI 所认为的，构建安全的超级智能是我们这个时代最重要的技术问题，SSI 的存在就是确保人工智能技术会成为“人类社会中一股向善的力量”。对于未来的投资人，SSI 希望团队在未来的工作中可以不受“运营费用或产品周期的干扰”，并且允许他们寻求一种安全、有保障的商业模式，以保证团队都不会因为短期商业压力的影响研发进程。

OpenAI 核心技术人员离职创业，都会提及到在下一代模型做的准备，包括安全性、可监控、保密性、社会影响等相关主题。潜台词或许是，作为目前“商业层面”比较优秀的企业，“安全超级人工智能”在OpenAI 的“商业层面”上或许已经被淘汰。

实际上，在山姆·奥特曼看来，AI 安全并没有利益和金钱重要。他已将安全部门视为“乱党党羽”，一一肃清。Ilya Sutskever 负责的超级对齐团队，原本是为能够智胜和压倒创造者的超级智能人工智能的出现做准备，在他离开后，团队直接解散，几名相关研究人员离职。

但这些并不能满足山姆·奥特曼，为了排除异见，让关于“安全性”的秘密保留在公司内部。

山姆·奥特曼强制性要求员工离职后一周内签署一份极其严格的“离职协议”：

前OpenAI 员工必须遵守的“保密条款”和“不贬低条款”，禁止任何时间、任何场合批评OpenAI，而且即使承认保密协议的存在也是违反该协议的行为；如果离职员工拒绝签署，或者违反协议规定，他们可能会失去既得股权，价值数百万美元。

同时，这份“离职协议”的期限是：终身，直至死亡。如果把这份“警惕员工”的保密精神，用在 AI 安全上，可能就不会有所谓的人类 AI 危机了。但在互联网巨企眼中，市场份额远远比“虚无缥缈”的安全性更为关键。

OpenAI 近日风波不断，加上近日又有外媒曝出 Sora 模型的研发也陷入了困境，因此这个2 月发布的模型至今也没兑现。7 月末，OpenAI 已官宣开启 GPT-4o 语音模式的灰度测试，目前不确定他们是否赶得上“秋季发布”的 flag。

据投资机构预测，OpenAI 今年预计还会继续亏损，继续训练更强大模型，在造血能力还不够的情况下，如何持续融资也是OpenAI 不得不考虑的问题，OpenAI 或许已经开始考虑上市的事情了。“草莓”的到来，是否能为OpenAI下滑的口碑，挽回些“面子”呢？

OpenAI 的路最终会走向何方？未来是否会带来颠覆性的产品呢？

据彭博社9月11日报道，OpenAI正在与投资者洽谈筹集新一轮65 亿美元的融资，或将推助公司估值达1500 亿美元。如果完成此轮融资，OpenAI 将跻身千亿美元俱乐部。

但如果无法继续保持领先地位，这千亿美元估值，或许真的只不过是向人类表明，AI 就是一场梦。

OpenAI 核心技术人员的离开，让一部分人联想到曾经的仙童半导体。不知道大家怎么看？

本文链接：https://gpt-4o.cc/chatgpt/26.html

GPT-4o第一波反馈来了 GPT-4o 在中国能不能用 gpt3.5和4.0区别 GPT4O 手机 GPT4O下载 GPT4O中文 OpenAI发布GPT40 GPT4o将免费使用 gpt4o将免费提供给所有用户 gpt4o可以在232毫秒内响应对话

2025年4月最新指南，用GPT-4o高效完成论文写作，这些指令技巧太实用了！
2025年3月，OpenAI推出了GPT-4o的重大更新，其中最引人瞩目的功能之一就是它的生图能力——用户只需用自然语言描述，就能生成高度逼真的图像，甚至能精准输出中文汉字，但对于学术研究者或学生来说...
GPT-4O资讯2025-04-260GPT4o 论文写作指令技巧 gpt4o论文写作指令
2025年4月最新指南，解决GPT-4o上传文件失败的5个实用技巧
2025年4月发布的GPT-4o文件上传故障解决指南提供了5项核心技巧：1. **检查文件格式兼容性**，确保为PDF、TXT等支持格式且大小不超过25MB；2. **清理浏览器缓存**或切换Chro...
GPT-4O资讯2025-04-251文件上传失败 GPT4o 实用技巧 gpt4o上传文件失败
GPT-4o如何帮你轻松理解广义相对论？2025年4月最新指南
2025年4月15日你是否曾被爱因斯坦的广义相对论搞得一头雾水？那些弯曲的时空、引力波、黑洞……听起来像是科幻电影里的概念，却真实地影响着我们的宇宙，但别担心，2025年3月推出的GPT-4o不仅能帮...
GPT-4O资讯2025-04-252GPT4o 广义相对论 2025指南 gpt4o分析广义相对论
解锁GPT-4o开发者模式，2025年4月最新功能深度解析
** ，2025年4月，OpenAI正式推出GPT-4o开发者模式，带来一系列突破性功能升级，该模式专为开发者优化，支持更高效的代码生成与调试，新增实时协作编程接口，可无缝集成主流开发工具（如VS...
GPT-4O资讯2025-04-252GPT4o 开发者模式 2025新功能 gpt4o开发者模式
苹果手机能用GPT-4o吗？2025年4月最新使用指南
2025年4月更新）：** ，苹果iPhone用户可通过官方App Store下载OpenAI的ChatGPT应用（支持GPT-4o模型），需确保系统为iOS 16或更高版本，使用方法包括：1. *...
GPT-4O资讯2025-04-253苹果手机 GPT4o 使用指南苹果手机能用gpt4o
GPT-4o能本地部署吗？2025年4月最新解析与实操指南
2025年4月更新）：** ，GPT-4o仍无法实现完全本地部署，其核心模型依赖OpenAI的云端算力支持，尽管开源社区已推出部分轻量化模型（如LLaMA 3、Mistral等），但它们在性能上与G...
GPT-4O资讯2025-04-254GPT4o 本地部署 2025 gpt4o可以本地部署吗
2025年4月最新！GPT-4o免费开放，零门槛体验AI生图与中文创作
2025年4月，OpenAI宣布重磅更新：GPT-4o即日起向全球用户免费开放，彻底打破AI技术使用门槛，这款全能模型不仅支持流畅的中文对话与文本创作，还新增了零基础可操作的AI生图功能，用户无需订阅...
GPT-4O资讯2025-04-254GPT4o 免费开放 AI生图 gpt4o免费开放
2025年4月最新体验，GPT-4o生图功能，让你的创意瞬间成真
2025年4月，OpenAI推出GPT-4o的全新生图功能，为用户带来前所未有的创意体验，只需输入简单的文字描述，GPT-4o即可在几秒内生成高质量图像，无论是写实风格、艺术插画还是科幻场景，都能精准...
GPT-4O资讯2025-04-245GPT4o 生图功能创意实现 gpt4o体验时间

CHATGPT计划在未来两周内发布推理大模型“草莓”（GPT4.5）

相关文章

2025年4月最新指南，用GPT-4o高效完成论文写作，这些指令技巧太实用了！

2025年4月最新指南，解决GPT-4o上传文件失败的5个实用技巧

GPT-4o如何帮你轻松理解广义相对论？2025年4月最新指南

解锁GPT-4o开发者模式，2025年4月最新功能深度解析

苹果手机能用GPT-4o吗？2025年4月最新使用指南

GPT-4o能本地部署吗？2025年4月最新解析与实操指南

2025年4月最新！GPT-4o免费开放，零门槛体验AI生图与中文创作

2025年4月最新体验，GPT-4o生图功能，让你的创意瞬间成真

网友评论