OpenAI 突然发布 GPT-4o mini !更快更便宜

GPT4o2024-07-20 10:45:5457
从今天起,ChatGPT 正式迎来了「4」时代。
就在刚刚,OpenAI 官方宣布推出 GPT-3.5 Turbo 的替代品——GPT-4o mini。顾名思义,GPT-4o mini 是 GPT-4o 的简化版本,参数量更小。
即日起,所有 ChatGPT 免费用户、Plus 用户和 Team 用户都可以使用 GPT-4o mini。下周,企业版客户也将获得使用 GPT-4o mini 的权限。
OpenAI 官方表示,「这一变化符合我们让所有用户都能享受到 AI 技术好处的目标。」
主打低成本和快速响应能力的 GPT-4o mini 适用于多种应用场景。
例如,它可以支持需要连续或同时调用多个模型的应用程序,如同时调用多个 API。此外,它还能处理大量上下文信息,例如完整的代码库或对话记录,并能通过快速实时的文本回复与客户进行互动,适用于如客户服务聊天机器人等场景。
具体来说,GPT-4o mini 目前在 API 中提供了文本和图像处理功能,未来将逐步增加对视频和音频的支持。该模型能够处理多达 128K token 的长上下文,知识库截止到 2023 年 10 月份,并且对非英文内容的支持也更加友好。

ChatGPT 截图


根据 OpenAI 分享的基准测试结果,GPT-4o mini 展现了卓越的性能。在推理基准测试 MMLU 中,GPT-4o mini 得分为 82%,相比之下,Gemini Flash 得分为 77.9%,而此前主打极高性价比的 Claude Haiku 得分为 73.8%。
在数学推理和编程任务方面,GPT-4o mini 同样表现出色,显著超越市场上的其他小型模型。在 MGSM 数学推理能力基准测试中,GPT-4o mini 得分为 87.0%,而 Gemini Flash 得分为 75.5%,Claude Haiku 得分为 71.7%。
此外,GPT-4o mini 在 HumanEval 基准测试中再次展现出强势表现,得分达到 87.2%,远超 Gemini Flash 的 71.5% 和 Claude Haiku 的 75.9%。这些成绩表明,GPT-4o mini 在各个方面都具有明显的优势,特别是在推理、数学和编程等关键任务上。
在多模态推理基准测试 MMMU 中,GPT-4o mini 同样表现出色,得分为 59.4%,相比之下,Gemini Flash 的得分为 56.1%,而 Claude Haiku 的得分为 50.2%。
尤为显眼的是,GPT-3.5 Turbo 在这些基准测试中的表现均不如 GPT-4o mini,几乎在所有方面都被全面超越。此外,GPT-4o mini 在大模型盲测竞技场 LMSYS 中的表现也优于 GPT-4T 01-25,展现了其在实际应用场景中的卓越能力。
这些结果显示,GPT-4o mini 不仅在推理、数学推理和编程任务方面表现出色,还在多模态推理任务中展现了强大实力,明显优于市场上的其他小型模型。
OpenAI 表示,GPT-4o mini 现已可在其 Assistant API、Chat Completions API 和 Batch API 中作为文本和视觉模型使用。
GPT-4o mini 的定价相对具有竞争力:每 100 万输入 token 仅 15 美分,每 100 万输出 token 则为 60 美分,这比 GPT-3.5 Turbo 便宜超过 60%。换句话说,使用 GPT-4o mini 生成一本 2500 页的书,成本仅需 60 美分。
这些定价策略不仅让GPT-4o mini 成为高性价比的选择,也为开发者和企业提供了更经济实惠的解决方案,尤其是在需要大规模文本生成和处理的场景中。

本文链接:https://gpt-4o.cc/chatgpt/22.html

GPT-40免费GPT-40评测GPT4O 手机版gpt4O和gpt4区别gpt4和gpt4ogpt4o检测情绪gpt4o将免费提供给所有用户gpt4o api接入gpt4o api 图片gpt4o实测

相关文章

网友评论