OpenAI|GPT-4o mini 高性价比小模型

GPT4o2024-07-19 07:59:1437

OpenAI

GPT-4o mini: advancing cost-efficient intelligence | OpenAI

https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

迷你GPT-4o具有成本效益的小型模型,GPT-4o mini在MMLU上的得分为82%,目前超过GPT-41在聊天偏好设置中LMSYS排行榜,比以前的frontier模型便宜一个数量级,比GPT-3.5 Turbo便宜60%以上。(在新窗口中打开)。

GPT-4o mini以其低成本和低延迟实现了广泛的任务,例如链接或并行多个模型调用(例如,调用多个API)的应用程序,向模型传递大量上下文(例如,完整的代码库或对话历史),或通过快速、实时的文本响应与客户交互(例如,客户支持聊天机器人)。

GPT-4o mini支持API中的文本和视觉,未来还将支持文本、图像、视频和音频输入和输出。该模型有一个128K令牌的上下文窗口,支持每个请求多达16K输出;处理非英语文本现在更具成本效益。

GPT-4o mini在文本智能和多模态推理的学术基准上超过了GPT-3.5 Turbo和其他小型车型,并支持与GPT-4o相同的语言范围。它还展示了强大的函数调用性能,使开发人员能够构建获取数据或对外部系统采取行动的应用程序,并与GPT-3.5 Turbo相比提高了长上下文性能。

推理任务: GPT-4o mini在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准MMLU上获得了82.0%的分数,而Gemini Flash和Claude Haiku的分数分别为77.9%和73.8%。

数学和编码熟练程度: GPT-4o mini在数学推理和编码任务方面表现出色,优于市场上以前的小型型号。在MGSM上,衡量数学推理,GPT-4o mini的得分为87.0%,相比之下,Gemini Flash的得分为75.5%,Claude Haiku的得分为71.7%。GPT-4o mini在衡量编码性能的HumanEval上的得分为87.2%,而Gemini Flash的得分为71.5%,Claude Haiku的得分为75.9%。

多模态推理:GPT-4o mini在多模态推理评估MMMU上也表现强劲,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

作为模型开发过程的一部分,我们与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用案例和局限性。我们与一些公司合作。GPT-4o mini的性能明显优于GPT-3.5 Turbo。

安全从一开始就被构建到我们的模型中,并在我们开发过程的每一步得到加强。在预培训中,我们过滤掉(在新窗口中打开)我们不希望模型学习或输出的信息,如仇恨言论、成人内容、主要收集个人信息的网站和垃圾邮件。在后期培训中,我们使用以下技术使模型的行为与我们的策略保持一致具有人类反馈的强化学习以提高模型响应的准确性和可靠性。

GPT-4o mini内置了与GPT-4o,使用自动和人工评估,根据我们的准备框架并且符合我们的自愿承诺。社会心理学和错误信息等领域的70多名外部专家对GPT-4o进行了测试,以确定潜在的风险,我们已经解决了这些风险,并计划在即将发布的GPT-4o系统卡中分享详细信息。这些专家评估的见解有助于提高GPT-4o和GPT-4o mini的安全性

GPT-4o mini现在可在助手API、聊天完成API和批处理API中作为文本和视觉模型使用。开发者为每100万个输入令牌支付15美分,为每100万个输出令牌支付60美分(大约相当于一本标准书籍的2500页)。计划在未来几天推出GPT-4o迷你微调。

在ChatGPT中,免费、高级和团队用户将能够从今天开始访问GPT-4o mini,取代GPT-3.5。企业用户也将从下周开始访问。

自2022年推出功能较弱的型号text-davinci-003以来,GPT-4o mini的每台令牌成本下降了99%。我们致力于在增强模型功能的同时继续降低成本。

设想未来模型会无缝集成到每个应用程序和每个网站上。GPT-4o mini为开发人员更高效、更经济地构建和扩展强大的人工智能应用铺平了道路。人工智能的未来变得越来越容易接近,越来越可靠,越来越嵌入到我们的日常数字体验中。

As of July 18th, 2024, an earlier version of GPT-4o mini outperforms GPT-4T 01-25.

OpenAI|证明与验证模式提升输出可读性

OpenAI的API限制?API迁移方案概要

OpenAI|新模型CriticGPT

OpenAI收购Rockset

AI峰会|智源大会OpenAI 月之暗面kimi百度智谱百川面壁

OpenAI|公开前沿模型安全训练的体系结构

OpenAI|推出微调API

OpenAI|Start using ChatGPT instantly

OpenAI|2024年2月推出首个视频生成模型Sora

AI系列更新|OpenAI|介绍ChatGPT Team

AI系列更新|OpenAI|介绍GPT Store

抖音牵芒果 OpenAI牵Springer 看中外企业布局破内卷(周观点)

【免责声明】本文信息均来源于公开资料及合法获得的相关外部报告资料,华鑫证券对这些信息的准确性及完整性不作任何保证,不保证其中的信息已做最新变更。本文信息仅供参考。在任何情况下,本文中的信息均不构成对任何人的投资建议。本公司及其本公司员工对使用本文内容所引发的任何直接或间接损失概不负责。

本文链接:https://gpt-4o.cc/chatgpt/21.html

GPT-40干翻所有语音助手GPT-4o 在中国能不能用gpt4和gpt4ogpt4o怎么用GPT-4o是哪个公司gpt4o可以在232毫秒内响应对话gpt4o比4多了什么功能gpt4o功能微软gpt4oOpen gpt4o

相关文章

网友评论