OpenAI 创始人 John Schulman 访谈节选:为什么 GPT-4 比一年前更“聪明”了?
他认为,在强化学习研究领域,研究人员需要具备丰富的经验和敏锐的直觉。了解整个技术堆栈,并对各个部分充满好奇心是关键。此外,从第一性原理出发思考问题,而不仅仅依靠实验证据,也能够帮助研究人员在数据操控和环境设置方面做出更好的决策。
Patel:在未来,用于训练的计算力中,预训练与后训练的比例是否会明显偏向后训练呢?
Schulman:确实,有一些观点支持这种说法。
Patel:我是说,现在这个比例非常不平衡。
Schulman:但你可以认为,模型生成的输出质量比网上的大多数内容都要高。因此,让模型自己思考似乎更有道理,而不仅仅是训练来模仿网络上的内容。所以,我认为从第一性原理上来说,这是有说服力的。我会说,我们通过后训练取得了很多进步。因此,我不确定。所以,我希望我们会继续推动这种方法,并且可能会增加投入到后训练中的计算力。
Patel:当前的 GPT-4 的 ELO 分数比最初发布的版本高出了大约 100 分。这是否全都是后训练带来的改进呢?
Schulman:对,我会说大部分都是后训练带来的。
Patel:这很有意思。
Schulman:因此,有很多不同的改进方向。我们会考虑数据质量,数据数量,进行更多的部署和收集新数据的迭代,改变你收集的注解种类。因此,有很多因素叠加在一起。但是全部加在一起,就会带来一个相当不错的,有效的计算力提升。
Patel:后训练的优化程度对于竞争优势有多大影响呢?
Schulman:目前,我会区别公司是通过我们的模型有多大等等。那么,找出你之前提到的所有这些数据的复杂问题的公司,会占据大优势吗?
参考:
1、https://www.youtube.com/watch?v=JclnqKZBTUU
2、https://x.com/dotey/status/1791296632262123885
本文链接:https://gpt-4o.cc/chatgpt/9.html
GPT-4o第一波反馈来了GPT-4o 在中国能不能用什么叫GPTGPT4o怎么用GPT4O 手机GPT4O中文版GPT4O中文gpt4O和gpt4区别gpt4O有什么用gpt4o怎么用
网友评论