据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的科学、编码和数学问题。
12日,该公司正式上线了“OpenAI o1-预览版(preview)”和“o1-mini (迷你版)”。其中o1-预览版不仅推理能力强,还具备广博的知识。o1-迷你版则速度更快,成本比前者低80%,且在编码任务方面更具竞争力。该公司预计,o1-迷你版将成为一种更快、更具成本效益的模型,适用于需要推理但无需广博知识的应用场景。
OpenAI表示,他们对o1模型进行了训练,使其学会了完善自己的思维,尝试不同策略,并发现自己的错误。
该公司也对正在研发的更新版模型的性能进行了评估。测试结果显示,这一更新版模型在基准物理、化学和生物学任务上的表现,与博士生相当。其在数学和编码方面的表现也可圈可点。在国际数学奥林匹克的资格考试中,该模型得分为83%,而GPT-4o仅正确解决了13%的问题。该模型也在美国数学奥林匹克资格赛中跻身美国前500名,且在竞争性编程竞赛中排名前89%。
研究团队称,作为“初生牛犊”,o1模型目前还不具备ChatGPT拥有的许多功能,例如浏览网页以获取信息、上传文件和图像等。对于许多日常问题,短期内GPT-4o更能胜任。但对于复杂的推理任务来说,新模型是一个重大的进步,代表了AI能力的新阶段,它们因此将新系列命名为OpenAI o1。
该公司指出,推理能力的增强对于解决科学、编码、数学等领域的复杂问题非常有用。例如,医疗保健研究人员可以利用o1模型注释细胞测序数据;物理学家则可利用其生成量子光学所需的复杂数学公式等;所有领域的开发人员都可用其构建和执行多步骤工作流程。
(图片来源:OpenAI官网)