星期二 2024年 11月 26日
主页 国际新闻

新版ChatGPT用人类思维推理 OpenAI o1可解答逾8成IMO题

- Advertisement -
听文章 Powered by 光华网

OpenAI发表具推理功能的新AI模型。

人工智能新创公司OpenAI推出能够解决复杂推理的新版ChatGPT,定名OpenAI o1。这款新模型能以人类思考方式回答问题,专门应付需要逻辑推理的任务,像是数学和科学。

专门应付逻辑推理任务

OpenAI指出,OpenAI o1在国际数学奥林匹亚(IMO)竞赛中能正确解答83%的题目,相较之下,今年5月上线的GPT-4o仅能正确解答13%的题目。

GPT-4o在资讯检索方面的表现较为出色,而OpenAI o1则是专门应付需要逻辑推理的任务,而且在回答问题前会花更多时间思考题目,“就像人类一样”。

助医疗研究及电脑开发

- Advertisement -

OpenAI表示,新的推理功能可用于医疗保健研究人员注释细胞测序数据,物理学家生成复杂公式,或电脑开发人员构建和执行多步骤设计。

OpenAI首席科学家帕乔基和技术研究人员席多在一次展示中,示范用OpenAI o1技术解决一个博士级的化学问题,并根据患者的症状和病史详细报告,诊断出一种疾病。

回答需要时间

帕乔基进一步阐述:“使用像是ChatGPT这种早期模型时,你问它一个问题,它会立即开始回答。但推理模型OpenAI o1需要时间,它能够用英文思考问题,尝试将问题拆解,并寻找解决角度,努力提供最佳解答。”

- Advertisement -

OpenAI的ChatGPT在2022年底问世,此款对答机械人会出现幻觉和捏造事实的情况,OpenAI一直在尝试解决缺陷;不过席多仍表示,OpenAI o1并不是完美的,这款新的推理模型只是更有可能产生正确答案。

OpenAI在内部使用代号Strawberry(草莓)来指称这个项目,同时将今次宣布的新模型命名为o1和o1-mini。

自周四起,用户可以透过ChatGPT、付费版ChatGPT Plus、Team都能够使用OpenAI o1的预览版本。

找工作, 就找这里!
› 立即申请
  • GMBB Part Timer
  • Event
  • Kuala Lumpur
  • MYR 100.00 /Day
› 立即申请
  • Social Media Marketing Executive
  • Advertising & Marketing
  • Kuala Lumpur
  • MYR 6K /Month
› 立即申请
  • PHP Software Developer
  • Information Technology
  • Wilayah Persekutuan
  • MYR 6K /Month
› 立即申请
  • DevOps Software Engineer
  • Information Technology
  • Kuala Lumpur
  • MYR 6.5K /Month
› 立即申请
  • Java Software Engineer
  • Information Technology
  • Kuala Lumpur
  • MYR 10K /Month
› 立即申请
  • Curated Store
  • Event
  • Kuala Lumpur
  • MYR 100.00 /Day
› 立即申请
  • Gallery Sitter
  • Event
  • Kuala Lumpur
  • MYR 100.00 /Day
› 立即申请
  • 软件测试与客户支持专员 Software Testing & Customer Support Specialist
  • Information Technology
  • Kuala Lumpur
  • MYR 3K /Month
› 立即申请
  • Cashier and Kiosk Management for Kiosk
  • Event
  • Kuala Lumpur
  • MYR 100.00 /Day

- Advertisement -