性能超越GPT-4Turbo 阿里云通义千问2.5问世光华日报

性能超越GPT-4Turbo 阿里云通义千问2.5问世

- Advertisement -

2024年5月16日

听文章 Powered by 光华网

阿里云日前正式发表“通义千问2.5版”，声称模型效能将全面赶超GPT-4-Turbo，成为“地表最强”中文大模型。

中国阿里巴巴旗下阿里云通义家族再添新成员！阿里云日前正式发表“通义千问2.5版”，同时开源通义千问1100亿参数模型，声称模型效能将全面赶超GPT-4-Turbo，成为“地表最强”中文大模型。通义千问APP也宣布更名为“通义APP”，致力于成为通情达义的人工智慧（AI）助手。

综合中媒报导，阿里云日前举行高峰会，公布最新数据显示，通义大模型透过阿里云服务企业已超过9万家、透过钉钉服务企业超过220万家，且截至目前通义开源模型累计下载量突破700万。这也显示通义落实应用，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

阿里云指出，相比“通义千问2.1”版本，“通义千问2.5”的理解能力、逻辑推理、指令遵循、代码能力分别提升9％、16％、19％、10％。其中，在权威基准OpenCompass上，“通义千问2.5”的得分追平GPT-4 Turbo，是该基准首次录得中国国产大模型取得该成绩。

- Advertisement -

“模型效能全面追赶GPT-4 Turbo，在中文大模型方面领先业界”，阿里云同时强调，通义千问最新开源的1100亿参数模型在多个基准评估中收获最高得分，超越Meta的Llama-3-70B，成为开源领域中表现最佳的模型之一。小米旗下AI助理“小爱同学”也已与通义大模型达成合作。

阿里云CTO周靖人介绍，当下企业应用大模型有3种模式，一是对大模型开箱即用，二是对大模型进行微调和持续训练，三是基于模型开发应用，其中最典型的需求是RAG，以企业数据对大模型进行知识增强。他强调，开发者的回馈与开源社群的生态支持，是通义大模式技术进步的重要助力。

公开资料显示，通义大模型2023年4月问世以来，目前发展出文生图、智慧编码、文件解析、音视频理解等能力。企业客户和开发者可以透过API呼叫、模型下载等方式接入；个人用户可从通义APP、官网和小程式免费使用通义家族全端服务。

- Advertisement -