阿里云日前正式发表“通义千问2.5版”,声称模型效能将全面赶超GPT-4-Turbo,成为“地表最强”中文大模型。
中国阿里巴巴旗下阿里云通义家族再添新成员!阿里云日前正式发表“通义千问2.5版”,同时开源通义千问1100亿参数模型,声称模型效能将全面赶超GPT-4-Turbo,成为“地表最强”中文大模型。通义千问APP也宣布更名为“通义APP”,致力于成为通情达义的人工智慧(AI)助手。
综合中媒报导,阿里云日前举行高峰会,公布最新数据显示,通义大模型透过阿里云服务企业已超过9万家、透过钉钉服务企业超过220万家,且截至目前通义开源模型累计下载量突破700万。这也显示通义落实应用,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。
阿里云指出,相比“通义千问2.1”版本,“通义千问2.5”的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。其中,在权威基准OpenCompass上,“通义千问2.5”的得分追平GPT-4 Turbo,是该基准首次录得中国国产大模型取得该成绩。
“模型效能全面追赶GPT-4 Turbo,在中文大模型方面领先业界”,阿里云同时强调,通义千问最新开源的1100亿参数模型在多个基准评估中收获最高得分,超越Meta的Llama-3-70B,成为开源领域中表现最佳的模型之一。小米旗下AI助理“小爱同学”也已与通义大模型达成合作。
阿里云CTO周靖人介绍,当下企业应用大模型有3种模式,一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。他强调,开发者的回馈与开源社群的生态支持,是通义大模式技术进步的重要助力。
公开资料显示,通义大模型2023年4月问世以来,目前发展出文生图、智慧编码、文件解析、音视频理解等能力。企业客户和开发者可以透过API呼叫、模型下载等方式接入;个人用户可从通义APP、官网和小程式免费使用通义家族全端服务。