星期六 2024年 12月 28日
主页 国际新闻

缺先進晶片卻靠技術超車 中國追趕西方AI模型速度驚人

- Advertisement -
听文章 Powered by 光华网

虽然无法获得最先进晶片,中国的AI新创公司追赶美国领先的人工智慧模型速度极快,已超出许多业内人士的预期。

尽管中国在购买先进晶片方面受限,但愈来愈多迹象表明,中国的AI新创公司追赶美国领先的人工智慧模型速度极快,已超出许多业内人士的预期。虽然有些模型仍未正式发表与测试,但据看过这些模型运作的专家表示,这些人工智慧模型的进展“令人印象深刻”。

据《华尔街日报》 报导,以中国最成功的避险基金经理人之一投资的新创公司DeepSeek为例,该公司于11月发布其最新大型语言模型的预览版。该公司表示,这款大型语言模型能力与OpenAI名为o1的推理模型相比毫不逊色。

与此同时,最近几周其他中国公司也发表类似的声明。由中国网络巨擘阿里巴巴和腾讯投资的新创公司月之暗面(Moonshot AI)表示,其开发一个专门研究数学的模型,其能力接近OpenAI的o1。另一方面,阿里巴巴表示自家的一个实验研究模型在数学上优于OpenAI的o1预览版本。

报导指出,虽然这些公司尚未发表描述其模型内容的论文,但许多专家表示,对这些模型印象深刻。OpenAI前研究员、现任人工智慧企业家卡尔表示,中国“正在更快地迎头赶上”。卡尔认为,试图复制OpenAI推理模型的DeepSeek研究人员“在几个月内就弄清楚了”,他坦言许多同事对此感到惊讶。

- Advertisement -

DeepSeek称其模型在美国国际数学邀请赛(AIME)上击败了OpenAI。但《华尔街日报》利用今年AIME的15个问题进行的一项实验发现,OpenAI的o1预览模型比DeepSeek、Moonshot和阿里巴巴的实验模型更快找到了答案。

- Advertisement -

报导指出,自去年底以来,AI开发人员越来越多使用一种名为“混合专家模型”的技术,这种技术能降低对晶片的需求。

AI新创公司Anthropic的联合创始人克拉克在他的部落格中写道:“中国绕过出口管制的一种方法是,利用它可以访问的硬体建立非常好的软体和硬体培训。”他称:“中国制造将成为AI模型的一部分,就像电动车、无人机和其他技术一样。”尽管如此,据中国高层称,缺乏尖端晶片对中国新创企业来说是痛苦的,而且差距还会扩大。

找工作, 就找这里!
› 立即申请
  • Social Media Marketing Executive
  • Advertising & Marketing
  • Kuala Lumpur
  • MYR 6K /Month
› 立即申请
  • PHP Software Developer
  • Information Technology
  • Wilayah Persekutuan
  • MYR 6K /Month
› 立即申请
  • DevOps Software Engineer
  • Information Technology
  • Kuala Lumpur
  • MYR 6.5K /Month
› 立即申请
  • Java Software Engineer
  • Information Technology
  • Kuala Lumpur
  • MYR 10K /Month
› 立即申请
  • 软件测试与客户支持专员 Software Testing & Customer Support Specialist
  • Information Technology
  • Kuala Lumpur
  • MYR 3K /Month
› 立即申请
  • GMBB Part Timer
  • Event
  • Kuala Lumpur
  • MYR 110.00 /Day

- Advertisement -