星期日 2025年 3月 30日
主页 国际新闻

DeepSeek发布V3模型更新 大大提升编程能力

- Advertisement -
听文章 Powered by 光华网

DeepSeek位于杭州市的总部。

中国初创公司深度求索(DeepSeek)24日晚间发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前已在Hugging Face上开源,并迅速登上了Trending榜单。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,该版本的最新模型也已经同步至官网、App和小程序,关闭“深度思考”就可体验。

- Advertisement -

此次发布的版本更新,在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3-0324生成前端代码的能力大大提升。

- Advertisement -

不少自媒体博主在社交平台上发帖认为,DeepSeek-V3-0324模型在前端代码的生成能力上有了质的提升,审美方面也提升了不少,甚至有博主测评称可以媲美Claude 3.7 Sonnet思维链版本。有不少用户开始尝试将新模型与此前发布的模型结合解锁新的玩法。有用户称用DeepSeek-V3-0324模型尝试编写了800多行代码,整个过程没有出现任何故障。该位用户称:“这是免费的、开源的、超快的。很高兴看到这些开源模型如何向大型科技公司施压,以更低的成本构建更好的模型。”

澎湃科技此前曾报道,初代DeepSeek-V3发布于2024年12月26日晚间,这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元(2472.69万令吉),而GPT-4o等模型的训练成本约为1亿美元(4.43亿令吉)。深度求索表示:“这是一个全新的开始。”其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

找工作, 就找这里!
› 立即申请
  • Social Media Marketing Executive
  • Advertising & Marketing
  • Kuala Lumpur
  • MYR 6K /Month
› 立即申请
  • PHP Software Developer
  • Information Technology
  • Wilayah Persekutuan
  • MYR 6K /Month
› 立即申请
  • DevOps Software Engineer
  • Information Technology
  • Kuala Lumpur
  • MYR 6.5K /Month
› 立即申请
  • Java Software Engineer
  • Information Technology
  • Kuala Lumpur
  • MYR 10K /Month
› 立即申请
  • GMBB Part Timer
  • Event
  • Kuala Lumpur
  • MYR 110.00 /Day
› 立即申请
  • Software Developer
  • Information Technology
  • Kuala Lumpur
  • MYR 4K /Month
› 立即申请
  • 软件测试与客户支持专员 Software Testing & Customer Support Specialist
  • Information Technology
  • Kuala Lumpur
  • MYR 3K /Month
› 立即申请
  • GMBB Part Timer
  • Event
  • Kuala Lumpur
  • MYR 110.00 /Day
› 立即申请
  • Admin cum Customer Service
  • Engineering
  • Bayan Lepas
  • MYR 3K /Month

- Advertisement -