如果DeepSeek成功改用中国制造的GPU,英伟达在人工智能的垄断地位或被打破。
中国AI新创公司深度求索(DeepSeek),开发的大语言模型时,绕过美国人工智能巨头英伟达的CUDA框架,有中国媒体报道,DeepSeek正为未来适配国产GPU晶片做准备。
据《快科技》和《腾讯网》报道,英伟达的“统一运算架构”(Compute Unified Device Architecture,CUDA),能大幅降低了研发大模型的难度,获全球开发商使用,令英伟达在人工智能发展上拥有垄断地位。
- Advertisement -
美国科技网站Tom’s Hardware报道,DeepSeek在使用英伟达的H800晶片进行训练时,使用了英伟达的底层硬件指令PTX(Parallel Thread Execution)语言,而不是高级编程语言CUDA。
- Advertisement -
北京航空航太大学副教授黄雷表示,绕过CUDA意味著DeepSeek可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细微性的操作。
报道指,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之后使用中国国产GPU,其在硬体适配方面将会更得心应手,其只要了解这些硬体驱动提供的一些基本函数介面,就可以仿照英伟达GPU硬体的程式设计介面,去写相关的代码,从而让自家大模型更加容易适配国产硬体。