北京清华大学团队近日发布中国AI光晶片“太极”,据了解,其开发过程就是受到《周易》启发。
北京清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃传统电子深度计算典范,另辟蹊径首创分散式广度智慧光计算架构,研制全球首款大规模干涉衍射异构集成晶片太极(Taichi),实现160 TOPS/W的通用智慧计算。
该研究成果于近日以〈大规模光晶片“太极”赋能160 TOPS/W通用人工智慧〉为题发表在最新一期的《科学》(Science)上。
作为人工智慧的三驾马车之一,算力,是训练AI模型、推理任务的关键。光计算,是将计算载体从电变为光,利用光在晶片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光晶片,具备高速高平行计算优势,被寄予希望用来支撑大模型等先进人工智慧应用。
- Advertisement -
智慧光计算作为新兴计算模态,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的影像处理等。其痛点是光的计算优势被困在不适合的电架构中,计算规模受限,无法支撑亟需高算力与高能效的复杂大模型智慧计算。
- Advertisement -
协助光计算“挣脱”算力瓶颈,另辟蹊径,“从0到1”重新设计适合光计算的新架构,是清华团队迈出的关键一步。
相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光晶片架构源自光计算独特的“全连接”与“高并行”属性,化深度计算为分散式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智慧光计算探索了新路径。
论文第一作者徐智昊指出,在“太极”架构中,自顶向下的编码拆分─解码重构机制,将复杂智慧任务化繁为简,拆分为多通道高并行的子任务,构建的分散式“大感受野”浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。