1月29日,阿里旗下平头哥官网上线一款名为“真武810E”的高端AI芯片,此前被央视曝光的阿里自研芯片PPU正式亮相。
至此,“通云哥”也就是通义千问大模型、阿里云和平头哥半导体,共同构成阿里巴巴AI能力黄金三角,在模型、云、芯片层面完成全栈布局。这也是一种追求AI最佳表现的路径选择,记者了解到,阿里巴巴正在将“通云哥”打造成一台AI超级计算机,寻求在芯片架构、云平台架构和模型架构上的协同创新,从而实现在云上训练和调用大模型时达到最高效率。
平头哥在2018年成立,在2018年阿里云栖大会上正式官宣。阿里把此前收购的中天微和达摩院自研芯片业务整合成“平头哥半导体有限公司”,由集团全资控股,推进云端一体化的芯片布局。
平头哥成立以来,发布过多款芯片,比如含光800(AI推理芯片NPU)、倚天710(服务器芯片CPU),以及存储和网络芯片、端侧和IOT芯片等。2020年,新一轮AI技术爆发前夕,平头哥在内部启动PPU研发工作。
据平头哥官网介绍,“真武”PPU采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研。其内存为96G HBM2e,片间互联带宽达700GB/s,可应用于AI训练、AI推理和自动驾驶。阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理,并结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务。
业内人士透露,对比关键参数,“真武”PPU的整体性能超过主流国产GPU。截至目前,“真武”PPU已在阿里云多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、Hehson微博等400多家客户。
不只是阿里,国外的谷歌,国内的百度,也选择在模型、云、芯片领域进行全栈布局。业内人士认为,通过软硬件层面的紧密耦合,有助于实现1+1+1>3的效果,不仅能更好发挥芯片的算力潜力,以及集群的算力效率,还能更好有效提升模型训练以及推理的效率,推动大模型在千行百业落地。