AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B
创始人
2025-03-06 16:20:50

3月6日消息,AMD今日宣布,为Radeon RX 9070系列开源Linux驱动程序,还宣布开源Instella —— 一个完全开源的3B参数语言模型。

AMD Instella代表“完全开源的尖端30亿参数语言模型(LMs)”。这些模型在AMD Instinct MI300X GPU上进行了训练,根据AMD发布的数据,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等相媲美。

AMD Instella模型是在Instinct MI300X硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

【来源:IT之家】

相关内容

热门资讯

跨境赏雪成新风尚 越南旅客元旦... 01:252026年1月1日,中越跨境旅游市场迎来新年热潮,3000余名越南游客通过中越边境河口口岸...
海南与粤港澳大湾区将实现高铁直... 本文转自【大湾区之声】;湛海高铁有新进展。国家发展改革委近日批复(核准)包括湛海跨海轮渡及线路工程在...
“小三通”客运航线通航25年 ... 转自:新华社新华社福州1月2日电 (记者 许雪毅)自2001年1月2日首航以来,“小三通”客运航线通...
禁毒部门回应“奶茶等于准毒品”... 最近,针对部分网友称某奶茶品牌疑似擦边毒品的说法,上海市禁毒委员会办公室通过官方公众号澄清,这种说法...
“蜜都”饶河:赫哲莫日根雪乡消... 中新网双鸭山1月2日电(张琪 张承珍)2日,黑龙江省双鸭山市饶河县四排乡“赫哲莫日根雪乡消费季”启幕...