AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B
创始人
2025-03-06 16:20:50

3月6日消息,AMD今日宣布,为Radeon RX 9070系列开源Linux驱动程序,还宣布开源Instella —— 一个完全开源的3B参数语言模型。

AMD Instella代表“完全开源的尖端30亿参数语言模型(LMs)”。这些模型在AMD Instinct MI300X GPU上进行了训练,根据AMD发布的数据,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等相媲美。

AMD Instella模型是在Instinct MI300X硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

【来源:IT之家】

相关内容

热门资讯

沈建光:年初中国经济的四大亮点... 一季度中国经济增速有望回升至5%左右,但争取更好结果还需政策持续发力推动内需实质性回暖。 3月16日...
智能体时代与上海先手棋效应观察 上海这片创新热土上,一场围绕智能体产业的“先手棋”已悄然落子。 今年的政府工作报告提出,深化拓展“人...
三苏祠回应希林娜依·高自罚抄1... 封面新闻记者 罗石芊 李庆3月23日,歌手希林娜依·高在微博发表一张手写100遍“三苏祠”的照片,并...
国城矿业A股股东户数减少835... 3月23日消息,数据显示,截至2026年2月28日,国城矿业(维权)A股股东总户数为2.86万户,较...
伊朗外长与土耳其外长通话,强调... 当地时间3月23日,伊朗外长阿拉格齐同土耳其外长费丹通电话,就地区局势发展及美以伊冲突对地区和全球安...