AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B
创始人
2025-03-06 16:20:50
0

3月6日消息,AMD今日宣布,为Radeon RX 9070系列开源Linux驱动程序,还宣布开源Instella —— 一个完全开源的3B参数语言模型。

AMD Instella代表“完全开源的尖端30亿参数语言模型(LMs)”。这些模型在AMD Instinct MI300X GPU上进行了训练,根据AMD发布的数据,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等相媲美。

AMD Instella模型是在Instinct MI300X硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

【来源:IT之家】

相关内容

热门资讯

“千里共辽宁 文化振兴行”走进... 转自:沈阳日报  本报讯(沈阳日报、沈报全媒体记者盖云飞)为深入贯彻落实文化强省战略,推动优质文化资...
最新或2023(历届)北京交通... 北京交通大学海滨学院成立于2008年5月,是由北京交通大学与融河(黄骅)科教有限公司合作创办、经教育...
最新或2023(历届)北京中医... 北京中医药大学是一所以中医药学为主干学科的全国重点大学,是唯一进入国家“211工程”建设的高等中医药...
最新或2023(历届)河北中医... 河北中医学院始建于1958年,是全国建校较早的高等中医药院校之一,河北省重点骨干大学,河北省人民政府...
去洗浴看喜剧 笑声中洗烦忧 转自:沈阳日报  在“沐浴休闲之都”举办喜剧电影周,会发生什么样神奇的化学反应呢?  7月5日-12...