字节开源大型语言模型 Seed-OSS-36B
创始人
2025-08-21 12:44:28
0

钛媒体App 8月21日消息,字节跳动旗下的 Seed 团队在 AI 代码分享平台 Hugging Face 上发布了最新的开源大型语言模型 Seed-OSS-36B。Seed-OSS-36B 的架构结合了多种常见的设计选择,包括因果语言建模、分组查询注意力(Grouped Query Attention)、SwiGLU 激活函数、RMSNorm 和 RoPE 位置编码。每个模型包含 360 亿参数,分布在 64 层网络中,并支持 15.5 万词表。这一新模型最大上下文长度可达 512k tokens,能够在不损失性能的情况下处理超长文档和推理链。(广角观察)

相关内容

热门资讯

光大证券首席经济学家高瑞东已加... 光大保德信基金新总经理人选出炉。8月21日,澎湃新闻记者获悉,光大证券研究所所长、首席经济学家、机构...
国家发改委:将于近期开展中央冻... 转自:国家发改委网站近期,由于夏季天气炎热、消费季节性偏弱,加之前期二次育肥生猪出栏,猪肉市场供应有...
蔚来李斌:为自驾318川藏线新...   Hehson科技讯 8月21日晚间消息,蔚来全新ES8产品技术发布会召开,蔚来创始人李斌发表开场...
1650亿立方米!我国又一大型...   中国石化8月21日宣布,中国石化江汉油田红星页岩气田1650.25亿立方米页岩气探明储量顺利通过...
振华科技A股股东户数增加2.3... 8月21日消息,数据显示,截至2025年6月30日,振华科技A股股东总户数为7.5万户,较上期(20...