字节开源大型语言模型 Seed-OSS-36B
创始人
2025-08-21 12:44:28

钛媒体App 8月21日消息,字节跳动旗下的 Seed 团队在 AI 代码分享平台 Hugging Face 上发布了最新的开源大型语言模型 Seed-OSS-36B。Seed-OSS-36B 的架构结合了多种常见的设计选择,包括因果语言建模、分组查询注意力(Grouped Query Attention)、SwiGLU 激活函数、RMSNorm 和 RoPE 位置编码。每个模型包含 360 亿参数,分布在 64 层网络中,并支持 15.5 万词表。这一新模型最大上下文长度可达 512k tokens,能够在不损失性能的情况下处理超长文档和推理链。(广角观察)

相关内容

热门资讯

中央气象台:全球天气公报(20...   来源:中央气象台网站  日本大部琉球群岛等地有风雨  法国西班牙等地持续高温  一、全球天气实况...
投资者提问:公司一季度亏损主要... 投资者提问:公司一季度亏损主要是因为汇率变动,请问公司二季度是否进行了相应的锁汇套保?董秘回答(科陆...
SEGRO拒绝Prologis... 核心事件:普洛斯向SEGRO发出总值126亿英镑的全股份收购要约,SEGRO董事会直接回绝该方案。关...
上海机场(600009.SH)... 格隆汇6月24日丨上海机场(600009.SH)公布2025年年度权益分派实施公告,公司2025年末...
华菱精工:可查股东人数,特定时... 投资者提问:请问贵公司近期股东人数变化情况?董秘回答(华菱精工SH603356):尊敬的投资者,您好...