字节开源大型语言模型 Seed-OSS-36B
创始人
2025-08-21 12:44:28

钛媒体App 8月21日消息,字节跳动旗下的 Seed 团队在 AI 代码分享平台 Hugging Face 上发布了最新的开源大型语言模型 Seed-OSS-36B。Seed-OSS-36B 的架构结合了多种常见的设计选择,包括因果语言建模、分组查询注意力(Grouped Query Attention)、SwiGLU 激活函数、RMSNorm 和 RoPE 位置编码。每个模型包含 360 亿参数,分布在 64 层网络中,并支持 15.5 万词表。这一新模型最大上下文长度可达 512k tokens,能够在不损失性能的情况下处理超长文档和推理链。(广角观察)

相关内容

热门资讯

张怀成通过专项考核 获影视编导... 近日,从业者张怀成顺利完成影视编导(高级)职业技能在线专项培训课程,并通过教育部教育技术与资源发展中...
智通港股52周新高、新低统计|... 截止12月22日收盘,有59只股票创52周新高,其中裕程物流(08489)、康桥悦生活(02205)...
池州南塘竹制品有限公司召回部分... 中国质量新闻网讯 据安徽省缺陷产品召回管理技术中心网站消息,日前,池州南塘竹制品有限公司按照《消费品...
ETF主力榜 | 信用债ETF...        2025年12月22日,信用债ETF(511190.SH)微跌,主力资金(单笔成交额1...
工信部:前11月电信业务收入累... 格隆汇12月22日|工信部发布数据,前11个月,电信业务收入累计完成16096亿元,同比增长0.9%...