字节开源大型语言模型 Seed-OSS-36B
创始人
2025-08-21 12:44:28

钛媒体App 8月21日消息,字节跳动旗下的 Seed 团队在 AI 代码分享平台 Hugging Face 上发布了最新的开源大型语言模型 Seed-OSS-36B。Seed-OSS-36B 的架构结合了多种常见的设计选择,包括因果语言建模、分组查询注意力(Grouped Query Attention)、SwiGLU 激活函数、RMSNorm 和 RoPE 位置编码。每个模型包含 360 亿参数,分布在 64 层网络中,并支持 15.5 万词表。这一新模型最大上下文长度可达 512k tokens,能够在不损失性能的情况下处理超长文档和推理链。(广角观察)

相关内容

热门资讯

瞄准数字文创赛道 助创业“一人... 转自:成都日报锦观AI入驻瞄准数字文创赛道 助创业“一人成军”又一OPC孵化基地预计下月建成 ...
2025年全国受理消费投诉举报... 转自:成都日报锦观2025年全国受理消费投诉 【下载黑猫投诉客户端】举报2600多万件挽回经济损失超...
宣称“提升男性功能”的咖啡竟含... 转自:成都日报锦观宣称“提升男性功能”的咖啡竟含禁药销售“毒咖啡”牟利,三人获刑并赔13.95万余元...
超浮夸Mansory改装911... # 保时捷 ## 911 Turbo S ## CLAUTO酷乐汽车 #Mansory迈莎锐发布一款...