幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama
创始人
2024-12-27 11:41:48

蓝鲸新闻12月27日讯 12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露,v3模型的总训练成本为557.6万美元,GPT-4o等模型的训练成本约为1亿美元。DeepSeek-V3定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,并享有45天的优惠价格体验期。今年5月,DeepSeek是率先发起国内大模型价格战的公司之一。(蓝鲸新闻 朱俊熹)

相关内容

热门资讯

“建阳建本文化展”在福州温泉博... 福州新闻网7月1日讯(记者 莫思予)1日,由福州市鼓楼区文体旅局、南平市建阳区文体旅局主办的“建本千...
闽侯县零工市场揭牌运营   “福你就业”迭代升级,福州灵活就业生态加速形成  闽侯县零工市场揭牌运营  闽侯县零工市场已正式...
晋安区总工会开展2026年一线... 为不断提升职工生活品质,切实关爱职工身心健康,6月24日—6月26日,晋安区总工会组织20名一线职工...
深水规院涨2.02%,成交额6... 7月3日,深水规院盘中上涨2.02%,截至09:43,报16.69元/股,成交699.51万元,换手...
万家中证红利ETF(15958... 数据显示,7月2日,万家中证红利ETF(159581)获净申购295.01万元,位居当日股票ETF净...