幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama
创始人
2024-12-27 11:41:48

蓝鲸新闻12月27日讯 12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露,v3模型的总训练成本为557.6万美元,GPT-4o等模型的训练成本约为1亿美元。DeepSeek-V3定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,并享有45天的优惠价格体验期。今年5月,DeepSeek是率先发起国内大模型价格战的公司之一。(蓝鲸新闻 朱俊熹)

相关内容

热门资讯

国防部:日本侵略过所有周边国家 3月26日下午,国防部举行例行记者会,国防部新闻局副局长、国防部新闻发言人蒋斌大校答记者问。记者:据...
港榕两地学子 同上一堂AI课 香港学子开心走过百福门,观看“福州中轴线文化”项目化学习成果展台。一附小张彬老师借助数字人AI执教整...
公司经理助理岗位职责 质安部经...   1、在公司经理领导下负责办公室的全面工作,努力作好公司经理的参谋助手,起到承上启下的作用,认真做...
物业经理岗位职责 物业经理岗位...   篇一:物业经理岗位职责   1 落实总经理安排的各项工作;   2 负责本部门整体运作;   3...
市场总监岗位职责 市场总监岗位...   篇一:市场总监岗位职责   协助总经理制订总体市场发展战略以及市场发展目标   拓展公司的市场策...