华盛顿大学专家:DeepSeek如何改变人工智能行业
创始人
2025-02-05 05:21:03
0

鞭牛士报道,2月4日消息,据外电报道,分析师表明,与 Open AI ChatGPT 和其他机器学习平台等模型相比,DeepSeek AI 的训练效率更高,此后,DeepSeek AI 在过去一周人气飙升。

根据在其网站Stratechery上提供技术行业分析的 Ben Thompson 的报告,DeepSeek 的设计受到诸多限制,最终导致机器学习所需的计算能力发生了创新。开发 DeepSeek 的初创公司位于中国,而中国正受到贸易禁运,这导致其无法获得美国跨国公司 Nvidia 生产的高质量半导体芯片。

由于主要使用质量较低的芯片,DeepSeek 开发人员不得不采用各种人工智能 (AI) 优化技术,从而使他们的机器学习平台发挥出更大的性价比。

根据斯坦福大学 2024 年人工智能指数报告,DeepSeek 开发人员声称,训练他们最新版本的 AI 花费了大约 560 万美元,而最新的 Chat GPT 4 训练成本据称为 7800 万美元,谷歌的 Gemini Ultra 成本为 1.91 亿美元。

当人工智能训练的成本大幅降低时,华盛顿大学圣路易斯分校的科学家和消费者都将受益。

麦凯维工程学院计算机科学与工程助理教授乌马尔·伊克巴尔 (Umar Iqbal) 表示,仅他的实验室就需要花费数万美元才能使用这些平台,而来自中国初创公司的竞争可能会降低价格。

Stratechery 的文章中提到了 DeepSeek 降低训练成本的一个例子,即他们的开发人员使用了一种名为蒸馏的方法,他们使用像 ChatGPT 这样的成熟生成式 AI 系统来“教”他们的系统如何完成工作。

McKelvey Engineering 的博士生最近尝试了蒸馏来改进大型语言模型,而无需额外的训练。

「要让技术得到大规模采用,它们必须价格低廉。」伊克巴尔说。「这表明使用模型可以变得非常便宜。」

「总的来说,这是一个有趣的发展。它大大降低了人工智能的成本。」伊克巴尔补充道。「我们将能够进行实验,进行更多大规模实验。」

但主要研究课题是互联网安全和隐私的伊克巴尔警告说,未来还会出现其他陷阱。

对 DeepSeek 的担忧

要运行这些模型,人们需要访问大型硬件;这不是人们可以下载到手机上的东西。人工智能平台的工作方式是,一个人的机器和数据会传到云端的人工智能机器上——这就是他们可能失去对数据的控制的地方。

伊克巴尔表示:这是一个非常严重的问题。

人工智能系统可以实现庞大的监控基础设施,其中一些已经以搜索引擎的形式存在,可以追踪来自整个网络的用户数据,主要是为了促进电子商务。

「所有这些数据都会发送给不同的人工智能供应商,他们可以利用这些信息来分析用户,推断他们的兴趣,监视他们,甚至影响他们。」伊克巴尔说。

另一个担忧是人工智能语言模型越来越多地融入移动应用。人工智能的一个越来越被宣传的用途是规划假期。当人工智能使用各种应用程序来做这件事时,如果有任何恶意软件潜伏其中,它就有可能从用户那里收集更多的数据并操纵人工智能寻求的结果。

「当这些技术具有巨大潜力时,它们会发展得非常快。」伊克巴尔说。「你需要在设计中埋设护栏和保护措施。而人工智能系统却没有这样做。」

相关内容

热门资讯

最新或2023(历届)北京中考...   日前,本市中招新政出台,其中明确规定,最新或2023(历届),全市27个实验班将遵循“普惠制”,...
常州市新桥中学最新或2023(... 常州市新桥中学位于常州市北部新城政治、经济、文化中心腹地,紧邻新建的京沪高速铁路常州站口,市快速公交...
常州市第五中学最新或2023(... 关于常州市第五中学最新或2023(历届)艺术特色类提前录取专业考试的通知 常州市第五中学...
最新或2023(历届)北京中考... 北京市中招政策于上月发布。4月起,各高中校开始陆续开展校园开放日,并进行中招宣传。根据今年中招政策,...
最新或2023(历届)北京海淀...  4月8日,北京海淀区公布最新或2023(历届)中招政策。今年,该区中考报名人数为18438人,较去...