如何避免AI毁灭人类?
创始人
2025-11-21 08:01:32

书籍《深度学习:智能时代的核心驱动力量》《大语言模型》

[美] 特伦斯·谢诺夫斯基

责编| 柒 排版| 沐言

第 9287 篇深度好文:5452字 | 11 分钟阅读

人工智能已经成为当今最热门的话题之一,然而很多人仍然觉得它遥不可及,事实上它早已悄然融入我们的生活,默默为我们的衣食住行提供助力。这种既远又近的感觉,恰恰是人工智能最特别的地方。

中央电视台·央视频特别节目《AI1001课》与中信出版集团共同邀约到国内外两位人工智能领域的知名专家学者:阿里云创始人王坚教授和《大语言模型》作者特伦斯·谢诺夫斯基教授,与我们共同走进人工智能的世界,看看它如何影响当下塑造未来。

一、人工智能的真正革命

是让“不可能”变得“触手可及”

1.大语言模型、三体与平权

王坚:谈到人工智能,其实很多人最开始认识到它,应该是从一些科幻电影或者一些科幻小说当中。

可能大家比较熟悉的就是《黑客帝国》。如果你记不得它是人工智能,但这个电影里边肯定有个画面大家不会忘掉,就是一串像代码一样的字符往下掉。

这是那个时代最科幻的,甚至把那个时代的颜色也体现出来了——绿绿的,白白的,那样就是未来。所有跟绿色有关都有自带一种科技感和未来感。

最近几年大家觉得比较科幻的就是《三体》,它反映了人们对一些今天还未知的、不存在的东西的追求。但实际上今天人工智能已经开始深入到我们的生活,它不再是一个未来式的东西。

尤其是今年年初DeepSeek给我们带来巨大的惊喜。这半年以来有非常非常多的人工智能应用上线。

除此之外,很多人都知道芯片是人工智能最基本的东西,如果我们没有芯片,可能人工智能就没法运作。可是很少人知道另外一句话:在如今,如果没有人工智能,芯片也造不出来。

所以如今芯片的复杂度已经到了没有人工智能做不了芯片。

如果去看谷歌这些企业就发现,他们花了很多精力在讲人工智能怎么帮助我们设计下一代芯片。

所以其实人类发展到今天,我们碰到的事情复杂度已经非常非常大了,如果没有一些更加先进的工具来帮助我们,事实上我们很难做一些事情。

另外比如去年的这个巴黎奥运会,我当时跟奥委会开会聊奥林匹克的人工智能的议程的时候,我跟他们说过这样一句话:其实观众是没有真正看到奥运会精彩的镜头的,观众只看到了导演认为的精彩的镜头,其实大部分的镜头可能从来没人看过。

所以去年奥运会大家看到了很多因为有了人工智能才见到的精彩镜头。所以人工智能其实比我们想象的有更多应用场景。

在过去的一年的时间里面,媒体上不断地出现各种各样跟人工智能相关的词语,比如像云计算、深度学习、神经网络、大语言模型。

第一个最关键的问题就是计算和智能的关系。

人工智能是离不开计算的。云计算是今天为人工智能提供计算的最好的方式。

联合国去年写过报告,认为云计算现在不能够让所有人平权地去访问,依旧是我们打造一个更具包容性的人工智能生态最大的障碍。

所以我想直接一点,如果没有今天的云计算,可能就不会有今天的人工智能,尽管是两个不同的技术,但是它们之间真是唇齿相依的关系。

第二件事情,我想先说大语言模型。

大语言模型是普通老百姓真正认识到人工智能就在身边,是触手可及的一个非常重要的机会。因为大语言模型你每天都可以用。可以理解成今天的人工智能就是以大语言模型为代表。

人工智能有很长的过去,只有很短的历史,大语言模型就是今天的人工智能。大语言模型也让今天的人工智能跟以前的人工智能划了一条分水岭,是彻底不一样了。

当然中间有两个非常重要的过渡。在技术发展的历史上,那大语言模型依赖于神经网络的架构。

通俗来讲,就是受大脑启发出来的东西那就是神经网络本身的东西。中间又有一个很重要的问题是怎么能够把数据很好地应用,那深度学习就出来了。

所以从这个角度,深度学习和神经网络是建立在云计算的基础上,为大语言模型做最重要的一个技术的储备。

在过去用神经网络和深度学习其实酝酿了不同的技术的,但是很多没有走到我们今天的大语言模型。所以这也是为什么大语言模型是有它独立存在的条件。

如果再总结一下,云计算是所有东西的基础,像基础设施一样的存在,神经网络和深度学习是一个非常重要的基础的方法,这个方法可能可以促成很多不同的新的东西诞生。

但是其中最重要一个东西的诞生就是我们今天说的人工智能,叫大语言模型。但是大语言模型又不是人工智能的全部的表现形式。

如果用汽车做个类比,大语言模型就是人工智能的引擎,至于你是造个跑车还是轿车,那大家都有各自的方法。

人工智能在今年破圈,或者是说在最近几年里面集中式的爆发,最重要是它真的做到了足够好,它真的实现了通过了图灵测试。

这背后的事实上有个很重要的契机是互联网的发展,大语言模型是把整个互联网装到了一个模型里面。

过去我们做搜索也是在互联网上找东西,在过去几十年互联网积累的上面所有的东西被大语言模型装到了一个口袋里,使得我们今天有机会真的能够看到一个像人类智能一样东西的出现。所以我想这可能是它发展背后的一个非常非常重要的原因。

所以我想这样其实是让我们对技术的未来会更有信心,当然倒过来讲这样的技术尝试对推动我们本身的发展有非常大的作用。

所以今天我们谈到人工智能的时候我们经常跟另外一个词叫“平权”放在一起。其实它是一个分享的过程。

如果我们不是站在自己的角度而是站在社会创造力的角度,我们在这个地球上的每一个人的创造力才能被充分地发挥出来,所以我想“三体”这个命名也有这个含义。

2.如何防止人工智能毁灭人类?“母爱”

特伦斯·谢诺夫斯基:我们希望理解人类智能,而情绪显然在其中发挥着作用,但并非所有人类情绪都是积极的,比如愤怒或者嫉妒。

要知道我们未必希望在人工智能身上复制人类所有的特质,无论是好的还是坏的。

杰弗里・辛顿是我多年的好友兼合作伙伴,他最近提出了一个问题是我们该如何防止人工智能毁灭人类,他建议我们可以将“母爱”这一情感融入人工智能。

核心思路是婴儿出生后母亲会将注意力集中在婴儿身上,而这种情感源于激素调节与情绪作用。

他认为这种情感是非常值得融入人工智能的积极情绪。总体而言“人工智能”这一概念的诞生很大程度上正是受到了人类大脑结构的启发。

二、我们与AI的互动方式

正在重新定义“智能”的边界

1.对AI礼貌有用吗?大语言模型是否存在幻觉?

特伦斯·谢诺夫斯基:

写了两本书:《深度学习》和《大语言模型》。当年写《深度学习》的时候花了大约2年时间才完成,但最新一本关于《大语言模型》的书只用了1年就写完了。

首先我将 ChatGPT 用作实例,换句话说我实际用它做实验进行测试。并且在书中每一项测试都配有专属的标注框,这样读者就能清楚区分哪些内容是 ChatGPT 的输出。哪些是我本人的表述。

除此之外我还做了一件比较特别的事,目前我还没在其他地方看到有人这么做:在每章的结尾我会把整章内容发给 ChatGPT,然后要求它为普通读者总结本章内容,结果非常出色。

说实话它总结得比我自己写得还要好,而且这本书的审稿人也反馈对他们而言这些总结比章节原文更容易理解。

我可以向大家分享一些关于提示词的使用技巧。

当你与 ChatGPT 或者 DeepSeek或其他任何大型语言模型交互时,必须明确告诉它要扮演什么角色。

因为这些模型已经吸收了各类作者、各行业从业者,比如医学、法律领域的角色特质。理论上你可以向它提出任何领域的问题,所以你得明确指令。

比如你现在是全球顶尖的癌症医学专家,请针对这个医学问题给出解答。你需要清晰地说明自己的问题以及对回答的预期,越明确越好。

其次有一点让我特别意外,这是我从一篇文章里看到的,你会惊喜地发现如果你很礼貌,你得到的回复质量会高很多。

这就像与人交流一样,如果你的态度生硬,在模型这个角度还有很多的可能性,得到的回应也会很敷衍。

但如果你能积极反馈表达认可,那对方给出的回应质量也会显著提升。

有部分人觉得这样做会占用过多的 tokens(词元)反而可能影响回答质量,但我认为,用占用过多 tokens来解释这个问题是不准确的。

其实当你对人工智能表现礼貌时,本质上是激活了它更多的功能模块,就像人类大脑一样不同区域负责不同功能,而社交互动是人类大脑的重要功能之一,我们的前额叶皮层就负责处理人际交互相关的活动。

有意思的是研究发现大语言模型也存在类似人类前额叶皮层的功能模块,所以如果你希望像与人交流一样与人工智能互动,就需要用对待人的方式去对待它。

对于大语言模型存在的“幻觉”情况,首先我认为从某种意义上来说幻觉这个词用得并不恰当,它会给人错误的印象。并不是说大语言模型像服用了致幻药物一样产生了意识混乱,完全不是这样的。

所谓的“幻觉输出”实际上逻辑性非常强,表述也很精准,同时还具备很强的创造性。

就像我之前说的你可以让它写一首诗,这首诗里会包含新颖的元素。顺便提一句现在很多作家也在借助它来辅助创作,如果它没有创造性,作家们就不会对它感兴趣了。

王坚:我和谢诺夫斯基的想法很接近。今天几乎所有在批评语言模型那些词,以前都是用在人的身上,这说明人也是有这些弱点,但人的弱点不是人不该有的东西,而只是他弱点。所以我一直觉得其实这个事情不值得大惊小怪。

另外如果这样的一个特性在人工智能上表现出来,事实上给了我们更多的机会去研究它。如果在人的身上可能还不太好研究,但是因为在这个人工智能上,我们有更多机会去了解它。

尽管我不能完全赞同这个“幻觉”就是创造力,因为在心理学里面这是两个不同的事情。但是不管怎么样我觉得这是一个非常有意思的现象,我觉得至少是不值得担心的一个现象。

关于数据这件事情,我觉得非常有意思。谢诺夫斯基教授也在说数据质量的问题,可是我们还是要承认数据本身无所谓质量的好坏,可是数据最后的质量是人决定的,也是人决定了用什么样的数据去确认模型。

2.AI时代孩子应该学什么?

王坚:首先孩子比我们学得快,孩子对这个问题怎么想可能是超出我们想象,甚至超过创造技术的这些人的想象。

所以我觉得这个可能很难有一个很好的答案。但我们还是可以回到一个最基本的面上去讨论。

图灵曾经说过一句话,他就说人的大脑,加上一张纸、一支笔和一个橡皮擦,再加上一定的规则,就是一台通用机器。

所以大家可以设想一下,其实我们的大脑如果没有一张纸、一支笔的话,其实我们的创造力是释放不出来的。

今天我们有了人工智能,有了像大语言模型这样的东西,是另外意义上的一张纸一支笔,把我们人的创造力给释放出来。我们真正怎么把小孩的创造力给释放出来,可能就会变成一非常重要的问题。

有了纸和笔以后,可能有的小孩字还是写歪的,有的字还是写潦草。有人能写出一篇很好的诗,可能有的人解一个很好的算术题。

我想可能人工智能帮助我们也是从这个角度帮助,它不会让人变得更加一样,而会让创造力变得更加不一样,创造出不同的价值。

特伦斯·谢诺夫斯基:我想接着聊聊“多样性”这个概念。如果你观察整个生物学领域,就会发现没有两个人是完全相同的,你身体里也没有两个完全相同的细胞。

生物学本质上是一门研究多样性的科学,而孩子们也具有很强的多样性。任何一个有两个孩子的家长都会意识到这一点。

每个学生使用人工智能的方式都会有所不同,我们不能用统一的模式去要求他们,必须给孩子足够的空间。

他们天生好奇,会主动接触各种事物,像玩玩具一样探索,还拥有丰富的想象力,我认为人工智能本质上会为他们提供新的工具、新的与世界互动的方式,帮助他们产生更好的想法。

我举个例子,现在有一些国际象棋程序水平已经能达到人类顶尖棋手的级别,甚至能和国际象棋世界冠军抗衡。

在我这一代最伟大的国际象棋冠军是一位成长于小镇的挪威人叫马格努斯・卡尔森。

2017年5月在中国乌镇柯洁对战AlphaGo

过去国际象棋大师通常在大城市的象棋俱乐部里对弈,那他是如何成为世界冠军的呢?他的方法是和国际象棋程序对弈。

这确实这让国际象棋变得 “大众化” 了。也就是说你不必身处纽约、莫斯科或北京这样的大城市,也能通过与程序对弈提升棋艺。

现在这种情况也会发生在孩子们身上,他们会和人工智能互动探索,无论他们身处世界的哪个角落,不管是在这里还是在非洲。

王坚:谢诺夫斯基讲的是国际象棋其实很有意思的。其实中国下围棋的人很多了,对很多小孩他一生是没有机会跟九段的棋手下棋的,但是有了围棋的这个程序以后,他就会有机会跟一个九段的棋手下棋。

所以这个其实帮助了人类很多东西,它的意义不是它比人下得好下得坏,而是它给所有的人创造出很多不同的机会,会让更多的小孩飞速进步。

三、送给年轻人:

深入思考,勇于相信不可能

王坚:我觉得我们还是需要深度的思考,今天我们所有的面临的技术好像让我们就不需要思考了,但事实上深度思考还是非常重要的。

我记得互联网刚出来的时候《大西洋月刊》曾经写过一篇文章,说互联网的出现会不会让人变得更加浅薄?

事实上我今天不好说有没有这个答案,但是我想这样的问题会一直伴随着我们技术的发展,所以我想我们还是应该更加深入地思考问题。更加有批判性。批判性思维是最重要。

特伦斯·谢诺夫斯基:建议相信自己的直觉, 当专家告诉你某件事不可能时,不要轻易相信。因为在20世纪80年代我们就处于这样的境地,当时也有人说我们正在尝试的事情是不可能实现的。

*文章为作者独立观点,不代表笔记侠立场。

相关内容

热门资讯

开特股份股价跌5.09%,博时... 11月21日,开特股份跌5.09%,截至发稿,报35.82元/股,成交8184.24万元,换手率2....
华工科技股价跌5.13%,天弘... 11月21日,华工科技跌5.13%,截至发稿,报67.67元/股,成交17.18亿元,换手率2.49...
南网科技股价跌5.02%,富国... 11月21日,南网科技跌5.02%,截至发稿,报43.12元/股,成交9011.95万元,换手率0....
迈为股份股价跌5.05%,汇添... 11月21日,迈为股份跌5.05%,截至发稿,报97.50元/股,成交3.18亿元,换手率1.66%...
迈为股份股价跌5.05%,易方... 11月21日,迈为股份跌5.05%,截至发稿,报97.50元/股,成交3.19亿元,换手率1.66%...