最近我看了一位科普作家关于人工智能(AI)的几期视频,并查看了视频下的留言。发现该作家和许多观众都对目前的 AI 技术存在一些严重的误解。因此,我想写一篇科普文章,尽可能消除读者对 AI 的误解。
这篇文章专为 AI 领域之外的读者而写,我会尽量使用最简单的语言来解释和回答一些我认为最容易被大众所误解的问题,例如:
AI 的行为是否连其设计者都不能理解?
AI 是否能表现出超出设计行为?
AI 是否具有创造力?
AI 是否能产生自我意识?
AI 为什么最近才能力爆发?
AI 发展历史
首先,让我们简单回顾一下 AI 的历史。AI 的提出已经有八十年了。在过去的 80 年中,AI 曾几度引发热潮,人们都热衷于畅想 AI 的美好未来,也曾担心 AI 会取代人类。每一次热潮都没有持续太久,人们很快就会发现 AI 的局限性,AI 的话题也会再次淡出人们的视野。
虽然我对 AI 早有兴趣,但正式开始系统学习 AI 还是在 2012 年左右。当时,已经不再流行 AI 这个概念,取而代之的是“机器学习”(ML)。理论上来说,机器学习是人工智能的一种实现方法,实际上,我估计主要是因为当时 AI 正处于冷静期,不那么受追捧,而 ML 显得更为时尚、引人注目。
机器学习包含很多算法,例如朴素贝叶斯、决策树等等。你可能没有听说过这些算法,但你一定听说过神经网络。尽管现在神经网络占据了主导地位,但在我学习 AI 那会,它并没有受到多数专家的青睐。这主要是因为神经网络也是一种有些历史的算法了,但在最初几十年的发展历程中,并没有表现出特别优异的性能。在图像领域中,它无法与支持向量机相媲美;在自然语言处理领域中,它又不如隐马尔可夫模型。当时很多人认为神经网络可能没有什么前途了。
然而,神经网络最终还是崛起了。现在所有引人注目的 AI 项目都是基于神经网络的,因此有必要简要介绍一下神经网络的工作原理。在下文中提到 AI 时,默认指代的就是神经网络模型。
现在读者应该可以看出来了,所谓 AI 设计者不了解自己设计的 AI,纯粹是一种误解。其实,只要换位思考一下就知道这种误解的不合逻辑之处:读者自己是否理解 AI 的工作原理?如果理解不那么深刻,那么你能够设计出一个 AI 模型吗?如果你因为不完全了解 AI 而无法设计一个 AI 模型,又怎么能相信别人会在不了解 AI 的情况下就设计出了一个好用的 AI 模型呢?
上文用图片生成做过示例,再用文字生成为例讲解一下 AI 如何工作。大家可能觉得AI聊天写作文等功能挺神奇的,但实际上,文字的生成也可以被看作是一个函数:这个函数的输入是一些文字,输出是下一个要产生的字。
现在的大语言模型常常会使用网络上能够收集到的所有文章、对话作为训练集。这样,训练出的模型,就可以模仿网络上的文字。比如:把“我爱祖”三个子输入给训练好的 AI 模型,AI 模型由于在训练集中看到了大量“我爱祖国”这样的组合,于是就会输出一个“国”字。“我喜欢祖国”可能并不常见,但模型在训练集中会发现有大量的情况“喜欢”和“爱”这两个词是可以互换的。 所以,如果把“我喜欢祖”这四个字输入给模型,模型也会在这里输出一个“国”字。如果输入“小明:你喜欢祖冲之吗?AI:我喜欢祖”这几个字输入给模型,模型因为在大量的训练集中已经发现了,对话中的文字必须是上下文相关,所以会在这里输出一个“冲”字,再把“小明:你喜欢祖冲之吗?AI:我喜欢祖冲”几个字输入给模型,模型会再返回一个“之”字。
这要看你如何定义创造力了。一个 AI 在学习了猫头,狗身的照片之后,可以画出一张猫头狗身拼接在一起的照片。如果你觉得这算是创造力,那么AI确实具有了一定的创造力。
如果你觉得不算,只有 AI 画出了训练集中没有的东西才算创造,比如训练集中只有猫和狗,但模型却能画出一匹马。如果你这样定义创造力的话,那么 AI 没有创造力,AI 无法输出任何训练集中没有的东西,它最多只能把训练集中的内容进行整理拼接。
AI 能不能产生自我意识?
就目前AI的技术来说,AI 是绝不会产生自我意识的。目前训练 AI 的方法就是让 AI 去模拟训练集中的输入输出。我们可以脑洞一下,如果有一个 AI 模型突然就有自我意识了,训练程序让它画猫,它决定放飞自我,画了一只鸡。结果会怎样呢?结果是:因为它没有达到设计目标,这个模型被销毁了。
以目前的 AI 技术而言,AI 本质上与螺丝刀、扳手等工具没有什么区别,都是由人类设计和使用的工具:人类怎么操作它,它就怎么工作,除此之外无法做任何事情。任何人类不知道如何解决的问题,AI 也同样解决不了。比如,人类如果不知道如何证明黎曼猜想,AI 也无法自己证明。
总有人觉得 AI 参数这么多,结构这么复杂,说不定它自己突然灵光一现,就产生了自我意识呢?这个想法,就有点类似于,把组成生命的各种化学物质放到一个瓶子里,然后晃一晃瓶子,就指望里面的分子自己重新排列,构建一个生命体出来。我们有时候会有一些美好的愿望,希望自己并不了解的东西可以自发的产生魔法和奇迹。但是最终这些愿望基本都会落空。
为什么神经网络这么强大,却直到最近才功能爆发?
AI 最近爆火起来,是它在绘画,文字生成等领域都展现出了前所未有的好结果。那么为什么它之前没有,而现在突然就强大了呢?
AI 绘画的发展速度比我预想的还要快。几个月前,Stable Diffusion 发布的时候,它们训练了一个通用模型,什么类型的图片都能生成,但无论什么类型都是马马虎虎。比如,对于人像的生成,多数都很模糊,甚至走样,只能看个大概。但是这几个月来,针对各种特定目标的模型都被训练出来了。这里当然少不了专门生成帅哥美女的模型,此外还有针对卡通、国画、油画等等各类绘画风格训练的特化模型。除了模型,各种辅助工具也被开发出来了,比如有些工具可以让用户摆放几根线段,代表人体骨架的姿势,然后模型就可以按照这个姿势生成人像。这就实现了对构图的精细控制。精细控制,配合上某明星的订制模型,就可以生成这个明星的任意姿势的照片了。
AI 绘画工具的出现对于我的帮助还是非常大的:我经常希望在自己的文档中添加一些插图,但是却没有绘画的能力。现在可以让 AI 来帮我画了,就算没那么完美也不要紧,有就比没有强。
半年前,AI 绘画勉强可以达到实用水平的时候,从新闻和论坛里看到的绘画从业人员的普遍反应是抵制。随着 AI 能力的加强,从业人员更多的是表示担忧了。我作为非专业的人员,可能体会不到那种危机感,但我还是觉得画师们并不需要太过担心的。在专业领域,那些老板们,无论有什么样的工具,也不可能自己去动手操作的,还是需要有专业人员来操作,差别无非在于一笔一笔得画,还是一条指令一条指令得画。工具毕竟是工具,新的工具不会取代人,只是会改变人们生产的方式。
被改变的可能不止是生产方式,或许还会有审美标准。AI 不但可以生成以假乱真的真人照片,还可以生成并不真实存在,但却是人们心目中的完美人像。当下,对大众审美影响最大的是明星们。将来会有越来越多 AI 生成的虚拟明星们出现。真人明星们就算化妆、整容、开滤镜,也不至于和真人容貌差太多,虚拟明星们长啥样就很难预料了。
我的 Facebook 上经常会收到骗子的好友申请。由于工作相关,我还曾经仔细研究过几个骗子的页面。在社交媒体上有很多知名度极低的小网红们,经常性的发布自己的生活照片视频等。骗子们会把这些内容收集起来,发布在一个虚假的账号下面,把这个账号伪装成某个帅哥美女的账号,然后行骗。估计以后骗子们的手法也要升级了,不需要再去收罗真人的内容,用 AI 生成全套的内容就可以了。