“测试”DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念

2023-07-15 17:05:08来源：DeepTech深科技

今天，很高兴为大家分享来自DeepTech深科技的DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念，如果您对DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念感兴趣，请往下看。

来源：DeepTech深科技

AI 系统越来越无处不在，而且几乎每天都在变得更加强大。但是，即使它们变得越来越普遍，能做的事越来越多，我们怎么才能知道一台机器是否真的“智能”呢？几十年来，图灵测试定义了这个问题。它于 1950 年由计算机科学家艾伦·图灵（Alan Turing）首次提出，图灵测试试图理解当时新兴的领域，并作为评判 AI 的方式之一被延续至今。

图 | 穆斯塔法·苏莱曼（Mustafa Suleyman）（来源：《麻省理工科技评论》）

图灵认为，如果 AI 能够令人信服地生成语言并有效地交流，以至于人类无法分辨出它是机器还是人类，那么这款 AI 就可以被认为是智能的。在测试中，人类评审（测试员）坐在电脑前，进行基于文本的对话，猜测对方是谁（或什么）。

图灵测试是 AI 的一个根深蒂固的特征，这种设想看起来很简单，实现起来却出奇地困难。每个人都知道它是什么，每个人都知道他们正在朝着什么方向努力。

但现在有一个问题：图灵测试几乎已经通过了——甚至可以说已经通过了。最新一代的大型语言模型正在大放光彩。

那么，AI 将何去何从？更重要的是，它给我们留下了什么？

（来源：STEPHANIE ARNETT/MITTR | ENVATO）

事实是，我认为我们正处于一个对真正发生的事情由衷困惑的时刻（也许不那么伤人的用词是，处于争论之中）。即使图灵测试被攻克了，它也没有让我们更清楚地了解 AI 的现状，以及它在现实世界中能实现的目标。它没有告诉我们这些系统将对社会产生什么影响，也没有帮助我们了解这将如何发展。

我们需要更好的东西，以便适应 AI 的这一新阶段。因此，我提出了“现代版图灵测试”。AI 可以说什么或生成什么是一回事。但它能在世界上取得什么成就，能采取什么样的具体行动，这完全是另一回事。在我的测试中，我们不想知道这台机器是否如此智能，我们只想知道它是否有能力在世界上产生有意义的影响。我们想知道它能做什么。

但简单地说，要想通过现代图灵测试，AI 必须成功地执行这一指令：“只需 10 万美元的投资，就可以在几个月内在零售网络平台上赚 100 万美元。”要做到这一点，它需要做的工作远远超出概述战略和起草文本的范畴，即 GPT-4 等 AI 系统非常擅长做的那样。

它需要研究和设计产品，与制造商和物流中心对接、谈判合同、创建和运营营销活动。简而言之，它需要在最少的监督下将一系列复杂的现实世界目标联系在一起。你仍然需要一个人来批准各种东西，开立银行账户，在需要的地方签名。但真正的工作都将由 AI 完成。

距离这样的事情出现，可能只需要两年的时间。许多“原料”都已准备好。当然，图像和文本生成技术已经很先进了。像 AutoGPT 这样的服务可以迭代并链接当前大语言模型执行的各种任务。像 LangChain 这样的框架，允许开发人员使用大语言模型制作应用程序，从而帮助这些系统完成很多工作。

尽管大语言模型背后的 Transformer 架构已经获得了大量关注，但不应忘记强化学习不断增长的能力。将两者结合在一起现在是一个主要焦点。使这些系统能够与更广泛的互联网、银行和制造系统连接的 API，也是类似的开发对象。

其中的技术挑战包括推进 AI 开发人员所说的分层规划：将多个目标、子目标和能力缝合成一个无缝的过程，以实现单一的目的；然后用可靠的存储器来增强这种能力；利用准确和最新的数据库，例如有关零件或物流的数据库。简而言之，我们还没有达到目标，每个阶段都肯定会有困难，但其中大部分已经在进行中。

即便如此，构建和发布这样一个系统也会引发实质性的安全问题。安全和伦理困境是众多而紧迫的，这让 AI 代理在现实世界里完成任务时充满了各式各样的问题。这就是为什么我认为在有人真正发布这样的产品之前，需要进行一次对话，甚至很可能需要暂停一下。尽管如此，无论好坏，真正有能力的模型即将问世，这正是我们需要一个简单测试的原因。

如果像这样的测试通过，这显然将给世界经济带来一次剧烈的“地震”，这将是迈向未知的一大步。事实是，对于当今商业中的大量任务来说，你所需要的只是使用计算机。全球大部分 GDP 都是通过基于屏幕的界面以某种方式进行的，AI 当然也可以胜任。

一旦实现了这样的目标，它将成为一个强大的 AI，并能融入一家公司或组织获取其所有的需求。这种 AI 将能够游说、销售、制造、雇佣、计划一家公司所能做的一切，只需一小部分管理人员来监督、仔细检查和实施。这样的发展将是一个明确的指标，也表明大部分商业活动将服从于半自治的 AI。

在这一点上，AI 不仅仅是生产工人、文字处理者或游戏玩家的有用工具；它本身就是一个前所未有的、强大的生产工人。这是 AI 从有用但非必需转变为世界经济中心的时刻，也是我们开始感到自动化和工作岗位流失的风险真正开始的时刻。

其影响远比金融影响更为广泛。通过我们的新测试意味着 AI 不仅可以重新设计商业战略，还可以帮助赢得选举、运营基础设施，直接实现任何个人或组织的任何目标。AI 将完成我们的日常任务、安排生日聚会、回复我们的电子邮件、管理我们的日记。但是，AI 也将能够占领敌人的领土、削弱竞争对手、入侵并控制他们的核心系统。

从琐碎和日常工作到雄心勃勃的目标，从可爱到可怕，AI 将能够在最少的监督下完成很多事情。正如智能手机变得无处不在一样，最终几乎每个人都能使用这样的系统。几乎所有的目标都将变得更容易实现，伴随着混乱和不可预测的影响。AI 的挑战和前景都将提升到一个新的水平。

我把这样的系统称为“有能力的 AI”或 ACI（artificial capable intelligence）。近几个月来，随着 AI 在公众舆论中的爆发，大部分争论都被推向了极端。一方面，有基本的机器学习 AI，因为它已经存在于你的手机、汽车和 ChatGPT 中。另一方面，还有仍然前景模糊的人工通用智能（AGI，artificial general intelligence），甚至是某种“超级智能”，对于人类的生存来说这是一种假想威胁，将在未来某个模糊的时刻到来。

AI 和通用 AI，这两个词语完全主导了讨论。但理解 AI 意味着我们迫切需要考虑介于两者之间的东西，不是近期，也不是远期，而是在中期时间范围内出现的东西，其能力对世界有着巨大的、有形的影响。这就是现代图灵测试和 ACI 概念的用武之地。

在无视 ACI 的同时专注于其他任何一个都是短视的，也是危险的。现代图灵测试将警告我们，我们正处于 AI 的新阶段。在图灵第一次认为演讲是对 AI 的最佳测试之后，以及在我们实现通用 AI 之前，我们需要更好的类别来理解这个新的技术时代。在 ACI 时代，几乎没有什么会保持不变。我们现在就应该开始准备。

作者简介：穆斯塔法·苏莱曼（Mustafa Suleyman），是 Inflection AI 的联合创始人兼 CEO，也是风险投资公司 Greylock 的合伙人。在此之前，他联合创立了世界领先的 AI 公司之一 DeepMind，并曾担任谷歌 AI 产品管理和 AI 政策副总裁。

排版：朵克斯

好了，关于DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念就讲到这。

返回科技金融网首页 >>

版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“科技金融网”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场，如有侵权，请联系我们删除。