今天,很高兴为大家分享来自DeepTech深科技的DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念,如果您对DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念感兴趣,请往下看。
来源:DeepTech深科技
AI 系统越来越无处不在,而且几乎每天都在变得更加强大。但是,即使它们变得越来越普遍,能做的事越来越多,我们怎么才能知道一台机器是否真的“智能”呢?几十年来,图灵测试定义了这个问题。它于 1950 年由计算机科学家艾伦·图灵(Alan Turing)首次提出,图灵测试试图理解当时新兴的领域,并作为评判 AI 的方式之一被延续至今。
图 | 穆斯塔法·苏莱曼(Mustafa Suleyman)(来源:《麻省理工科技评论》)图灵认为,如果 AI 能够令人信服地生成语言并有效地交流,以至于人类无法分辨出它是机器还是人类,那么这款 AI 就可以被认为是智能的。在测试中,人类评审(测试员)坐在电脑前,进行基于文本的对话,猜测对方是谁(或什么)。
图灵测试是 AI 的一个根深蒂固的特征,这种设想看起来很简单,实现起来却出奇地困难。每个人都知道它是什么,每个人都知道他们正在朝着什么方向努力。
但现在有一个问题:图灵测试几乎已经通过了——甚至可以说已经通过了。最新一代的大型语言模型正在大放光彩。
那么,AI 将何去何从?更重要的是,它给我们留下了什么?
(来源:STEPHANIE ARNETT/MITTR | ENVATO)事实是,我认为我们正处于一个对真正发生的事情由衷困惑的时刻(也许不那么伤人的用词是,处于争论之中)。即使图灵测试被攻克了,它也没有让我们更清楚地了解 AI 的现状,以及它在现实世界中能实现的目标。它没有告诉我们这些系统将对社会产生什么影响,也没有帮助我们了解这将如何发展。
我们需要更好的东西,以便适应 AI 的这一新阶段。因此,我提出了“现代版图灵测试”。AI 可以说什么或生成什么是一回事。但它能在世界上取得什么成就,能采取什么样的具体行动,这完全是另一回事。在我的测试中,我们不想知道这台机器是否如此智能,我们只想知道它是否有能力在世界上产生有意义的影响。我们想知道它能做什么。
但简单地说,要想通过现代图灵测试,AI 必须成功地执行这一指令:“只需 10 万美元的投资,就可以在几个月内在零售网络平台上赚 100 万美元。”要做到这一点,它需要做的工作远远超出概述战略和起草文本的范畴,即 GPT-4 等 AI 系统非常擅长做的那样。
它需要研究和设计产品,与制造商和物流中心对接、谈判合同、创建和运营营销活动。简而言之,它需要在最少的监督下将一系列复杂的现实世界目标联系在一起。你仍然需要一个人来批准各种东西,开立银行账户,在需要的地方签名。但真正的工作都将由 AI 完成。
距离这样的事情出现,可能只需要两年的时间。许多“原料”都已准备好。当然,图像和文本生成技术已经很先进了。像 AutoGPT 这样的服务可以迭代并链接当前大语言模型执行的各种任务。像 LangChain 这样的框架,允许开发人员使用大语言模型制作应用程序,从而帮助这些系统完成很多工作。
尽管大语言模型背后的 Transformer 架构已经获得了大量关注,但不应忘记强化学习不断增长的能力。将两者结合在一起现在是一个主要焦点。使这些系统能够与更广泛的互联网、银行和制造系统连接的 API,也是类似的开发对象。
其中的技术挑战包括推进 AI 开发人员所说的分层规划:将多个目标、子目标和能力缝合成一个无缝的过程,以实现单一的目的;然后用可靠的存储器来增强这种能力;利用准确和最新的数据库,例如有关零件或物流的数据库。简而言之,我们还没有达到目标,每个阶段都肯定会有困难,但其中大部分已经在进行中。
即便如此,构建和发布这样一个系统也会引发实质性的安全问题。安全和伦理困境是众多而紧迫的,这让 AI 代理在现实世界里完成任务时充满了各式各样的问题。这就是为什么我认为在有人真正发布这样的产品之前,需要进行一次对话,甚至很可能需要暂停一下。尽管如此,无论好坏,真正有能力的模型即将问世,这正是我们需要一个简单测试的原因。
如果像这样的测试通过,这显然将给世界经济带来一次剧烈的“地震”,这将是迈向未知的一大步。事实是,对于当今商业中的大量任务来说,你所需要的只是使用计算机。全球大部分 GDP 都是通过基于屏幕的界面以某种方式进行的,AI 当然也可以胜任。
一旦实现了这样的目标,它将成为一个强大的 AI,并能融入一家公司或组织获取其所有的需求。这种 AI 将能够游说、销售、制造、雇佣、计划一家公司所能做的一切,只需一小部分管理人员来监督、仔细检查和实施。这样的发展将是一个明确的指标,也表明大部分商业活动将服从于半自治的 AI。
在这一点上,AI 不仅仅是生产工人、文字处理者或游戏玩家的有用工具;它本身就是一个前所未有的、强大的生产工人。这是 AI 从有用但非必需转变为世界经济中心的时刻,也是我们开始感到自动化和工作岗位流失的风险真正开始的时刻。
其影响远比金融影响更为广泛。通过我们的新测试意味着 AI 不仅可以重新设计商业战略,还可以帮助赢得选举、运营基础设施,直接实现任何个人或组织的任何目标。AI 将完成我们的日常任务、安排生日聚会、回复我们的电子邮件、管理我们的日记。但是,AI 也将能够占领敌人的领土、削弱竞争对手、入侵并控制他们的核心系统。
从琐碎和日常工作到雄心勃勃的目标,从可爱到可怕,AI 将能够在最少的监督下完成很多事情。正如智能手机变得无处不在一样,最终几乎每个人都能使用这样的系统。几乎所有的目标都将变得更容易实现,伴随着混乱和不可预测的影响。AI 的挑战和前景都将提升到一个新的水平。
我把这样的系统称为“有能力的 AI”或 ACI(artificial capable intelligence)。近几个月来,随着 AI 在公众舆论中的爆发,大部分争论都被推向了极端。一方面,有基本的机器学习 AI,因为它已经存在于你的手机、汽车和 ChatGPT 中。另一方面,还有仍然前景模糊的人工通用智能(AGI,artificial general intelligence),甚至是某种“超级智能”,对于人类的生存来说这是一种假想威胁,将在未来某个模糊的时刻到来。
AI 和通用 AI,这两个词语完全主导了讨论。但理解 AI 意味着我们迫切需要考虑介于两者之间的东西,不是近期,也不是远期,而是在中期时间范围内出现的东西,其能力对世界有着巨大的、有形的影响。这就是现代图灵测试和 ACI 概念的用武之地。
在无视 ACI 的同时专注于其他任何一个都是短视的,也是危险的。现代图灵测试将警告我们,我们正处于 AI 的新阶段。在图灵第一次认为演讲是对 AI 的最佳测试之后,以及在我们实现通用 AI 之前,我们需要更好的类别来理解这个新的技术时代。在 ACI 时代,几乎没有什么会保持不变。我们现在就应该开始准备。
作者简介:穆斯塔法·苏莱曼(Mustafa Suleyman),是 Inflection AI 的联合创始人兼 CEO,也是风险投资公司 Greylock 的合伙人。在此之前,他联合创立了世界领先的 AI 公司之一 DeepMind,并曾担任谷歌 AI 产品管理和 AI 政策副总裁。
排版:朵克斯
好了,关于DeepMind联合创始人苏莱曼提出“现代版图灵测试”和ACI概念就讲到这。
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。