最近在一场主题为政府是否应该资助幼儿园的辩论吸引了全球科技界的目光。但这场辩论最吸引人的不是内容,而是一台名为IBM辩手(IBM Debater)的人工智能机器能否击败排名全球知名的人类辩论专家。
结果事实证明,答案是否定的。
2016年世界辩论赛的总冠军得主哈里什·纳塔拉扬(Harish 纳塔拉简)在数百名观众中更倾向于他的观点,而不是人工智能支持的IBM辩手。人类,至少是那些拥有牛津和剑桥大学学位的人,仍然可以在知识、说服和辩论的微妙之处占据上风。
1997年,IBM的“深蓝”电脑打败了世界上最好的人类棋手;2017年,谷歌的“阿尔法狗”(AlphaGo)击败了世界上最好的人类棋手。但IBM仍然表明,人工智能在存在歧义和争论的情况下是有用的,而不仅仅是用一个简单的分数来判断谁赢了比赛。
纳塔拉简在辩论结束后表示:“真正打动我的是IBM辩手与人类结合后的潜在价值。”他说,IBM的人工智能能够挖掘海量信息,并为这些知识提供有用的背景。
这是IBM辩手第二次在公共场合与人较量,尽管它已经在“蓝色巨人”的围墙后面参加了数十场辩论。在第一场IBM辩手比赛中,人工智能打败了一名人类辩手,却输掉了一场更激烈的竞争。然而,这一次,人类的对手更加强大——事实上,参与这项历时数年的项目的IBM研究人员预计,他们的人工智能将会失败。
电脑的辩论
IBM的辩手输了,但毫无疑问它也“赢”了:听它说话,你会评估它在说什么,而不仅仅是电脑在说什么。机器整理了它的论点,把它分解成几个点,并用各种研究的数据来支持它们。它并不完美,但却切中要害。
奇怪的是,对于人工智能来说,它告诉我们智人应该如何行为。
IBM的一名辩手说:“给不幸的人机会应该是每个人的道德义务。”
在这场辩论中,双方都有15分钟的准备时间,尽管只有IBM的辩手才有优势,能够从新闻文章和学术研究中引用价值100亿句的出版物。每一方轮流陈述自己的观点,反驳另一方,然后作结束语。
这场辩论是根据多少人改变了他们的想法来打分的。在辩论前,79%的人赞成学前教育补贴,但在辩论后,这一比例降至62%。
在苹果的Siri、亚马逊的Alexa和Google Assistant都在听我们的问题,用听起来像人的声音回答问题的时代,人们很容易忘记,我们能与电脑对话是多么了不起。IBM辩手则更进一步,讲了几分钟。
“她的魅力和人情味让人惊讶,”“智慧平方辩论”的主持人约翰。
不要期望在你的笔记本电脑上运行像Project Debater这样的东西。它主要运行在一个功能强大的服务器上,拥有28个处理器核和768GB的巨大内存——大约是高端笔记本电脑的50倍。它由四台服务器支持,每个服务器都有64GB的内存和塞满文本的2tb硬盘驱动器。
学前教育补贴
IBM公司的一名辩手支持我们应该资助幼儿园的观点,而纳塔拉简则持反方。
在辩手看来,幼儿园“对整个社会都有好处”。支持他们是我们的责任。”好的学前教育意味着孩子,尤其是贫穷的孩子,在生活中表现得更好。
纳塔拉简反驳说,学前教育补贴“不过是出于政治动机向中产阶级成员发放的帮助,而不是那些最弱势的人。”他还驳斥了辩论者的假设,例如,补贴将切实改善穷人的教育。
辩手在2018年的辩论中表现出了进步。它的一个新花招是能够提出一个类似的论点,在这种情况下,补贴医疗保健可能是有益的。另一个是提高了反驳技巧。纳塔拉简认为,一些孩子在三四岁时可能无法从学前教育这个竞争激烈的世界中受益,IBM抓住了这个观点,并提出了异议:“我的对手认为,学前教育是有害的,”IBM说。
“自6月份以来,我们一直在非常努力地改进系统,”IBM Research项目辩手、首席研究员诺姆·斯洛尼姆(Noam Slonim)说。辩手的原始资料,学术出版物和新闻文章也得到了扩充,增加了截至2018年底的一年的数据。
迄今为止最具挑战性的比赛
对IBM的人工智能来说,这是迄今为止最具挑战性的竞争。
IBM项目辩手经理Ranit Aharonov说,纳塔拉简“与我们目前面临的辩手相比处于不同的水平。”“他是大学辩论比赛历史上获得最多荣誉的辩手,并创造了获胜次数的世界纪录。”
在旧金山举行的IBM智库大会上,这是IBM辩手的最后一场大型辩论。Aharonov说:“辩手很好,这是展示的好机会,但我们应该把重点放在如何利用这项技术,使其在商业上可行。”
Aharonov说:"我们正处于最后敲定第一个工作用例的阶段。"她说,这可以是帮助一家公司了解员工或客户的观点,或者帮助新闻媒体或政府让人们参与到有争议问题的讨论中来。
这是因为《Project Debater》背后的技术是关于我们人类所生活的真实世界的混乱和细微差别,而不是游戏的黑白世界。
“我们正走出人工智能的舒适区,进入更加灰色的领域。”斯洛尼姆说。