返回栏目
首页人工智能 • 正文

大脑里有4亿条新闻,能和人类自主讨论的最强的AI辩手来了

发布时间:  来源:河洛网

IBM最强的AI辩手Project Debater代表了目前计算讨论研究的顶点。 在充斥着大量信息和误解文化的今天,我们期待着完全自主讨论的AI系统能够促进智能争论的发展,确立更合理的论点,做出更明智的决定。

大脑里有4亿条新闻,能和人类自主讨论的最强的AI辩手来了

的研究可以追溯到古希腊,当时古希腊哲学家如苏格拉底等在市场上讨论政治、讨论真理,讨论的内容包罗万象。

苏格拉底之死

当前人工智能研究的一大挑战是“如何让机器理解自然语言争论中的论点”。

人工智能专家Noam Slonim

最近,IBM研究所研究员、希伯来大学人工智能专家Noam Slonim和团队通过扫描存储4亿条新闻文章和维基百科网页的归档,发表了自己整理开场白和反驳论点的研究Project Debater的进展。

虽然最终输给了人类辩手,但是这次AI辩手的表现,提供了未来人工智能对人类复杂论点的制定和理解有帮助的可能性。

自然语言处理( NLP )算法NLP是指计算机自动理解、解读、处理人类语言(例如语言、文本)。

NLP是人机交互的重要因素,IBM Project Debater团队积极开展NLP研究也是情理之中。

2018年,IBM研究所在美国旧金山的Watson West首次展示了人类与智能机器之间的公开现场辩论赛。 双方辩手分别是IBM花了6年多开发的,是第一个能够与人类进行复杂讨论的AI系统Project Debater (以下简称Debater )和以色列国际辩论协会主席Dan Zafrir。

这项研究强调了在技术发展过程中,在讨论中识别、生成和反驳论点的过程中,将不同组成部分结合起来的强大工程的重要性,并为每个组成部分处理特定的任务。

约10年前,分析人类的语言,引用证据决定支持结论的方法— — 这个过程现在被称为“论点分析”,这显然超出了最先进的人工智能的能力范围。

自此,由于人工智能技术的进步和论证技术工程的日益成熟,加上激烈的商业需求,该领域迅速扩大。 全世界有50多个实验室正在研究这个问题。 这包括大型软件公司的团队。

这一领域研究激增的原因是人工智能系统的直接应用能够识别大量文本中语言使用的统计规律,这一应用在人工智能的许多应用中起着变革性的作用,但在论点挖掘中尚未取得这样的进展。

因为论点结构太多样化了,太复杂了,太微妙了,太模糊了,很难被认为像句子结构一样。

为此,Slonim等人决定开始开发能够“完全”地与人类进行现场讨论的自主系统这一重大挑战。 项目调试器代表了这项工作的顶点。

Project Debater关键技术点的立场分类和情感分析自动讨论系统必须能够判断论点是否能够支持或反驳特定主题。

这对人类来说非常简单,但对机器来说非常困难。 因为有必要敏锐地识别自然语言丰富的微妙之处和微妙的差异。

众所周知,深神经网络( DNN )和弱监督DNN具有提高自动语言理解能力的巨大潜力,但训练DNN需要大量人工标志的高质量数据。

该小组开发了各种工具和方法,使用弱监督式培训DNN来缓解这一瓶颈。

他们利用DNN还开发了项目数据库的听说技能。

文本阅读( TTS )系统与个人助手和导航器不同,讨论系统必须能够在几分钟内雄辩地讨论预先未知的主题并与参与者进行对话。

科学研究小组开发了新的TTS算法和方法,以便向项目数据库提供明确、流利、有说服力的语言表达能力。

Project Debater难以实现人类辩手的一致性和顺畅性,在将论证技术的发展和论证作为局部现象处理的过程中,Project Debater是一个重要的步骤。

它的成功提供了新的观点,可以知道人工智能系统是如何利用由人类可以轻易提出的论点构成的网络进行工作的。

大多数人工智能研究都把目标定得很高,但是瓶颈是能否获得足够的数据,就是计算有效的解决方案来应对既定的课题。

项目调试器采用双管齐下的方法克服了这一障碍。 这将集中于100多个讨论的主题。 从大量的数据集里收集原始材料,

在2018年和2019年的一系列比赛中,Project Debater挑战了2016年获得以色列国家辩论冠军的以色列4名女子Noa Ovadia等才华横溢、备受瞩目的人类辩手,观众进行了非正式的评价。

该系统支撑着其讨论技术,支撑着处理好的数据集,制作4分钟的演讲,召开关于其全部技能中的某个主题的讨论,人类的对手与之对应。

然后,反驳对方的观点,进行第二次4分钟的演讲。 对方反驳了4分钟后回答,讨论结束后双方参加者作了2分钟的闭幕陈述。

Project Debater最薄弱的一点与难以模仿人类口才的一致性和流畅度以及其处理能力的最高水平相关,在这个水平上可以选择、抽象和组织论点。

但是,此限制不是项目调试器独有的。 尽管进行了两千年的研究,但关于“论证结构”却知之甚少。

根据论证研究的重点是否集中在语言使用、认识论、认知过程、逻辑有效性,人们对连贯的论证和推理模型提出的重要特征各不相同。

所有论证技术系统面临的最后挑战是将论证看作是受一系列孤立因素影响的局部论述的碎片还是将它们纳入更大社会范围的讨论中。 这不是设计解决方案,而是设计要解决的问题。

通过在论证中设定先验边界,可以实现理论上的简化,提供了主要的计算优势。 例如,识别“主要要求”就成了明确的任务,机器几乎可以像人一样可靠地完成这个任务。 问题是人类不擅长这个任务。 因为它是人工设计的。

在公开讨论中,一个给定的论述可能是一个语境下的主张,另一个语境下的前提。

另外,在现实世界中,讨论室外发生的语言并不离散,没有连接相互参照、类比、实例、摘要网络的明确边界。

关于人工智能如何处理这种论证网,相关理论正在讨论中,并利用软件实现。 例如,叫做DebateGraph的系统是一种互联网平台,它提供了用于可视化和共享复杂且相互关联的思想网络的计算工具。

但是,与这些实施相关的理论课题和社会技术问题很难:设计令人信服的方法吸引了很多参与者进入这个系统,和设计简单明了的机制一样,他们很难与这些复杂的讨论网络进行互动。

Project Debater是将论证技术的发展和论证作为局部现象处理的过程中的重要步骤。

它的成功提供了一个诱人的机会,让人们了解人工智能系统是如何与人类简单解释的论点网络一起运行的。

如今,假新闻充斥,舆论两极分化,松散推理无处不在,这些都掩盖了人类在创造、处理、导航、共享复杂论点上的迫切需求,但在这方面,人工智能也许可以提供支持。

因此,尽管Project Debater代表了人工智能的进步,解决了促进人类推理的巨大课题,但正如Slonim等人所说,Project Debater将拓展目前人工智能技术的舒适领域,以便将来能够参与更复杂的人类活动

【编辑推荐】

    相关文章Related

    返回栏目>>

    河洛网首页

    Copyright © 2019 河洛网 版权所有 dahuimr@163.com