首页 >> 中彩新闻 >> 游戏fan这个假平台·如何让机器听懂人话? 这是人工智能的核心难题

游戏fan这个假平台·如何让机器听懂人话? 这是人工智能的核心难题

发布时间:[ 2020-01-11 15:13:26]
[摘要] 究其原因,主要是三个方面的积累和突破、从量变到质变,形成了第三次人工智能的浪潮。人工智能的核心难题:理解和运用自然语言作为人工智能的基础研究领域之一的自然语言处理方向,其关键目标是让计算机理解和运用语言,这个领域是人工智能的核心难题之一。如果将人工智能分为计算智能、感知智能和认知智能等三个阶段的话,自然语言处理是典型的认知智能任务,也被视为完备的人工智能问题。如何让机器听懂人话?

游戏fan这个假平台·如何让机器听懂人话? 这是人工智能的核心难题

游戏fan这个假平台,出品| 科技《科学大家》

撰文| 赵东岩 北京大学计算机科学技术研究所研究员,长期从事计算机自然语言处理方向研究

引言:人工智能作为当下最火的产业,所蕴藏的价值也给未来留下了无尽的遐想。可是纵观行业发展的几十年中,机器对自然语言的理解一直是横亘在发展之路上的大山。

那些让机器崩溃的语言

“夏天能穿多少穿多少”与“冬天能穿多少穿多少”、“我们把香蕉给猴子,因为它们饿了”与“我们把香蕉给猴子,因为它们熟透了”。在句子结构相同、词语相似度很高的情况下,如何让机器理解不同语义的自然语言?

作为中国顶级计算机科研单位之一,北京大学计算机科学技术研究所长期对计算机自然语言处理进行研究,现如今在自然语言方面提出了创新性方法并取得了阶段性进展,借此机会与读者共飨。

人工智能为什么这么火?

近两年人工智能成为学术界与工业界研发投入的热点领域。究其原因,主要是三个方面的积累和突破、从量变到质变,形成了第三次人工智能的浪潮。

首先,随着IT应用的普及、互联网和移动计算的快速发展,形成了大规模的数字化信息,包括结构化、半结构化和非结构化数据,这些数据包含了大量有分析决策价值的信息,不但使全新的人工智能应用成为可能,也为人工智能算法的学习和训练提供了必要的数据基础。

其次,以机器学习和深度学习为代表的人工智能算法在图像分析、语音识别和智能博弈等人工智能经典问题上取得了突破性进展,带动了机器学习方法在人工智能领域的全面应用,基于大规模样本数据学习的人工智能计算框架趋于成熟,适用领域不断扩展。

第三,大规模数据处理和高性能分布式计算架构在基础研究机构和工业界的共同推动下取得了令人瞩目的技术创新成果,计算机软件架构与硬件平台的协调发展与创新融合为上述人工智能计算框架提供了必要的IT基础架构,使人工智能技术和应用成为可能。

人工智能的核心难题:理解和运用自然语言

作为人工智能的基础研究领域之一的自然语言处理(NLP-Natural Language Processing)方向,其关键目标是让计算机理解和运用语言,这个领域是人工智能的核心难题之一。

如果将人工智能分为计算智能、感知智能和认知智能等三个阶段的话,自然语言处理是典型的认知智能任务,也被视为完备的人工智能问题(AI-Complete)。基于大规模文本数据、结合多种机器学习方法在机器翻译、聊天机器人、问答系统等应用领域取得了显著的进展。

然而,仅仅依靠大规模样本数据的机器学习框架,处理经典的自然语言任务也存在明显的不足,这主要是因为现有框架在完成语言理解任务时并不完善。

例如,自然语言的语义具有较强的结构性和逻辑性,现有的机器学习包括深度学习模型在内,尚不能很好地兼容结构化知识和逻辑进行学习和进化;同时,机器学习机制目前主要局限于以下几种模式:Case-by-Case的学习模式、基于数学特征或神经网络来表达从样本特征习得的“知识”,其可解释性和可扩展性不强,从而限制了这些学习模式的自由运用;此外,语言现象灵活多样,在对应的自然语言处理任务上缺乏大规模文本的支持,限制了经典机器学习模型的效能;另外,试图解决类似问题的小样本机器学习模型尚未具备令人信服的结果。

我们再看看具体例子:“夏天能穿多少穿多少”与“冬天能穿多少穿多少”、“我们把香蕉给猴子,因为它们饿了”与“我们把香蕉给猴子,因为它们熟透了”。这两对句子,在句子结构相同、词语相似度很高的情况下,因为天气与穿衣常识知识和猴子/香蕉属性不同,“穿多少”和“它们”分别具有了不同的语义。类似的语言理解问题在自然语言处理任务中有很多,这对应用现有机器学习框架形成了挑战。

如何让机器听懂人话?

那么如何让机器理解自然语言?现有技术框架能否更好地帮助机器实现自然语言理解任务呢?如果分析人类理解语言的过程,我们可以知道:人并不仅仅依靠例子来学习和理解语言,还会积累和运用知识,并结合逻辑思维进行综合分析与判断,进而理解语言。因此,语言理解任务的计算框架应该更加丰富且系统化;机器学习方法可以用于该框架的细节任务但整体计算框架应独立于单个机器学习任务模型。

由于理解语言的过程包括了认知和推理,这个框架不仅包括对各个粒度语言(词语、短句和篇章)的形式化分析,也具备兼容获取和运用知识与常识信息的能力,此外还需要推理能力。为了让计算机生成和运用知识,需要形式化的语义知识表示方法;由于语义的模糊性与不确定性,框架需要兼容确定性和不确定性推理机制。

以地理考试问题为例,对文本试题的理解首先需要基于词语、句子的基础语义计算,其次,结合地理学科相关的领域知识库(以RDF三元组组成的知识图谱)抽取和链接试题里的特定概念及其属性和关联关系(Knowledge-Base Grounding),这个读题过程可以对应为语言认知;接下来,将基于知识库理解的问题表示为SPARQL语言(一种标准的形式化语义搜索语言),实现语义的形式化表示,再将语义搜索的结果与问题的候选答案(多项选择题)进行对比,使用专用答题器进行推理并给出答案,从而实现推理和求解。

例如,已知“四川的国民生产总值远高于滇、贵、渝和藏”如何求解推理 “四川是西南地区最富庶的省份”是否正确呢?首先,我们结合知识库理解已知条件和题干,可以得知滇、贵、渝、藏分别是云南、贵州、重庆和西藏,通过语义分分析得到GDP(四川)大于GDP(云南)等条件;且西南地区包括四川、云南、贵州、重庆和西藏五个省市区。根据题干的提示,经过简单推理可知:“四川是西南地区GDP最高的省份”。但是GDP高的地区是否富庶并没有必然的确定答案。基于互联网大规模文本构建的词向量可以告诉我们词汇语义的相似度,GDP与富庶的语义相似度是0.7;基于这样的模糊值,系统可知“四川是西南地区最富庶的省份”在大概率上是对的,因此,系统推断出这个命题是正确的。

目前,这个系统框架可以获得60%的解题正确率,而这样的研究也仅仅是个开始。相比人类,这样的结果刚刚及格,尚不理想。语义理解多采用一次性、端到端的模型,尚无通过多次迭代完成 “夏天能穿多少穿多少”语义理解的计算模型。但是,如果有更加完善的领域知识库,随着深度文本语义分析及渐进式知识理解的性能提升,问题理解及解题正确性有望提升至80%。

未来,如果采用合理的自然语言认知与理解的整体框架,借助于机器学习和深度学习方法提升框架中的简单自然语言处理任务,结合完善的知识库及其推理求解方法,语言理解和认知任务有望取得突破。计算机将能够在专业知识和社会服务领域与人自由对话,提供人们所需要的知识和信息。比如,机器人可以同时拥有医疗领域和法律领域的知识,通过人机对话提供健康咨询和法律业务服务。在计算机听懂人类语言的时候,PC、手机等智能终端的主要交互接口将从键盘、鼠标及触摸屏演进为语言对话,让我们共同期待这一天早日到来。

推荐

《科学大家》栏目精彩文章汇总

《科学大家》专栏投稿邮箱:sciencetougao@sina.com  来稿请注明姓名、单位、职务

老挝磨丁黄金赌场

© Copyright 2018-2019 susiprinz.com 澳门威尼斯人线上娱乐 Inc. All Rights Reserved.