自然语言理解
自然语言处理—发展历程
《人工智能应用基础》
CONTENTS
内 容
01
自然语言处理发展历程
《人工智能应用基础》
什么是自然语言处理,自然语言处理的萌芽期、发展期、爆发期及发展现状。
《人工智能应用基础》
自然语言处理( Natural Language Processing,NLP)是研究人与计算机交互语言问题的一门学科。
其任务大致分为两类——自然语言理解和自然语言生成。
自然语言理解,即如何让机器理解人所说的话,此处的“话”是基于日常生活的语境、不需要发言者有知识储备。
自然语言生成,即如何让机器像人一样说话。
自然语言处理达到这样的目标:人能够畅通无阻地与机器进行交流并没有明显的不适感。
《Python核心技术》
《人工智能应用基础》
20世纪五六十年代,对于自然语言的处理所进行的中心工作出现了两种趋势,依据对自然语言处理的方法和侧重点的不同,大致可划分为两个派别:符号派和随机派。
1959年,布劳宁和布莱德索建立了一套用于文本识别的贝叶斯系统,力求达到对自然语言字符的最优识别与推算。
《人工智能应用基础》
1957年,美国学者英格维在《句法翻译的框架》中
自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个关键分支,专注于研究人类与计算机之间的语言交互问题。NLP的任务主要分为两大类:自然语言理解和自然语言生成。前者致力于让计算机理解人类日常生活中的语言表达,而后者则涉及让机器能够像人一样生成自然、流畅的语言。
20世纪50年代到60年代,NLP经历了萌芽期。初期的工作主要集中在语言翻译,如美国工程师韦弗提出的利用计算机进行语言翻译的概念,试图将语言翻译视为解密过程。在这个时期,自然语言处理的理论与方法分为符号派和随机派,分别关注规则驱动和概率模型。布劳宁和布莱德索的贝叶斯系统就是对自然语言字符识别的一种尝试。同时,英格维提出的计算机翻译三个阶段理论,为后续的NLP研究奠定了基础。
进入60年代,NLP进入了发展期。沃古瓦的翻译模型将翻译任务分解为词法、句法分析和转换等步骤,威尔克斯的“优选语义学”强调语义在翻译中的核心地位,而科尔默劳尔的Prolog系统和维诺格拉德的SHRDLU系统则在自然语言理解和知识推理上取得了重要进展。
然而,70年代到80年代,由于技术限制和理论不成熟,NLP经历了一个低潮期。计算机语料库的信息不足,加上自然语言处理的复杂性,导致这一领域的进步受限。
到了90年代,NLP迎来了繁荣期。随着大规模文本数据的处理成为可能,以及计算机技术的飞速发展,特别是机器学习和数据挖掘技术的进步,NLP开始进入一个新的纪元。这个时期的突出特点是大规模性和真实可用性,自然语言处理不仅能够处理大量文本,而且产出的内容更加丰富和实用。
进入21世纪,自然语言处理发展现状聚焦于四个主要方向:语言学方向,研究语言的内在规律;数据处理方向,利用大数据进行分析和建模;人工智能和认知科学方向,探索人脑如何理解和生成语言;以及语言工程方向,开发实际应用的NLP系统。
阿里巴巴2017年的研究成果展示了NLP在智能问答和文本分类中的应用水平,这表明NLP在实际应用场景中的智能化程度不断提高。
总结起来,自然语言处理的发展历程从早期的翻译尝试,到后来的理论构建和模型发展,再到如今的数据驱动和智能应用,反映了计算机科学与统计科学的深度结合,以及对人类语言理解的不断深入。未来,NLP将继续推动人机交互的革新,为人工智能带来更为广泛和深远的影响。
- 1
- 2
- 3
- 4
前往页