自然语言处理--人工智能领域的关键研究课题
发布时间:2021-12-25 09:39 所属栏目:125 来源:互联网
导读:自然语言处理(英文Natural Language Processing,简称NLP)是人工智能(英文Artificial Intelligence,简称AI)领域的重要研究课题,被誉为人工智能技术的一个掌上明珠;它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及面极为广泛。
自然语言处理(英文Natural Language Processing,简称NLP)是人工智能(英文Artificial Intelligence,简称AI)领域的重要研究课题,被誉为人工智能技术的一个掌上明珠;它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及面极为广泛。国际知名学者周海中先生曾经指出:“自然语言处理是极有吸引力的研究领域,它具有重大的理论意义和实用价值。”目前,NLP已成为推动科技发展的强大动力,并成为世界各国综合国力竞争的焦点。 大约20世纪90年代开始,NLP领域发生了巨大的变化。这种变化有两个明显的特征:(1)对系统的输入,要求研制的NLP系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。只有这样,研制的系统才有真正的实用价值。(2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。同时,由于强调了“大规模”和“真实文本”,所以下面两方面的基础性工作也得到了重视和加强:(1)大规模真实语料库的研制。大规模的经过不同深度加工的真实文本的语料库,是研究自然语言统计性质的基础;如果没有这样的语料库,统计方法只能是无源之水。(2)大规模、信息丰富的词典的编制工作。因此规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对NLP的重要性是很明显的。 系统的输入与输出这两个特征在NLP的诸多领域都有所体现,其发展直接促进了计算机自动检索技术的出现和兴起。实际上,随着计算机技术的不断发展,以海量计算为基础的机器学习、数据挖掘、数据建模等技术的表现也愈发优异。NLP之所以能够度过“寒冬”,再次发展,也是因为计算机科学与统计科学的不断结合,才让人类甚至机器能够不断从大量数据中发现“特征”并加以学习。不过要实现对自然语言真正意义上的理解,仅仅从原始文本中进行学习是不够的,我们还需要新的方法和模型。 目前存在的问题主要有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分析歧义、词语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有的不同含义等问题,尚无明确规律可循,需要加强语义学和语用学的研究才能逐步解决。另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。因此一个书面理解系统只能建立在有限的词汇、句型和特定的主题范围内;计算机的贮存量和运转速度大大提高之后,才有可能适当扩大范围。 (编辑:ASP站长网) |
相关内容
网友评论
推荐文章
热点阅读