自然语言处理(NLP)是人工智能领域,使计算机能够分析和理解人类语言。 它被设计来构建可以生成和理解自然语言的软件,从而使用户可以与他或她的计算机进行自然对话,而无需通过编程或诸如Java或C的人工语言。
分解自然语言处理(NLP)
自然语言处理(NLP)是技术部门一项更大使命的第一步–即使用人工智能(AI)来简化世界的工作方式。 随着越来越精通技术的人们找到了彼此之间以及与公司在线互动的新方式,事实证明,数字世界已成为许多公司的游戏规则改变者。 社交媒体重新定义了社区的含义; 加密货币改变了数字支付规范; 电子商务创造了便利一词的新含义,而云存储又为大众带来了另一层次的数据保留。
通过AI,机器学习和深度学习等领域为世界带来了无限可能。 在数据分析中越来越多地使用机器学习来理解大数据。 它还用于对聊天机器人进行编程,以模拟与客户的人类对话。 但是,如果没有对自然语言处理(NLP)的即兴创作,则机器学习的这些前瞻性应用将是不可能的。
NLP实际上如何工作?
NLP将AI与计算语言学和计算机科学相结合,以处理人类或自然语言和语音。 该过程可以分为三个部分。 NLP的首要任务是了解计算机接收的自然语言。 该计算机使用内置的统计模型来执行语音识别例程,该例程会将自然语言转换为编程语言。 它通过将最近听到的语音分解成很小的单位,然后将这些单位与上一个语音中的以前的单位进行比较来实现。 文本格式的输出或结果在统计上确定了最有可能说出的单词和句子。 第一项任务称为语音转文字过程。
下一个任务称为词性(POS)标记或单词类别消歧。 该过程使用一组编码到计算机中的词典规则,将语法形式的单词基本识别为名词,动词,形容词,过去时等。 经过这两个过程之后,计算机现在可能已经理解了语音的含义。
NLP采取的第三步是文本到语音的转换。 在此阶段,计算机编程语言将转换为用户可听或文本的格式。 例如,一个金融新闻聊天机器人会被问到“今天的Google情况如何?”之类的问题,很可能会扫描在线金融网站上的Google股票,并可能决定只选择价格和交易量之类的信息作为答复。
NLP试图通过让人们相信自己正在与另一个人交互来使计算机变得智能。 艾伦·图灵(Alan Turing)在1950年提出的图灵测试指出,如果计算机能够像人一样思考和进行对话,而人却不知道自己正在与机器进行对话,则该计算机可以是完全智能的。 到目前为止,只有一台计算机通过了测试-聊天机器人与一个13岁男孩的角色。 这并不是说不可能构建智能机器,而是它概述了使计算机像人一样思考或交谈所固有的困难。 由于可以在不同的上下文中使用单词,并且机器没有人类在传达和描述单词中所具有的现实生活中的经验,因此可能需要一些时间才能完全摆脱计算机编程语言。