论文简介-1

栏目: 后端 · 发布时间: 6年前

内容简介:基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量来联系问句实例和领域知识,达到问题和答案的连接。

论文

一、 本体论在自动问答系统中的应用_骆正华

基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量

来联系问句实例和领域知识,达到问题和答案的连接。

论文简介-1

用户提交的问句

  1. 进行分词、 词性标注、 语块划分等浅层句法分析
  2. 在语块结构化的问句实例中找相似的问句

构造本体的目的都是为了实现某种程度的知识共享和重用。领域知识可划分为三个层次,通用概念知识->领域概念知识->具体事实知识。

  1. 领域具体事实知识的表示

    • 采用XML标记规范,主题、操作事件或业务实体、描述或属性。
  2. 问句语义的表示

    • 主题、疑问块、问句语义表示

问句向量本质上有三种情况

  1. 主题+实体+属性
  2. 主题+事件+角色
  3. 向量是一组无序的关键字

二、 一种基于加权语义相似度模型的自动问答系统_刘亚军

  1. 利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度
  2. 利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度。

关键词语(权重高的词语)

三、 自动问答系统中的问题理解研究_曹志娟

QA系统主要分为五个部分

问题理解、信息检索、信息处理、答案抽取、FAQ系统。

论文简介-1

主要是三个主要部分

  1. 问题理解
  2. 信息检索
  3. 答案抽取

讲述问题理解的两个关键点:问题分类和问句扩展。

  1. 问题分类

词法分析:问句分词和标注

问题分类:基于答案对象的类型分类,增加疑问词短语分类、问题标准型、特征词分类

1. 识别问句中的疑问词,根据疑问词找到句型模式集合
    - 人、地点、具体时间、持续事件、数量、原因、方法、其他
2. 与集合中的句型规则进行匹配,从而得到问题标准型
    - 通过形式语言制定具体规则
    - 通过概率分类的方法
3. 再根据特征词确定问题领域
    - 特征词的扩充
  1. 问句扩展

    1. 问句重写-更改为定制的模板
    2. 关键词扩展

      • 名词、动词的关键词

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

互联网创业核心技术:构建可伸缩的web应用

互联网创业核心技术:构建可伸缩的web应用

【美】Artur Ejsmont / 李智慧、何坤 / 电子工业出版社 / 2016-12 / 89

可伸缩架构技术是所有互联网技术中最重要,也是最引人入胜的技术。《互联网创业核心技术:构建可伸缩的web应用》针对互联网创业需求快速迭代,业务快速发展,短时间内用户、数据、访问量激增的特点,提纲挈领地描述了伸缩性架构的基本原理与设计原则,详细阐述了Web应用前端层、服务层、数据层的可伸缩架构,并花大量篇幅讲述了缓存技术和异步处理技术的可伸缩设计及其在Web系统中的具体应用。 《互联网创业核心技......一起来看看 《互联网创业核心技术:构建可伸缩的web应用》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

MD5 加密
MD5 加密

MD5 加密工具

html转js在线工具
html转js在线工具

html转js在线工具