您的位置: 专家智库 > >

云南省电子信息产业发展基金

作品数:14 被引量:252H指数:8
相关作者:樊孝忠余正涛郭剑毅许云张锋更多>>
相关机构:北京理工大学昆明理工大学更多>>
发文基金:国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 14篇中文期刊文章

领域

  • 13篇自动化与计算...
  • 1篇经济管理

主题

  • 5篇向量
  • 4篇问答系统
  • 4篇相似度
  • 3篇汉语问答系统
  • 2篇语义
  • 2篇知网
  • 2篇数据挖掘
  • 2篇自然语言
  • 2篇向量空间
  • 2篇向量空间模型
  • 2篇句法
  • 2篇空间向量
  • 2篇查询
  • 1篇多属性决策
  • 1篇信息服务
  • 1篇语言处理
  • 1篇语义分析
  • 1篇语义块
  • 1篇语义特征
  • 1篇语义相关

机构

  • 10篇北京理工大学
  • 8篇昆明理工大学

作者

  • 10篇樊孝忠
  • 9篇余正涛
  • 4篇郭剑毅
  • 2篇高盛祥
  • 2篇耿增民
  • 2篇宋丽哲
  • 2篇张锋
  • 2篇许云
  • 1篇林培光
  • 1篇宋丽荣
  • 1篇李斌
  • 1篇纪鹏程
  • 1篇康海燕
  • 1篇车文刚
  • 1篇黄月涓
  • 1篇刘耕砚
  • 1篇张世华
  • 1篇侯开虎
  • 1篇郑薇

传媒

  • 3篇计算机工程
  • 3篇北京理工大学...
  • 2篇昆明理工大学...
  • 1篇商业研究
  • 1篇计算机学报
  • 1篇华南理工大学...
  • 1篇计算机应用
  • 1篇计算机工程与...
  • 1篇计算机工程与...

年份

  • 1篇2008
  • 3篇2006
  • 6篇2005
  • 3篇2004
  • 1篇2003
14 条 记 录,以下是 1-10
排序方式:
基于特定问题类别的汉语问答系统查询扩展被引量:6
2005年
针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本中的词频及位置分布信息.实验结果说明在汉语问答系统答案文本检索中,按照问题类别关联词进行查询扩展比未进行查询扩展在性能上有很大的改进.
余正涛樊孝忠宋丽荣
关键词:汉语问答系统查询扩展
基于知网的语义相关度计算被引量:76
2005年
为解决句法分析中的结构性歧义,引入了语义相关度计算.基于语义相似度计算及知网的语义信息,提出了语义相关度计算方法;利用知网的义原纵向与横向关系及实例信息计算不同词性的相关度.在计算义原距离时,考虑了义原之间的解释关系,对义原的距离进行修正.根据相似度的对称性,计算实例的影响因素提高了相关度的准确率.实验结果表明,使用该计算方法得出的语义相关度结果更加合理.
许云樊孝忠张锋
关键词:语义相关度知网自然语言处理
基于潜在语义分析的汉语问答系统答案提取被引量:54
2006年
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果.
余正涛樊孝忠郭剑毅耿增民
关键词:问答系统相似度向量空间模型潜在语义分析
一种高效关联规则挖掘EARM算法的研究被引量:1
2003年
针对类Apriori关联规则挖掘算法的不足,将以往关联规则算法予改进,提出一个更有效率的关联规则挖掘算法EARM算法。通过试验评估,该文所提算法的挖掘效率比Apriori及其改良算法要快2到5倍。
郭剑毅张世华李斌车文刚
关键词:数据挖掘关联规则
基于最大熵模型的汉语问句语义组块分析被引量:8
2005年
问句分析是问答系统的关键,为降低问句完整语法分析的复杂度,该文应用浅层句法分析理论,采用问句语义组块方式来分析问句。以“知网”知识库为基础,提取和定义了表达汉语问句的6种语义块,定义了语义组块最大熵模型的特征表示,通过最大熵原理实现了语义组块特征抽取和特征选取学习算法,并以模型为基础实现了真实问句的语义块的标注,从而为在语义层面上理解汉语问句奠定了基础。实验结果说明最大熵模型应用于汉语问句语义组块分析具有较好的效果。
余正涛樊孝忠
关键词:最大熵模型问句分析句法分析组块分析语义块
基于本体的个性化领域信息服务被引量:23
2005年
以数字图书馆领域个性化服务为例,以空间向量模型表示用户兴趣和资源特征,并借助于构建的领域本体和“知网”知识词典对向量进行概念上的扩展,形成用户和资源特征概念空间向量,并通过向量相似度计算寻找最优的资源,从而为用户提供个性化信息服务。实验数据说明了基于概念的相似度计算比基于关键词的相似度计算具有更明显的优越性。
余正涛宋丽哲樊孝忠
关键词:个性化服务本体论空间向量相似度计算
基于MADM和ID3的高校教师科研业绩量化评估
2008年
高校科研数据库中已存贮了教师大量的科研成果数据,如何有效、快速地从海量数据中挖掘教师科研业绩,公平、合理地评价其科研能力,并做出相应的决策,已成为高校决策者十分关注的问题。在此,提出结合MADM(多属性决策)与数据挖掘的决策树ID3算法建立数据挖掘模型,以高校教师科研业绩为对象,科学地进行量化评估,从而为决策者的管理工作提供更加客观的信息。
黄月涓郭剑毅刘耕砚
关键词:多属性决策决策树数据挖掘模型
受限领域自然语言数据库查询接口研究被引量:9
2004年
数据库查询是通过SQL实现的 ,而作为非专业用户是很难掌握SQL ,为了实现自然语言数据库查询以改善人机交互的容易程度 ,必须实现将自然语言问句转换成数据库查询语言 (SQL)以实现数据库查询 .介绍了实现自然语言数据库查询接口总体结构 ,并以房产领域为例 ,详细介绍了自然语言问句分析、问句形式化分析、中介查询语言的生成及SQL的转换算法等实现过程 .实验测试证明
余正涛樊孝忠耿增民
关键词:自然语言查询数据库查询SQL
汉语问答系统答案提取方法研究被引量:13
2006年
答案提取是问答系统的关键部分,文章介绍了汉语问答系统的基本结构及其实现过程,以问题和答案中关键词的词频统计特性为基础,进一步考虑问题和句子中关键词位置分布信息,提出了一种结合向量空间模型(VSM)和关键词最小匹配距离的问题和句子相似度的计算方法。并以相似度为基础,结合问题类别,对汉语基于事实的简单陈述问题进行了答案句子提取实验,结果表明该方法有较好的效果。
余正涛樊孝忠宋丽哲高盛祥
关键词:问答系统相似度向量空间模型
基于支持向量机的汉语问句分类被引量:24
2005年
目前汉语问句分类一般都依据疑问词及其相关词的组合规则,但由于规则的提取很深地依赖于语言知识,而且很难穷举出所有的特征规则,因此会影响分类的效果.支持向量机(SVM)是建立在统计理论基础上的机器学习方法,对于小样本分类问题有很好的识别效果.文中分析和定义了汉语问句的类型,建立了以SVM为基础的问句分类模型,详细描述了问句分类特征的选取过程,并在句法特征的基础上引入语义特征进行汉语问句分类实验,分类准确率达88.7%,表明结合句法和语义特征以SVM进行汉语问句分类具有很好的效果.
余正涛樊孝忠郭剑毅
关键词:问答系统问句分类支持向量机句法特征语义特征
共2页<12>
聚类工具0