您的位置: 专家智库 > >

白宇

作品数:20 被引量:46H指数:3
供职机构:沈阳航空工业学院更多>>
发文基金:辽宁省自然科学基金教育部科学技术研究重点项目辽宁省教育厅高等学校科学研究项目更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 11篇会议论文
  • 8篇期刊文章
  • 1篇学位论文

领域

  • 20篇自动化与计算...
  • 3篇语言文字

主题

  • 9篇相似度
  • 8篇中文
  • 5篇信息检索
  • 5篇计算方法
  • 5篇抽取
  • 5篇词语相似度
  • 4篇问答系统
  • 4篇抽取技术
  • 3篇多文档
  • 3篇信息处理
  • 3篇语言处理
  • 3篇语言学
  • 3篇语义
  • 3篇数理语言学
  • 3篇中文信息
  • 3篇中文信息处理
  • 3篇自然语言
  • 3篇自然语言处理
  • 3篇字处理
  • 3篇文档

机构

  • 20篇沈阳航空工业...
  • 1篇辽东学院

作者

  • 20篇白宇
  • 17篇蔡东风
  • 6篇季铎
  • 3篇李东园
  • 3篇杨洁
  • 3篇任晓娜
  • 3篇郭丽
  • 3篇叶娜
  • 3篇于水
  • 2篇尹宝生
  • 2篇张桂平
  • 2篇卢延科
  • 2篇董燕举
  • 2篇苗雪雷
  • 1篇赵环宇
  • 1篇刘纪元
  • 1篇郭家清
  • 1篇林晓庆
  • 1篇周俏丽
  • 1篇刘磊

传媒

  • 5篇沈阳航空工业...
  • 3篇中文信息学报
  • 3篇第四届全国学...
  • 2篇第五届全国信...
  • 1篇第五届全国信...

年份

  • 2篇2010
  • 7篇2009
  • 9篇2008
  • 2篇2007
20 条 记 录,以下是 1-10
排序方式:
基于伪LCS的中文专利句子相似度计算方法
针对专利文献专业术语相对较多、形式规范、语言严谨的特点,本文提出了一种基于伪LCS的句子相似度计算方法。该方法通过对传统的最长公共子串(LCS)算法进行改进,并加入了词汇语义信息、词类和术语相相似度等相关信息,使其具有模...
卢延科尹宝生张桂平苗雪雷白宇
文献传递
基于用户日志分析的查询扩展研究
查询扩展是信息检索中关键问题之一,查询扩展的有效性决定其检索性能。用户查询日志是大量用户长期查询行为的记录,通过挖掘用户查询与用户日志之间的联系,构建相关词表,从而实现查询扩展。本文提出了一种结合局部上下文分析与用户行为...
李东园白宇蔡东风
关键词:查询扩展用户日志用户行为分析
文献传递
统计与语义相融合的词语相似度计算
词语相似度计算是自然语言处理领域的基础和研究难点。本文利用知网的相关概念场,将词语的相关性引入到基于平均互信息的词语相似度计算中,并提出了统计和语义相结合的词语相似度计算方法,采用了国家公务员考试“词语替换”题型进行测试...
郭丽蔡东风季铎白宇
关键词:汉字处理词语相似度数理语言学
文献传递
问答系统中复杂类问题的分析方法研究被引量:1
2009年
基于自动构建的问句模板库,对中文复杂类问题进行问题分类和关键词抽取,并提出一种基于在线百科知识和搜索引擎的关键词扩展方法,从而提高了系统的整体表现。实验采用NTC IR-7 CCLQA的测试语料,表明该方法的问题分类准确率达88%。关键词的扩展使得系统F值提升了20%。
刘磊郭丽白宇蔡东风
面向中文问答的信息检索系统及评测被引量:3
2009年
为了解决中文问答系统中检索有效性的问题,提出并构建了一个面向中文问答的信息检索系统,在新进展的基础上,该系统通过利用问答系统中问题分类信息,对查询进行优化处理,从而改进问答系统中检索结果的质量,在独立的检索评测中正确率达到0.5013,在问答系统的整体评测中F3值达到0.2231,取得了较好的效果。
李东园白宇蔡东风
关键词:信息检索问答系统查询扩展
中文问答系统中多策略答案抽取技术的研究
信息检索是自然语言处理技术的一个重要的应用领域,自动问答作为一种高级检索形式正逐步成为该领域研究的热点之一。本文主要讨论了中文问答系统中答案抽取的实现策略。 本文首先进行了实现答案抽取策略的核心技术的研究和预备工作,包括...
白宇
关键词:问答系统答案抽取信息检索自然语言处理
文献传递
基于联合权重的多文档关键词抽取技术被引量:19
2008年
该文提出一种多文档关键词抽取方法,该方法提出ATF×PDF(Average Term Frequency×ProportionalDocument Frequency)来计算词语权重,并根据候选关键词之间的语义相似度,采用联合权重方法重新计算候选关键词的权重来抽取关键词。该方法综合考虑了词语的频率,词性以及词语之间的语义相似性等信息,实验表明,该方法能有效抽取多个文档的关键词,同基于关键词的聚类标记方法相比,其准确率提高3%,召回率提高7%,F-measure提高4.4%。
杨洁季铎蔡东风林晓庆白宇
关键词:计算机应用中文信息处理多文档语义相似度
一种基于语境的词语相似度计算方法
词语相似度计算是机器翻译、信息检索等自然语言处理领域的关键问题之一。传统的词语相似度计算方法,未能很好地考虑上下文信息对词语语义的约束,从而不能对语境变换带来的词语间相似度的差异进行有效的区分。本文引入模糊数学中隶属函数...
白宇于水叶娜蔡东风任晓娜
关键词:词语相似度隶属函数自然语言处理
文献传递
基于Web的中英术语翻译获取方法研究被引量:2
2010年
从Web双语资源中获取术语翻译具有很大应用价值。从实用化术语翻译角度出发,设计了一个基于Web的中英术语翻译系统。该系统使用Google搜索引擎,通过关键词扩展技术搜索词汇表类型网页,从其搜索结果摘要中抽取术语翻译。实验结果表明系统取得良好性能:TOP1的正确率达到90.9%,TOP3的正确率达到95.4%。
董燕举白宇蔡东风
关键词:WEB信息抽取术语翻译信息检索WEB挖掘
一种基于语境的词语相似度计算方法被引量:12
2010年
词语相似度计算是机器翻译、信息检索等自然语言处理领域的关键问题之一。传统的词语相似度计算方法,未能很好地考虑上下文信息对词语语义的约束,从而不能对语境变换带来的词语间相似度的差异进行有效的区分。该文引入模糊数学中隶属函数的概念计算词语上下文信息的模糊重要度,并结合基于《知网》的语义相似度计算方法,提出一种基于语境的词语相似度计算方法。实验表明,该算法可以根据语境有效地区分语义相近的词语。
蔡东风白宇于水叶娜任晓娜
关键词:计算机应用中文信息处理语境词语相似度隶属函数
共2页<12>
聚类工具0