您的位置: 专家智库 > >

白淑霞

作品数:6 被引量:16H指数:3
供职机构:内蒙古大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 3篇自动化与计算...
  • 3篇文化科学
  • 1篇语言文字

主题

  • 2篇信息检索
  • 2篇图像
  • 1篇单词
  • 1篇信息检索系统
  • 1篇遗传算法
  • 1篇语言模型
  • 1篇随机场
  • 1篇图像表示
  • 1篇图像分割
  • 1篇图像恢复
  • 1篇图像恢复方法
  • 1篇主题模型
  • 1篇自动文摘
  • 1篇自动文摘方法
  • 1篇阈值
  • 1篇文摘
  • 1篇向量
  • 1篇小生境
  • 1篇马尔科夫
  • 1篇马尔科夫随机...

机构

  • 6篇内蒙古大学

作者

  • 6篇白淑霞
  • 5篇鲍玉来
  • 1篇许振亮
  • 1篇苏日娜
  • 1篇张晖
  • 1篇王炜华
  • 1篇李广华

传媒

  • 2篇现代情报
  • 1篇科技创业月刊
  • 1篇计算机应用与...
  • 1篇情报理论与实...
  • 1篇图书馆学研究

年份

  • 1篇2024
  • 5篇2017
6 条 记 录,以下是 1-6
排序方式:
基于词向量包的自动文摘方法被引量:5
2017年
[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。
白淑霞鲍玉来张晖
关键词:自动文摘
汉蒙跨语言检索系统设计与实现被引量:5
2017年
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集。[结果/结论]本系统响应速度较快,准确率较高,达到可用水平。一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用。
鲍玉来白淑霞飞龙王炜华
关键词:跨语言信息检索信息检索系统
蒙古文信息检索系统的设计与研究
2017年
文章结合蒙古文的独特性,研究蒙古文信息检索系统。首先搭建一个用于评价检索性能的蒙古文文档测试集,建立一套蒙古文信息检索系统。实验对比分析检索模型、平滑算法、蒙古文停用词表、词干还原和伪相关反馈等技术对蒙古文信息检索系统关键技术对检索性能的影响。实验结果表明,蒙古文信息检索系统选择结构化语言模型、Dirichlet平滑方法、停用词表、以词根做检索单元和伪相关反馈可以更好地提升检索性能。
鲍玉来白淑霞李广华
关键词:信息检索
一种基于马尔科夫随机场的蒙古文古籍图像恢复方法被引量:1
2017年
针对蒙古文古籍图像检索领域中对同一查询关键词,不同的二值化算法对整体检索性能影响问题,提出一种基于马尔科夫随机场的蒙古文古籍图像二值化方法,从而提高蒙古文古籍图像的检索性能。利用马尔科夫随机场模型在灰度图像和二值图像之间建模,通过训练码本估计隐藏层的先验概率,并分析灰度图像的直方图估计可观察层的概率密度。利用这两种先验知识实现图像二值化。实验数据集为100页蒙古文《甘珠尔经》,为了验证本文所提方法的性能,实验采用R-Precision作为评价指标。实验结果表明,基于马尔科夫随机场的二值化方法不仅可以有效修复受损图像,还可以进一步提高其检索性能。
白淑霞鲍玉来敖权
关键词:遗传算法小生境图像分割阈值
LDA单词图像表示的蒙古文古籍图像关键词检索方法被引量:5
2017年
[目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论 ]同时,该方法的性能比Bo VW方法有显著提高。
白淑霞鲍玉来
关键词:主题模型关键词检索
专利视角下蒙古文信息处理技术发展动态研究
2024年
以专利数据为基础,绘制蒙古文信息处理技术的发展图谱,分析该技术发展现状和趋势,为技术研发提供数据支撑。利用innojoy和incopat专利检索分析平台对中国蒙古文信息处理技术专利进行统计和对比分析。从不同维度,对蒙古文信息处理技术的专利数量、申请量、活跃度、区域分布、专利技术构成等方面进行了分析和讨论。经过几十年的技术储备、应用尝试等,蒙古文信息处理技术处于大幅增长的态势。在区域分布上,内蒙古具有天然的优势,其中内蒙古工业大学相对于其他创新主体表现突出。然而,有权专利数量和占比均表现不佳。蒙古文信息处理技术通常注重在研发阶段以合作开发的方式开展研究以及应用工作,而在专利权取得后,以转让方式进行专利价值释放或者落地实施的方式并不明显。苏依拉和仁庆道尔吉研发力优势突出,即专利申请总量以及活跃度均表现较好。从蒙古文信息处理专利技术构成看,自然语言处理技术专利最多,其次为信息检索技术,最后是识别模式的方法和装置。
白淑霞苏日娜许振亮王川
共1页<1>
聚类工具0