您的位置: 专家智库 > >

罗景

作品数:6 被引量:15H指数:1
供职机构:武汉科技大学计算机科学与技术学院更多>>
发文基金:湖北省教育厅人文社会科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 6篇自动化与计算...

主题

  • 5篇信息检索
  • 2篇语义分析
  • 2篇潜在语义
  • 2篇潜在语义分析
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息检索
  • 2篇概率潜在语义...
  • 2篇查询
  • 2篇查询扩展
  • 2篇抽取
  • 1篇多粒度
  • 1篇信息检索方法
  • 1篇语义WEB
  • 1篇术语抽取
  • 1篇索引
  • 1篇索引技术
  • 1篇文本
  • 1篇文本检索
  • 1篇基于语义

机构

  • 6篇武汉科技大学
  • 2篇华中师范大学

作者

  • 6篇罗景
  • 5篇涂新辉
  • 1篇杨治

传媒

  • 3篇计算机与数字...
  • 2篇计算机应用
  • 1篇计算机工程

年份

  • 1篇2024
  • 1篇2023
  • 2篇2008
  • 2篇2007
6 条 记 录,以下是 1-6
排序方式:
基于概率潜在语义分析的中文信息检索被引量:13
2008年
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。
罗景涂新辉
关键词:概率潜在语义分析中文信息检索索引技术关键词抽取
面向稠密检索的伪相关反馈方法被引量:1
2023年
伪相关反馈(PRF)机制是一种自动化的查询扩展(QE)技术,它利用原始查询和初次检索中前N篇文档蕴含的信息构建更加准确的查询,从而进一步提高信息检索系统的性能。但是,现有的面向稠密检索的PRF方法由于对文本的截断处理容易造成语义信息的缺失,而且在检索阶段的空间复杂度较高。针对上述问题,提出了一种基于段落级粒度且适用于长文本稠密检索的PRF方法 Dense-PRF。首先,通过计算语义距离从初次检索的前N篇文档中获得相关段落的向量;其次,对相关段落向量进行平均池化以得到QE项向量;然后,按照权重结合原始查询向量和QE项向量构建新的查询向量;最后,根据新的查询向量得到最终检索结果。在Robust04和WT2G两个经典长文本测试集上将Dense-PRF与基线模型进行了对比实验,相较于模型RepBERT+BM25,Dense-PRF在前20篇文档的准确率和归一化折现累计效益(NDCG)指标上分别提升了1.66、1.32个百分点和2.30、1.91个百分点。实验结果表明Dense-PRF能有效缓解查询与文档词汇不匹配的问题,并提升检索精度。
胡文浩罗景涂新辉
关键词:查询扩展信息检索
概率潜在语义检索模型中中文索引技术的比较研究
2007年
概率潜在语义检索模型使用统计的方法建立“文档—潜在语义—词”之间概率分布关系并利用这种关系进行检索。本文比较了在概率潜在语义检索模型中不同中文索引技术对检索效果的影响,考察了基于分词、二元和关键词抽取三种不同的索引技术,并和向量空间模型作了对比分析。实验结果表明:在概率潜在语义检索模型中,词的正确切分能提高检索的平均精度。
罗景涂新辉
关键词:信息检索概率潜在语义分析
基于相关术语群的中文查询扩展被引量:1
2008年
查询词语和文档中词语的不匹配是影响文本信息检索效果的一个关键因素。查询扩展技术可以在一定程度上解决这种词的不匹配问题,然而,实验表明,通常简单的查询扩展并不能稳定地提高中文信息检索的检索精度。利用自动构建的相关术语群来进行查询扩展以提高中文检索的效果。在NTCIR中文信息检索测试集上进行的实验表明,相对于传统的查询扩展方法,在检索效果上取得了平均24.5%的提高。
涂新辉罗景
关键词:中文信息检索查询扩展术语抽取
基于多粒度语义融合的信息检索方法
2024年
信息检索(IR)是一种通过特定的技术和方法组织、处理信息,以满足用户的信息需求的过程。近年来,基于预训练模型的稠密检索方法取得了巨大的成功;然而,这些方法只利用了文本和词语的向量表征计算查询与文档相关度,忽略了它们短语层面间的语义信息。针对该问题,提出一种名为MSIR(Multi-Scale IR)的IR方法。所提方法通过融合查询与文档中多种不同粒度的语义信息提高IR性能。首先,构建查询和文档中词语、短语和文本这3个粒度的语义单元;其次,利用预训练模型对这3个语义单元分别进行编码获得它们的语义表征;最后,利用语义表征计算查询和文档相关度。在Corvid-19、TREC2019和Robust04这3个不同大小的经典数据集上进行了对比实验。与ColBERT(ranking model based on Contextualized late interaction over BERT(Bidirectional Encoder Representation from Transformers))相比,MSIR在Robust04数据集的P@10、P@20、NDCG@10和NDCG@20指标上均实现了约8%的提升,同时在Corvid-19和TREC2019数据集上也取得了一定的改进。实验结果表明,MSIR能够成功融合多种语义粒度,提升检索精度。
赵征宇罗景涂新辉
关键词:信息检索文本检索
基于语义的web服务发现方法的研究
2007年
提出了基于语义的Web服务发现方法,通过将OWL-S与UDDI相结合,将web服务本体映射到UDDI中的tModel以扩展web服务语义,增强了服务自动发现能力。并给出了此种方法的一个模型的具体设计。
杨治罗景
关键词:WEB服务语义WEB本体论
共1页<1>
聚类工具0