何大庆
- 作品数:7 被引量:56H指数:4
- 供职机构:匹兹堡大学更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金美国国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 一种基于统计语义聚类的查询语言模型估计被引量:3
- 2011年
- 如何有效生成文档聚类并使用聚类信息提高检索效果是信息检索中的重要研究课题.如果假设文档中存在若干隐含的独立主题,那么文档可以看成是由这些隐含的独立主题混合噪声相互作用的结果.基于这个假设提出了一种基于独立分量分析的语义聚类技术,试图借助于独立分量分析的良好主题区分能力,将一组文档按照实际隐含的主题在语义空间上聚类.在语言模型的框架下,语义主题聚类将由用户初始查询按照一定的度量方式激活.利用激活语义聚类的信息估计一个反馈语义主题模型,并与初始查询模型一起形成新的查询模型.在5个TREC数据集上的实验结果表明:基于统计语义聚类估计的查询模型相比传统的查询模型以及其他基于聚类的语言模型在检索性能上有显著性提高.其主要原因是应用了和用户查询最相似的语义聚类信息来估计查询模型.
- 蒲强何大庆杨国纬
- 关键词:语义聚类独立分量分析查询模型语言模型
- 社会化问答研究综述被引量:18
- 2018年
- 【目的】了解社会化问答的发展态势和研究内容。【文献范围】在Google Scholar和CNKI中分别以检索词"Social Q&A"和"社会化问答"进行文献检索,再结合主题筛选,精读并使用追溯法获得社会化问答研究的代表性文献共77篇。【方法】对社会化问答的发展历程和早期研究内容进行介绍,对社会化问答近期的主要研究内容进行归类总结。【结果】目前社会化问答的相关研究主要从问题、答案、用户和平台4个方面展开。【局限】仅将发展历程和研究主题作为探讨核心,未对每个研究主题进行更加细致的探讨。【结论】基于现有的研究内容反映出的研究问题,分别从问题、答案、用户、平台、领域以及应用层面,提出对社会化问答未来研究的建议和展望。
- 李蕾何大庆章成志
- 关键词:社会化媒体
- 跨语言信息检索中的命名实体识别与翻译被引量:7
- 2012年
- 综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。
- 吴丹何大庆陆伟
- 关键词:跨语言信息检索翻译
- 专题:Web2.0上社会化标签的深度挖掘 序
- 2013年
- 信息组织是图书情报学科中的经典研究主题。近10年来,网络信息组织研究不断深入、应用不断扩展,取得了一系列的丰硕成果。随着Web2.0网站的不断普及,针对Web2.0上的用户生成内容的研究也引起了学术界的广泛重视。其中,作为用户生成内容特色之一的社会化标签,在博客、微博、图片、视频等不同类型的社会化媒体上被用户广泛使用,吸引了来自图书情报、计算机、物理学等不同学科研究人员的持续关注。
- 章成志何大庆
- 关键词:WEB2标签网络信息组织情报学科图书情报
- 数字图书馆用户的多语言信息需求调研被引量:10
- 2011年
- 数字图书馆中有大量各种语言的信息资源,是多语言信息获取的重要应用之地,但用户对其真正的获取需求却并未被明确阐述。通过调查问卷的方式,对数字图书馆用户进行调研,了解其在用户行为、多语言信息获取需求动机、多语言信息资源、多语言信息服务、多语言信息检索和多语言系统用户界面六大方面的详细需求。
- 吴丹古南辉何大庆
- 关键词:数字图书馆用户调查信息需求
- 多语言信息获取中用户相关反馈实验与评价被引量:1
- 2011年
- 要实现网络信息或数字图书馆信息的有效多语言获取,需充分考虑用户交互。通过用户实验,检验用户相关反馈机制在多语言信息获取中的作用,并分析用户行为特点。实验结果证明,查询扩展、翻译优化以及两者的结合均是有效的用户相关反馈方法。
- 何大庆吴丹
- 基于伪相关反馈的跨语言查询扩展被引量:19
- 2010年
- 相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法。最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越。此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响。
- 吴丹何大庆王惠临
- 关键词:跨语言信息检索查询扩展