国家高技术研究发展计划(2009AA01Z138)
- 作品数:6 被引量:33H指数:3
- 相关作者:唐杰杨文军宫继兵仲茜李涓子更多>>
- 相关机构:清华大学燕山大学中石油规划研究院更多>>
- 发文基金:国家高技术研究发展计划国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 流程可定制本体匹配框架:RiMOM2被引量:3
- 2011年
- 本体作为语义Web中的语义表示形式,是语义Web体系结构中的核心元素,是实现知识共享、协同工作的关键。然而现实世界中本体自身与生俱来的分布性和异构性,又极大地限制了数据的共享与集成。为了实现知识的共享、数据的集成,近年来针对本体匹配方法的研究得到了广泛的重视。随着本体匹配研究的深入,许多有效的本体匹配方法被提出。RiMOM2正是一种集成了多种有效本体匹配方法的多策略本体匹配框架。它尽可能地向初级用户隐藏不必要的阈值设定和参数设置,而向高级用户提供匹配流程的可定制功能,以期针对不同用户实现一种既能适用于普遍本体匹配任务,操作简易,又能达到具有针对性匹配效果的本体匹配工具。同时该框架具有匹配方法组件的易扩展性。
- 李虎张啸仲茜侯磊王志春
- 关键词:语义WEB本体本体匹配
- 基于数据场的大规模本体映射被引量:22
- 2010年
- 针对已有的本体映射方法在处理大规模本体映射任务时效率和有效性较低的问题,文中提出了一个基于数据场的本体映射算法.该算法首先使用高效的相似度算法,建立本体中元素对另一本体的初始相关度;然后,利用数据场势函数引入周围本体元素对当前元素的影响,修正初始相关度,并最终确定本体间的相关子本体;最后,利用针对性的方法对上述相关子本体进行更有效的映射.实验结果表明,该算法可以在提高映射结果质量的同时保证较高的映射效率.
- 仲茜李涓子唐杰周立柱
- 关键词:数据场势函数本体本体映射语义WEB
- 基于话题模型的学术社会网络建模及应用被引量:3
- 2011年
- 传统方法通常对异构数据进行独立建模,忽略了它们之间的依赖关系。针对这一问题,重点研究了如何对学术网络进行统一建模;如何利用学术网络中的网络信息提高建模效果。提出学术社会网络的统一建模模型——作者会议引用话题模型(Author-conference Citation Topic Model,简称ACCT模型),该模型通过话题分布统一描述了学术社会网络中的多种异构数据的特点,如论文、会议、作者和引用等,并描述了这些不同数据之间的依赖关系。其建模结果可直接用于学术信息检索和学术推荐。在ArnetMiner系统的数据集上对ACCT模型进行了实验验证,实验结果表明,ACCT模型在学术推荐上优于基线模型。
- 唐杰宫继兵刘柳杨文军
- 关键词:正则化
- 基于权威度的指导者挖掘与个性化推荐方法被引量:1
- 2011年
- 在学术搜索引擎Arnetminer提供的数据中,对师生关系进行了挖掘,并在此基础上,结合用户信息,进行个性化的指导者推荐。计算出指导者的权威度和申请者的申请成功率。针对这两方面的内容,分别基于排序支持向量机模型和概率模型设计了基于权威度的推荐模型和基于个性化的推荐模型。研究成果成功应用于Arnetminer系统中,并可实时收集用户反馈信息以提高师生关系挖掘的准确率和推荐模型质量。
- 王喆唐杰宫继兵杨文军
- 关键词:个性化推荐模型
- 异构网络学习排序模型及应用被引量:2
- 2011年
- 针对网络排序问题中的基础,研究了话题层次的随机游走问题,提出了3步的方法解决该任务。重点从文档集中发现话题,在计算文档话题层次的排序得分等方面给出了详细的模型定义、求解过程和理论依据。提出了一个通用的异构网络排序模型,该模型一方面为源域和目标域之间的关联进行建模,同时在2个域中学习排序模型,并通过高效EM式的算法求解。通过实验验证了所提出的2种方法的性能。提出了特定专家搜索应用的概念,利用异构网络排序算法给出了该问题的解决方案。
- 杨子唐杰李涓子
- 关键词:随机游走异构网络
- 通用抽取引擎框架:一种新的Web信息抽取方法的研究被引量:4
- 2011年
- 大规模的网络视频信息既为用户信息分享带来了方便,同时也为国家监管部门带来了新的挑战。考虑到效率问题,在线视频监管则主要考虑视频描述信息。主要研究了网络视频描述信息的抽取问题,提出了一种新的Web信息抽取方法:通用抽取引擎框架,其主要包括对视频描述信息抽取问题的形式化描述和用户感知的视频网站逻辑模型。该方法在国家某部委的视频监管项目中已得到应用,并取得了很好的效果。实验结果表明,该方法的扩展性、通用性和抽取准确率大大优于其他方法。
- 宫继兵唐杰杨文军
- 关键词:WEB信息抽取