您的位置: 专家智库
>
资助详情>
中央高校基本科研业务费专项资金(HITNSRIF2013064)
中央高校基本科研业务费专项资金(HITNSRIF2013064)
- 作品数:1 被引量:6H指数:1
- 相关作者:张岩杨龙王宏志更多>>
- 相关机构:哈尔滨工业大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于知识库的互联网商品信息分类与推荐系统
- 基于知识理解的数据挖掘技术在电子商务中可以应用到商品分类和推荐方面.为了弥补传统的基于关键词分类的不足,帮助消费者有效、准确、快速地查询所需信息,系统通过使用Probase概念、实体、属性知识分层模型,把检索出来的具有相...
- 周小田王宏志郭翔宇胡筱董志鑫李建中高宏
- 关键词:知识库
- 文献传递
- 劣质数据库上阈值相似连接结果大小估计被引量:6
- 2012年
- 劣质数据普遍存在于现代数据管理系统中,严重影响了数据的质量,从而降低了数据的实用性以及数据的价值,这为数据管理带来了新的挑战.当前,已经有不少管理劣质数据的数据模型被提出,实体关系数据模型是其中一种,其中每条元组表示一个现实世界中的实体.该模型允许劣质数据的存在,给出了衡量数据质量的方法,并且可根据用户对结果质量的需求给出达到一定质量的查询结果.鉴于该模型的特点,传统的查询代价估计方法不再适用,需要新的代价估计技术.文中研究如何估计连接操作结果的大小,提出了在应用局部敏感Hash算法对属性值聚类的基础上,再进行采样估计的方法,并且在聚类过程中考虑数据质量对查询结果的影响.与传统随机采样方法对比,实验结果表明文中估计方法有更好的准确性.
- 张岩杨龙王宏志
- 关键词:数据质量阈值
- 基于树结构索引的带权值字符串的Top-k查询算法
- 在一个字符串集合中,通过一些字符串的相似性函数寻找与查询字符串相似的字符串集合被称为字符串的近似查找.这种查找常应用于数据库、信息检索等各个领域.但是在某些特定的情况下,需要考虑字符串在查询中的重要性,即权值.针对这种同...
- 佟星王宏志李建中高宏
- 关键词:TOP-K
- 文献传递