您的位置: 专家智库 > >

张平

作品数:2 被引量:4H指数:1
供职机构:桂林电子科技大学电子工程与自动化学院更多>>
发文基金:国家自然科学基金广西壮族自治区自然科学基金广西省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇重复记录检测
  • 2篇相似重复记录
  • 2篇相似重复记录...
  • 1篇数据清洗
  • 1篇海量
  • 1篇海量数据
  • 1篇DBSCAN...

机构

  • 2篇桂林电子科技...

作者

  • 2篇张平
  • 1篇陈皓
  • 1篇党选举
  • 1篇杨文雷

传媒

  • 1篇传感器与微系...

年份

  • 2篇2011
2 条 记 录,以下是 1-2
排序方式:
海量数据相似重复记录检测的研究
随着数据库技术的快速发展和广泛应用,各行各业积累的数据量越来越大。在建立数据仓库的过程中,需要从各种异构的数据源导入大量的数据。这些数据来源于不同的渠道导致相似重复记录增多,严重影响了数据利用率和决策质量。因此,相似重复...
张平
关键词:数据清洗相似重复记录DBSCAN算法
文献传递
基于熵特征优选分组聚类的相似重复记录检测被引量:4
2011年
针对目前相似重复记录检测方法不能有效处理大数据量的问题,提出一种基于熵的特征优选分组聚类的算法。该方法通过构造一个基于对象间相似度的熵度量,对原始数据集中各属性进行重要性评估,筛选出关键属性集,并依据关键属性将数据划分为不相交的小数据集,在各小数据集中用DBSCAN聚类算法进行相似重复记录的检测。理论分析和实验结果表明:该方法识别精度和检测效率较高。
张平党选举陈皓杨文雷
关键词:相似重复记录
共1页<1>
聚类工具0