您的位置: 专家智库 > >

钱恒

作品数:1 被引量:3H指数:1
供职机构:扬州大学信息工程学院更多>>
发文基金:国家自然科学基金江苏省科技支撑计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据集
  • 1篇统计最优
  • 1篇维数
  • 1篇聚类
  • 1篇高维
  • 1篇高维数据
  • 1篇高维数据集

机构

  • 1篇江南大学
  • 1篇扬州大学

作者

  • 1篇钱雪忠
  • 1篇吴秦
  • 1篇钱恒
  • 1篇邓杰

传媒

  • 1篇计算机应用研...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
基于特征选择的统计最优样本大小算法被引量:3
2014年
针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不同且可能存在冗余属性,提出一种基于特征选择的统计最优样本大小算法。该算法基于熵理论,通过构造一个基于对象间相似度的熵度量方法来评估特征重要性,然后根据设计的一种挑选特征的标准获得重要的特征子集,最后在该特征子集上执行统计最优样本大小算法。实验结果表明,改进后算法得到的样本大小抽取的样本集能够在聚类算法中得到较高的准确率,同时也较明显地降低了算法的执行时间,从而验证了改进后的算法是有效可行的。
邓杰钱雪忠钱恒吴秦
关键词:高维数据集聚类
共1页<1>
聚类工具0