您的位置: 专家智库 > >

陈俞

作品数:2 被引量:7H指数:2
供职机构:中国人民大学信息学院数据工程与知识工程实验室更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇模糊粗糙集
  • 2篇粗糙集
  • 1篇属性约简
  • 1篇算子
  • 1篇近似算子

机构

  • 2篇中国人民大学

作者

  • 2篇赵素云
  • 2篇李翠平
  • 2篇陈红
  • 2篇陈俞
  • 1篇孙辉

传媒

  • 2篇软件学报

年份

  • 1篇2017
  • 1篇2016
2 条 记 录,以下是 1-2
排序方式:
基于随机抽样的模糊粗糙约简被引量:5
2017年
传统的属性约简由于其时间复杂度和空间复杂度过高,几乎无法应用到大规模的数据集中.将随机抽样引入传统的模糊粗糙集中,使得属性约简的效率大幅度提升.首先,在统计下近似的基础上提出一种统计属性约简的定义.这里的约简不是原有意义上的约简,而是保持基于统计下近似定义的统计辨识度不变的属性子集.然后,采用抽样的方法计算统计辨识度的样本估计值,基于此估计值可以对统计属性重要性进行排序,从而可以设计一种快速的适用于大规模数据的序约简算法.由于随机抽样集以及统计近似概念的引入,该算法从时间和空间上均降低了约简的计算复杂度,同时又保持了数据集中信息含量几乎不变.最后,数值实验将基于随机抽样的序约简算法和两种传统的属性约简算法从以下3个方面进行了对比:计算属性约简时间消耗、计算属性约简空间消耗、约简效果.对比实验验证了基于随机抽样的序约简算法在时间与空间上的优势.
陈俞陈俞李雪峰赵素云李翠平
关键词:模糊粗糙集属性约简
统计粗糙集被引量:2
2016年
现有的模糊粗糙集方法,由于其基础理论复杂度的桎梏,无法应用到大规模数据集上.考虑到随机抽样是一种可以极大地减少运算量的统计学方法,将随机抽样引入到经典的模糊粗糙集理论中,建立了一种统计粗糙集模型.首先,提出了统计上、下近似的概念,它相比经典模糊粗糙集模型的优势在于,以随机抽样得到的小容量样本代替了大规模全集,从而显著降低了计算量.而且,随着全集数量的增大,抽样样本数量并不会显著增大.此外,还讨论了统计上、下近似的性质,揭示统计上、下近似和经典上、下近似之间的关系.并且,提出了一个定理,该定理保证了统计下近似与经典下近似的取值统计误差在允许的范围内.最后,通过数值实验验证了统计下近似在计算时间上的显著优势.
陈俞赵素云陈红李翠平孙辉
关键词:近似算子模糊粗糙集
共1页<1>
聚类工具0