您的位置: 专家智库 > >

马继霞

作品数:1 被引量:20H指数:1
供职机构:浙江工业大学计算机科学与技术学院、软件学院更多>>
发文基金:浙江省自然科学基金国家重点实验室开放基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇隐私
  • 1篇隐私保护
  • 1篇数据分类
  • 1篇离散化

机构

  • 1篇北京航空航天...
  • 1篇浙江工业大学
  • 1篇辛辛那提大学

作者

  • 1篇陈铁明
  • 1篇蔡家楣
  • 1篇马继霞

传媒

  • 1篇计算机研究与...

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
一种新的快速特征选择和数据分类方法被引量:20
2012年
针对数据分类问题提出一种新型高效的特征选择和规则提取方法.首先通过减少初始区间数量改进Chi-Merge离散化方法,再采用改进的Chi-Merge离散化连续型特征变量;特征离散化后,统计样本数据在每个特征子集划分下的频数表,并根据频数表计算数据不一致率,再利用顺序前向最优搜索的方法,快速确定特征数量由小到大的每一个最优特征子集;根据特征子集对应的数据不一致率差异最小化原则,完成特征个数最小化的最优特征子集筛选;根据最优特征子集的数据频数表,可直接提取数据分类规则.实验表明,快速提取的规则可获得较好的分类效果.基于该特征选择方法,提出一种面向分布式同构数据的快速分类模型,不但具有良好的分类效果,还支持对样本数据内容的隐私保护.
陈铁明马继霞Samuel H.Huang蔡家楣
关键词:离散化数据分类隐私保护
共1页<1>
聚类工具0