您的位置: 专家智库 > >

殷贤君

作品数:3 被引量:9H指数:2
供职机构:浙江工商大学更多>>
发文基金:浙江省自然科学基金国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术交通运输工程更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...
  • 1篇交通运输工程

主题

  • 3篇数据流
  • 2篇贝叶斯
  • 2篇贝叶斯分类
  • 1篇动态数据
  • 1篇动态数据流
  • 1篇兴趣度
  • 1篇散列
  • 1篇分类挖掘算法
  • 1篇概念漂移
  • 1篇贝叶斯分类算...
  • 1篇HT

机构

  • 3篇浙江工商大学

作者

  • 3篇殷贤君
  • 2篇琚春华
  • 1篇许翀寰

传媒

  • 1篇系统工程理论...
  • 1篇计算机工程与...

年份

  • 1篇2012
  • 2篇2011
3 条 记 录,以下是 1-3
排序方式:
结合自助抽样的动态数据流贝叶斯分类算法被引量:4
2011年
动态数据流具有数据量大、变化快、随机存取代价高、详细数据难以存储等特点,挖掘动态数据流对计算能力与存储能力要求非常高。针对动态数据流的以上特点,设计了一种基于自助抽样的动态数据流贝叶斯分类算法,算法运用滑动窗口模型对动态数据流进行处理分析。该模型以每个窗口的数据为基本单位,对窗口内的数据进行处理分析;算法采用自助抽样技术对待分类数据中的属性进行裁剪和优化,解决了数据属性间的多重线性相关问题;算法结合贝叶斯算法的特点,采用动态增量存储树来解决动态样本数据流的存储问题,实现了无限动态数据流无信息失真的静态有限存储,解决了动态数据流挖掘最大的难题——数据存储;对优化的待分类数据使用all-贝叶斯分类器和k-贝叶斯分类器进行分类,结合数据流的特性对两个分类器进行实时更新。该算法有效克服了贝叶斯分类属性独立性的约束和传统贝叶斯只对静态数据分类的缺点,克服了动态数据流最大的难题——数据存储问题。通过实验测试证明,基于自助抽样的贝叶斯分类具有很高的时效性和精确性。
琚春华殷贤君许翀寰
关键词:数据流贝叶斯分类
基于兴趣度的数据流频繁模式散列挖掘算法被引量:4
2012年
频繁模式挖掘是很多数据流挖掘工作的基础.现有算法虽然能够有效的在数据流中挖掘近似的频繁模式,但是由于数据流数据的不确定性、连续性以及海量性,始终不能有效的将算法的时间效率和空间效率控制在一个可以接受的范围内.本文通过使用散列表作为概要数据的存储结构,并引入关联规则兴趣度的概念,提出了数据流频繁模式挖掘算法MIFS-HT(mining interesting frequent itemsets with hash table),不仅有效降低现有算法的时空复杂度,同时提高了算法的应用价值.最后,实验结果表明:MIFS-HT是一种高效的数据流频繁模式挖掘算法,其性能优于FPStream、LossyCounting等算法,并且挖掘结果更具有现实意义.
琚春华殷贤君
关键词:数据流兴趣度
基于增量存储的商业数据流分类挖掘算法研究与应用
数据流挖掘目前已成为数据挖掘的热点话题,如挖掘通信领域中的电话记录数据流以期发现潜在的优质客户、挖掘Web上的用户点击数据流、网络监测中的数据包流以期发现可能存在的黑客攻击、挖掘零售业务中的交易数据流以期实现相关服务的推...
殷贤君
关键词:数据流贝叶斯分类概念漂移
文献传递
共1页<1>
聚类工具0