国家自然科学基金(61100112)
- 作品数:4 被引量:54H指数:3
- 相关作者:李海峰章宁朱建明曹怀虎金鑫更多>>
- 相关机构:中央财经大学更多>>
- 发文基金:国家自然科学基金教育部人文社会科学研究基金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向Web信息资源的领域本体模型自动构建机制的研究被引量:12
- 2012年
- 领域本体的构建是本体工程研究与应用的重要内容。面向网络Web信息资源,获取领域相关文本信息,通过对文本的概念分析,构建领域本体模型。提出一套本体自动构建机制,该本体构建基于数据挖掘和机器学习技术,内容主要包括基于贝叶斯(Bayes)分类原理;提出多个分类器方式的概念分类过程和算法;提出概念关联分析和概念自学习算法,建立本体原型;提出面向OWL本体模型的转换映射机制,构建基于OWL的本体模型。此外,还提出了从网络资源获取、领域本体建模到本体实施应用的一套完整的本体构建和应用实施的解决方案。
- 金鑫
- 关键词:本体OWL
- 时间敏感数据流上的频繁项集挖掘算法被引量:30
- 2012年
- 数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率.
- 李海峰章宁朱建明曹怀虎
- 关键词:频繁项集数据流数据挖掘
- 数据流上的最大频繁项集挖掘方法被引量:3
- 2012年
- 最大频繁项集适用于内存空间有限的数据流挖掘。为此,提出一种基于界碑模型的最大频繁项集挖掘方法,采用最大频繁项集树的数据结构,增量式地维护最大频繁项集与部分附属信息,实现项集的快速搜索和裁剪。在MUSHROOM和BMS-POS数据集上的实验结果表明,该方法具有较高的挖掘效率。
- 李海峰章宁
- 关键词:最大频繁项集数据挖掘数据流
- 不确定性数据上频繁项集挖掘的预处理方法被引量:10
- 2012年
- 传统频繁项集挖掘技术无法高效获取不确定性数据中有价值的信息。通过研究频繁模式增长树的算法原理,根据不确定性数据的特点提出了一种有效的不确定性数据预处理方法PCAFP-Growth。利用主成分分析的方法进行数据的降维,并使用模糊关联分析法将数据概率进行分类,实现数据剪枝。在理论研究基础上,通过实验对数据集进行了验证。结果表明,基于主成分分析法的剪枝策略在稠密数据集上能够有效提高运算速度,减少内存的使用。
- 李海峰章宁柴艳妹
- 关键词:不确定性数据频繁项集主成分分析