搜索到65篇“ 项目序列集“的相关文章
改进的最大频繁项目序列挖掘算法被引量:1
2008年
影响关联规则挖掘的关键问题是最大频繁项目序列的生成问题,而传统的算法往往要求对事务数据库进行多次扫描,从而提高了I/O代价.阐述了项目序列和它的基本操作的定义,然后详细描述了ISS-DM的最大频繁项目序列生成算法,并在此基础上提出了一种改进的ISS-DM算法,最后进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效率较高.
李瑞马春艳
关键词:关联规则
基于最大频繁项目序列挖掘ISS_DM算法的改进
2007年
阐述了挖掘最大频繁项目序列ISS_DM算法,针对该算法不能有效地解决客户序列视图数据库的数据挖掘问题,结合序列模式提出了改进的ISS_DM算法,并进行了相应的验证。实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效益较高。
宋卫林徐惠民
关键词:数据挖掘关联规则
基于最大频繁项目序列挖掘DMFIA算法的改进被引量:2
2007年
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进。为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证。实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值。
宋卫林徐惠民
关键词:数据挖掘关联规则最大频繁项目集
基于项目序列操作理论的关联规则的挖掘算法
2005年
在关联规划挖掘理论研究上,首次给出了项目序列格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.
张雷刘中杰刘慧巍
关键词:数据挖掘关联规则项目序列集
分段扫描生成频繁项目序列的挖掘算法被引量:1
2004年
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目的算法已经被提出。近几年来,人们更关注于在大型数据中高效发现频繁项目的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列的生成。实验表明,DFISP算法是稳定而高效的。
毛国君刘椿年
关键词:数据挖掘关联规则
基于项目序列亚操作和数据分割的最大频繁项目序列挖掘方法(英文)
2004年
发现频繁项目序列是关联规则挖掘中的一个重要步骤.该文提出两个发现最大频繁项目序列的算法Dfis和Dfisp.Dfis算法基于项目序列操作理论,只有一次数据库扫描.Dfisp是Dfis的改进算法,它引入数据分割技术以提高内存使用率因而增强对大型数据库的处理能力,是一个两次数据库扫描算法.实验表明了它们的性能能和优势.
毛国君刘椿年
关键词:数据挖掘关联规则
基于项目序列的关联规则上探与下钻研究
数据挖掘是从庞大的数据或数据库中提炼有用信息的科学:是致力于数据分析和理解、揭示数据内部蕴藏知识的技术;是未来信息技术应用的重要目标之一.近二十年来,数据挖掘产生了许多新概念和方法,一些基本概念和方法趋于清晰,对它的研...
刘德喜
关键词:关联规则下钻项目序列集
文献传递
基于项目序列操作的关联规则挖掘算法被引量:54
2002年
最大频繁项目序列的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能 .该文首先给出项目序列和它的基本操作的严格定义 ,然后在此基础上提出一个称为 ISS- DM的最大频繁项目序列生成算法 .ISS- DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列的 .
毛国君刘椿年
关键词:数据挖掘关联规则项目序列集数据库
关联规则挖掘算法的研究
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘产生了许多新概念和方法。特别是最近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发...
周虹
关键词:数据挖掘关联规则项目序列集时态约束数据分割
文献传递
闭合项目格空间理论在期刊销售中的应用
2005年
数据挖掘是一种在繁多无序单个数据中寻找出有用信息的一个过程,通过数据之间的联系来解释现在和预测未来。随着数据库容量的不断增大,持续重复地访问数据库势必将导致效率和性能的低下,因此探求出一种新的理论方法来减少对数据库的扫描次数已成为近年来国内外的研究热点之一。闭合项目格空间理论突破了Apriori算法逐层生成k-频繁和裁减项目空间的模式,利用新的理论生成新的算法,寻求期刊销售中的潜在规律,从而有效地提高销售量。
林钢崔洁
关键词:数据挖掘项目序列集

相关作者

毛国君
作品数:70被引量:494H指数:10
供职机构:中央财经大学信息学院
研究主题:数据挖掘 分布式数据流 数据流 关联规则 计算机网络
刘椿年
作品数:127被引量:653H指数:14
供职机构:北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
研究主题:数据挖掘 蚁群算法 贝叶斯网 归纳逻辑程序设计 遗传算法
刘慧巍
作品数:29被引量:33H指数:3
供职机构:渤海大学
研究主题:火电厂 货物 卸货 动力装置 顶柱
邹力鹍
作品数:10被引量:90H指数:6
供职机构:北京航空航天大学电子信息工程学院
研究主题:数据挖掘 空间数据挖掘 知识发现 最大频繁项目集 关联规则
崔洁
作品数:11被引量:24H指数:3
供职机构:泰州职业技术学院
研究主题:高职教育 高校创新人才培养 教学质量 学术评价标准 缺憾