林丽
- 作品数:9 被引量:7H指数:2
- 供职机构:厦门大学更多>>
- 发文基金:福建省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 数量关联规则发现中的最近邻聚类方法研究
- 本文讨论数量关联规则挖掘过程中连续属性离散化问题,结合k度完全的思想合并和分裂传统的最近邻聚类算法的结果来离散化连续型属性,这种方法既考虑数据稀疏性,体现数据的真实分布,又结合关联规则本身的特点重新调整改善聚类结果,有效...
- 林丽冯少荣薛永生周晓丹黄海
- 关键词:关联规则挖掘最近邻聚类连续属性离散化
- 文献传递
- RD-IL:一种基于XML Twig查询的新索引技术
- 有效的索引技术是加速XML查询的重要因素.目前已有很多基于记录类和结构类的索引技术,但它们处理同时具有Twig和数据内容的查询时效果都不是很好.而提出的RD-IL索引技术能有效解决此类查询,同时也能有效解决涉及到以下几方...
- 黄海薛永生林丽任仲晟周晓丹
- 关键词:XMLTWIG索引
- 文献传递
- RD-IL:一种基于XML Twig查询的新索引技术
- 2006年
- 有效的索引技术是加速XML查询的重要因素.目前已有很多基于记录类和结构类的索引技术,但它们处理同时具有Twig和数据内容的查询时效果都不是很好.而提出的RD-IL索引技术能有效解决此类查询,同时也能有效解决涉及到以下几方面的查询:Twig、数据内容、ancestor-descendant.
- 黄海薛永生林丽任仲晟周晓丹
- 关键词:XMLTWIG索引
- 数量关联规则发现中的最近邻聚类方法研究
- 1引言近年来研究人员针对Boolean属性的关联规则挖掘提出了很多高效算法,并且已有若干原型和产品,例如IBM开发的IntelligentMiner,AngossSoftware开发的KnowledgeSeeker,加拿...
- 林丽冯少荣薛永生周晓丹黄海
- 文献传递
- 基于充分挖掘增量事务的关联规则更新算法被引量:4
- 2007年
- 目前已提出了许多快速的关联规则增量更新挖掘算法,但是它们在处理对新增事务敏感的问题时,往往会丢失一些重要规则。为此,文章提出了一种新的挖掘增量更新后的数据库中频繁项集的算法EUFIA(Entirety Update Frequent Itemsets Algorithm),该算法先对新增事务数据分区,然后快速扫描各分区,能全面有效地挖掘出其中的频繁项集,且不丢失重要规则。同时,最多只扫描1次原数据库也能获得更新后事务数据库的全局频繁项集。研究表明,该算法具有很好的可测量性。
- 蔡进薛永生林丽张东站
- 关键词:关联规则增量式更新
- RD-IL:一种基于XML Twig查询的新索引技术
- 有效的索引技术是加速XML查询的重要因素.目前已有很多基于记录类和结构类的索引技术,但它们处理同时具有Twig和数据内容的查询时效果都不是很好.而提出的RD-IL索引技术能有效解决此类查询,同时也能有效解决涉及到以下几方...
- 黄海薛永生林丽任仲晟周晓丹
- 关键词:XMLTWIG索引技术
- 文献传递
- 基于语义距离的文本聚类算法研究
- 网络技术迅速发展的今天,人们越来越感受到了信息的冲击,而文本是信息的重要载体,人们日常生活中所接触到的信息有80%左右以文本的形式存在。信息内容和格式的多样化、复杂化,使人们无法遍历所有感兴趣的内容,而且又不存在标准的文...
- 林丽
- 关键词:文本聚类算法语义距离
- 文献传递
- 基于有限个条件FP_树中挖掘频繁模式
- 2007年
- 在数据挖掘中发现关联规则是一个基本问题,而关联规则发现中最昂贵的步骤便是寻找频繁模式。FP_growth(FrequentPatern growth)方法在产生长短频繁项集时不产生候选项集,从而大大提高了挖掘的效率,但是FP_growth在挖掘频繁模式时候产生大量的条件FP树从而占用大量空间,对FP_growth进行研究并提出一种改进算法,该算法不仅利用FP_growth算法所有优点而且避免了FP_growth的缺陷。主要通过建立有限棵条件FP树(数目为事务数据库的属性个数)来挖据长短频繁模式,大大节省了FP_growth算法所需要空间,实验证明该文算法是有效的。
- 林丽冯少荣薛永生
- 关键词:关联规则
- 基于文字统计特性和深度神经网络的自然场景文字检测
- 文字是图像中极为常见的视觉元素,包含了丰富而准确的高层语义信息,可以更好地表达场景视觉内容,对人们描述和理解图像具有重要帮助。自然场景文字识别在地图定位,盲人导航,图像检索,人机交互等诸多领域有广泛的应用前景。本文的研究...
- 林丽
- 关键词:SSD
- 文献传递