陈妮
- 作品数:6 被引量:42H指数:2
- 供职机构:北京工商大学更多>>
- 发文基金:国家自然科学基金北京市属高等学校科学技术与研究生教育创新工程建设项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于时间序列的网络热点话题模式分析
- 热点话题不仅对虚拟网络中各种事件的形成和发展有极大影响,还影响了真实人类社会中的人们对待事件的看法和判断,甚至于影响了司法机构和政府对事件的判决。揭示和预测热点话题的传播模式成了非常重要的问题。本文以热点话题的热度时间序...
- 陈妮
- 关键词:时间序列小波聚类
- 文献传递
- 面向热点话题时间序列的有效聚类算法研究被引量:31
- 2012年
- 聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压缩,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始矩阵中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果.文中分别采用国内外3个数据集作为测试样本,进行了大量的实验.实验结果表明WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果.WKSC算法可很好的应用于大量高维热点话题的模式分析.
- 韩忠明陈妮乐嘉锦段大高孙践知
- 关键词:聚类时间序列小波
- 一种非对称距离下的层次聚类算法被引量:11
- 2014年
- 层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能.
- 韩忠明陈妮张慧杨伟杰
- 关键词:层次聚类数据挖掘
- 面向热点话题时间序列的有效聚类算法研究
- 聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.LESKOVEC等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度...
- 韩忠明陈妮乐嘉锦段大高孙践知
- 关键词:聚类时间序列小波
- 文献传递网络资源链接
- 一种基于非对称距离下的层次聚类方法
- 一种基于非对称距离下的层次聚类方法,有五大步骤:一、选择第一个选择因子,即绝对值最大,挑选出第二、三个对象,即teacher和education;二、将teacher和education合并为同一簇,记为簇1.并采用单连...
- 韩忠明万月亮陈妮
- 文献传递
- 一种基于非对称距离下的层次聚类方法
- 一种基于非对称距离下的层次聚类方法,有五大步骤:一、选择第一个选择因子,即绝对值最大,挑选出第二、三个对象,即teacher和education;二、将teacher和education合并为同一簇,记为簇1.并采用单连...
- 韩忠明万月亮陈妮
- 文献传递