山西省自然科学基金(200821024)
- 作品数:3 被引量:5H指数:2
- 相关作者:孙静宇陈俊杰余雪丽李鲜花戚丽丽更多>>
- 相关机构:太原理工大学更多>>
- 发文基金:山西省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 采样特异性因子及异常检测
- 2010年
- 特异性因子是数据的重要特征之一,常通过累计数据之间的差异得到,是面向特异性挖掘的核心概念,然而遇到了计算时间复杂度过高的问题。本文在分析已有特异性因子定义特点及其计算算法时间复杂度的基础上,指出应该基于采样的方法定义特异性因子。给出了一种基于采样的特异性因子定义,即采样特异性因子(sampled peculiarity factor,SPF),并提出了一种基于SPF的异常检测算法。在真实数据集上进行对比实验,结果表明:该算法在检测异常数据时,精度降低不明显,而运行效率得以较大提高,这说明基于采样定义特异性因子的方法可行和更为合理。本文还指出采用合适的采样方法可进一步优化SPF的计算过程,进而节约占用CPU时间和满足实时性要求高的应用。
- 孙静宇余雪丽陈俊杰李鲜花
- 关键词:采样异常检测数据挖掘时间复杂度实时性
- 基于均模型的IBCF算法研究被引量:3
- 2013年
- 基于项目的协同过滤(item-based collaborative filtering,IBCF)算法推荐精度高,实现简单,易于用于实际系统,然而因Item向量过长,计算相似性十分耗时。针对这一问题,从Item向量过长入手,提出了一种均模型表示Item向量的方法,缩短计算相似性的时间。在Movie Lens数据集上进行对比,实验表明,该算法在推荐精度基本保证的情况下,能有效缩短计算时间,降低时间复杂度。此外,本文还指出上述优化相似性计算方法可进一步优化来提高推荐精度和满足实际应用要求。
- 戚丽丽孙静宇陈俊杰
- 关键词:推荐系统
- 协同Web搜索综述被引量:2
- 2011年
- 目前,协同Web搜索的研究处在探索阶段,研究问题和方向尚不够清晰。为此,本文在回顾协同Web搜索的提出与分类基础上,总结了目前有关协同Web搜索的理论研究和实践,进而指出了目前研究存在的问题与不足,并展望了未来的研究方向。
- 孙静宇陈俊杰,余雪丽,李鲜花陈俊杰余雪丽李鲜花
- 关键词:信息检索CSCW