国家教育部博士点基金(20092303120005)
- 作品数:1 被引量:11H指数:1
- 相关作者:孙广路齐浩亮更多>>
- 相关机构:哈尔滨理工大学黑龙江工程学院更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于在线排序逻辑回归的垃圾邮件过滤被引量:11
- 2013年
- 垃圾邮件过滤是网络信息处理中的重要问题,基于机器学习方法的垃圾邮件过滤技术是目前的研究热点。现有研究一般将过滤问题视为二值分类问题进行解决,存在着模型优化目标和性能评价指标1-AUC不一致的问题,导致模型优化结果产生偏差,过滤性能受到很大影响。该文通过直接优化评价指标1-AUC来提升过滤器性能,将垃圾邮件过滤问题转化成排序问题进行建模,提出了在线排序逻辑回归学习算法,解决了在线学习中的邮件得分偏移问题;综合应用TONE算法和重采样技术,提出参数权重更新算法,解决模型学习中在线调整模型参数时的处理速度问题,满足垃圾邮件实时过滤的要求。在垃圾邮件过滤公开评测数据集上的实验结果表明,基于在线排序逻辑回归模型的过滤结果全面优于在线逻辑回归模型的过滤结果。
- 孙广路齐浩亮
- 关键词:垃圾邮件