杨凡
- 作品数:2 被引量:1H指数:1
- 供职机构:西南交通大学信息科学与技术学院更多>>
- 发文基金:四川省学术和技术带头人培养资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于免疫克隆选择算法的垃圾网页检测被引量:1
- 2015年
- 垃圾网页是指一些网页通过不正当的手段来误导搜索引擎,使网页获得高于其应有的排名,从而获得更多的访问量。它不仅降低了网页的质量,同时也导致了严重的Web信息安全问题。传统的垃圾网页检测通常使用经典的机器学习方法包括贝叶斯算法、SVM、C4.5等,这些算法对垃圾网页的检测有一定的效果。在前人的研究基础上提出一种基于免疫克隆选择的垃圾网页检测方法。利用人工免疫系统的自学习及自适应能力来检测利用新作弊技术的垃圾网页,并与广泛用于垃圾网页检测的贝叶斯算法对比。实验表明该方法能有效、可靠地检测出垃圾网页。
- 杨凡朱焱唐寿洪
- 关键词:搜索引擎垃圾网页克隆选择
- 基于Bagging-SVM集成分类器的网页作弊检测
- 2015年
- 网页作弊不仅造成信息检索质量下降,而且给互联网的安全也带来了极大的挑战。提出了一种基于Bagging-SVM集成分类器的网页作弊检测方法。在预处理阶段,首先采用K-means方法解决数据集的不平衡问题,然后采用CFS特征选择方法筛选出最优特征子集,最后对特征子集进行信息熵离散化处理。在分类器训练阶段,通过Bagging方法构建多个训练集并分别对每个训练集进行SVM学习来产生弱分类器。在检测阶段,通过多个弱分类器投票决定测试样本所属类别。在数据集WEBSPAM-UK2006上的实验结果表明,在使用特征数量较少的情况下,本检测方法可以获得非常好的检测效果。
- 唐寿洪朱焱杨凡
- 关键词:集成分类器信息熵弱分类器