国家自然科学基金(61003045)
- 作品数:9 被引量:26H指数:3
- 相关作者:伍杰华朱岸青张小兰蔡雪莲倪振声更多>>
- 相关机构:广东工贸职业技术学院华南理工大学暨南大学更多>>
- 发文基金:国家自然科学基金广东省教育部产学研结合项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 改进多分类器集成AdaBoost算法的Web主题分类被引量:2
- 2013年
- 现有的Web主题分类算法一般基于单一模型构建或者仅仅把多个单一模型简单叠加进行决策。针对该问题,提出一种基于多分类器集成的改进AdaBoost算法的Web主题分类方法。算法先采用VIPS算法获取页面分块并获取其视觉特征和文本特征,根据每一类特征的维度分别训练弱分类器,然后计算其对应的错误率,修改错误判别的拒绝策略,从而针对不同特征产生相应的最优分类器,最后对两类最优分类器级联决策。实验结果表明,该方法能提高AdaBoost算法对复杂Web主题信息的分类准确率,同时也为Web主题分类领域的研究提供一种新的方案。
- 伍杰华倪振声
- 关键词:WEB主题ADABOOST分类器
- 一种基于逆序匹配重复模式的主题信息提取方法
- 2013年
- 网页中的信息主要以重复的HTML结构进行组织并形成一致的展现形式,主要研究具备复杂重复模式的网页主题信息块识别,提出一种改进的基于逆序匹配重复模式的算法。该算法依据HTML标签结构和class属性改进DOM树,重构页面的向量空间模型,逆序匹配重复结构模式并完成对主题信息的提取。实验结果表明,该方法能准确识别复杂页面结构中主题重复模式,有效避免非主题重复模式的干扰,有较好的召回率和准确率。
- 伍杰华倪振声陈有青
- 关键词:信息提取主题识别
- 基于社区结构的科研合作关系分析与预测被引量:4
- 2016年
- 科研合作关系分析和预测针对网络的结构信息预测未来哪些学者间会产生合作关系进行研究,对于理解网络信息传播和动态变化具有重要的意义。在主流的基于拓扑属性的关系预测算法基础上提出了一种基于社区结构信息的合作关系预测模型。首先分析社区发现算法下科研网络的链接分布规律及给出模型构建的理论依据,然后构造引入社区拓扑结构信息的改进算法,最后采用不同社区发现算法进行实验。该方法在实验效果和性能上要优于一些经典的算法,说明该算法能够有效地引入社区结构信息对真实的科研合作网络关系预测问题建模,并为科研合作关系分析预测这一问题提供一种新的思路。
- 伍杰华朱岸青
- 关键词:科研网络社区信息
- 差分化社会网络节点角色的链路预测模型被引量:2
- 2013年
- 以经典的Common Neighbor算法为例,提出了一种基于社区划分的差分化节点角色的链路预测模型,该模型首先采用Clauset-Newman-Moore算法挖掘社会网络结构属性,同时引入节点连接度和社区整体参与度的定义,差分处理社区内外邻接节点和不同社区的贡献,采用有监督的学习训练方法分别对社区内节点对和社区间节点对进行链路预测.人工网络和真实网络中的实验证明,该模型能够提高基于相似度算法对节点对链路预测的准确率,并为该类模型的研究提供一种新的方案.
- 伍杰华
- 关键词:链路预测社会网络
- 基于树状朴素贝叶斯模型的社会网络关系预测被引量:6
- 2013年
- 在社会网络关系预测研究领域,把基于拓扑结构信息的共邻节点属性作为相似性度量的预测模型应用比较广泛,但是该类算法具有较强的假设独立性,不能完全反映社会网络的"链接"结构。引入树状朴素贝叶斯(TAN)分类模型,采用信息熵度量节点对的角色,赋予共邻节点集合差异化的贡献权重进行社会关系预测,同时把模型推广到CN,AA和RA等3种基于相似度的链接预测算法中。对5个真实社会网络采用AUC和ROC曲线进行实验评价后证明,该模型能够在深入挖掘共邻节点对贡献及解决共邻节点角色独立性的基础上提高预测精确度,同时为该类模型的研究提供一种新的方案。
- 伍杰华
- 关键词:社会网络分析链接预测贝叶斯模型
- 基于隐朴素贝叶斯模型的社会关系推荐被引量:3
- 2014年
- 基于共邻用户属性的社会关系推荐算法是社会网络分析关系预测领域的热点研究方向。提出了一种基于隐朴素贝叶斯(hidden nave Bayesian,HNB)模型的用户关系推荐算法。该算法通过分析属性之间的依赖性对问题建模,从中度量共邻用户之间关系对推荐用户对之间的贡献和影响,然后对所有候选推荐关系计算其相似度并进行排序,并把模型推广到CN、AA和RA三种关系推荐算法中。在真实网络数据集上的实验结果表明,所提出的算法比目前的基准方法和朴素贝叶斯方法具有更高的AUC值。此外,算法能够发现具备不同拓扑结构属性的网络对推荐精度有着线性的影响。
- 伍杰华朱岸青蔡雪莲张小兰
- 关键词:社会网络链接预测
- 差分化节点特征对复杂网络链接预测的分类性能分析
- 2015年
- 链接预测属于复杂网络分析的研究分支,它根据网络历史结构信息预测未来节点间会产生链接的可能性,从而挖掘网络的传播和演化方式。通过引入差分化节点的贡献权重并结合经典的节点和共邻节点网络拓扑结构特征,分别应用七类有监督学习-分类模型对社交、生物、交通等不同领域的八个真实复杂网络数据集进行实验,并采用Precision和ROC曲线对实验结果进行分析与评价。实验表明,引入基于差分化节点的贡献特征能够在深入挖掘网络结构信息的基础上比其余特征有更优的预测精确度,同时差异化的分类模型和特征选择对链接预测性能有相异的影响。
- 伍杰华朱岸青蔡雪莲张小兰
- 关键词:链接预测复杂网络
- 混合拓扑因子的科研网络合作关系预测
- 2015年
- 【目的】通过图论和复杂网络理论中的链接(关系)预测算法挖掘科研合作网络的结构信息,并预测目前尚未合作的学者有哪些在未来会产生合作关系。【方法】提出一种新颖的集成局部拓扑特征因子和全局社区拓扑特征的混合拓扑因子合作关系预测模型(Mixture Topological Factor,MTF),该模型引入朴素贝叶斯模型关系预测算法计算局部因子,采用社区贡献度和参与度计算全局社区特征因子进行集成。【结果】实验结果表明,MTF方法能够在采用不同社区算法的基础上有效地对真实的科研合作网络关系预测问题建模,在效果上也要优于一些经典和新近提出的算法。【局限】该方法有待进一步应用到更大规模的网络结构中。【结论】能够通过深入挖掘科研合作网络基于社区信息的拓扑属性提高预测精确度,同时为该类模型的研究提供一种新的方案。
- 伍杰华朱岸青
- 关键词:科研网络社区信息
- 基于划分社区和差分共邻节点贡献的链路预测被引量:10
- 2013年
- 通过改进基于节点相似度的朴素贝叶斯模型,引入GN和CMN两种经典的划分社区算法挖掘网络社区属性对预测节点对的影响,赋予共邻节点不同的连接度和社区贡献度并计算其贡献权重,同时把模型应用于五种相似度算法,采用ROC和Precision-Recall曲线进行实验评价。人工网络和真实网络中的实验证明,该模型能够在深入挖掘社会网络结构信息的基础上提高预测的精确度,同时为该类模型的研究提供一种新的方案。
- 伍杰华
- 关键词:链路预测社会网络相似度算法