河北省自然科学基金(F2008000877)
- 作品数:17 被引量:63H指数:5
- 相关作者:张付志伍朝辉姚芳赵伟伟周立娜更多>>
- 相关机构:燕山大学河北科技师范学院北京航空航天大学更多>>
- 发文基金:河北省自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术自然科学总论天文地球更多>>
- 一种改进的基于流形对齐的协同过滤算法
- 2009年
- 基于流形对齐的协同过滤算法是通过用户间的相似性来计算重构矩阵,所以相似性计算的不准确往往会导致权值矩阵不准确,使得推荐质量下降.文中对基于流形对齐的协同过滤算法进行改进,采用数据集的拓扑结构矩阵和几何结构矩阵线性组合的方法来计算权值矩阵,有效去除相似性误差对推荐质量的影响.实验结果表明,改进后的算法与原算法相比有较好的推荐质量.
- 张付志张启凤
- 关键词:拓扑结构协同过滤
- 基于领域本体的跨系统个性化服务用户模型被引量:13
- 2009年
- 目前大多数个性化服务系统采用关键词或关键词向量空间模型表示用户个人偏好,该方法严重制约了用户模型在不同系统间的共享和重用。针对上述问题,提出一种基于领域本体的用户模型,给出其形式化描述,通过引入个性化兴趣度实现用户个人偏好的量化,介绍该模型在群体用户建模中的应用过程。实验表明,该用户模型能准确反映用户兴趣且更新能力和可扩展性较强。
- 张付志李伟静朱彩云
- 关键词:本体领域本体用户模型
- 基于P2P自组织的数字图书馆网格结构模型被引量:1
- 2009年
- 针对现有数字图书馆网格系统中存在的瓶颈、低扩展性及节点自主性差等问题,引入P2P自组织管理策略,用P2P和网格技术互补特性及自主性管理策略来弥补这些缺陷。首先提出一个基于P2P自组织的三层数字图书馆网格结构模型;然后分析模型的体系结构并对主要模块的功能进行了详细的介绍;最后通过数字图书馆网格体系结构的Petri net描述方法对模型进行了评价。
- 王常武赵静张付志
- 关键词:网格对等网技术自组织管理PETRI网
- 基于贝叶斯算法的垃圾邮件过滤技术的研究与改进被引量:13
- 2009年
- 随着电子邮件的应用与普及,垃圾邮件的泛滥也越来越多地受到人们的关注。本文对基于贝叶斯的垃圾邮件过滤器的原理及其关键技术进行了详细的描述。针对朴素贝叶斯模型对分类信息过度简化和准确率低等缺点,通过引入分级的最小风险算法和对多项式和多重贝努利估计模型进行混合的方法分别对贝叶斯过滤器进行了改进,并进行了实验。实验结果表明,改进后的贝叶斯过滤器具有了更好过滤效果。
- 张付志伍朝辉姚芳
- 关键词:垃圾邮件
- 基于目标项目识别的用户概貌攻击检测算法被引量:2
- 2011年
- 为了准确检测协同过滤推荐系统中的用户概貌注入攻击,从攻击的目的性考虑,通过对攻击概貌中目标项目与填充项目之间的特征差异进行分析,提出一种项目评分背离度的计算方法;利用项目评分背离度来确定受攻击的目标项目,并在此基础上提出一种基于目标项目识别的用户概貌注入攻击检测算法.实验结果表明,该算法进一步提高了攻击检测的精度,确保了系统推荐的质量.
- 徐玉辰梁强张付志
- 关键词:协同过滤攻击检测
- 融合多系统用户信息的协同过滤算法被引量:2
- 2009年
- 为了提高新用户服务的预测准确率,提出一种融合多系统用户信息的协同过滤算法。该算法通过将多个系统的用户信息融合到低维流形中为用户寻找邻居和推荐项目,并介绍流形学习算法在推荐服务中的应用过程。通过对比实验,结果表明该算法比传统协同过滤算法能更有效、准确地为新用户提供推荐。
- 张付志张启凤
- 关键词:协同过滤
- 一种基于启发式搜索的论文元数据提取算法被引量:1
- 2009年
- 随着大量的科研论文以电子文档的形式出现,为了高效地检索这些科研文献资料,从中精确地抽取这些论文头部的元数据信息显得十分有必要。在条件随机场模型的基础上,提出了一种启发式搜索算法来对论文头部的元数据信息进行提取。该算法首先利用文本分块技术和特征提取规则来对文本进行预处理,然后结合条件随机场概率模型利用启发式搜索来进行元数据的提取。实验结果表明,在相同概率模型的基础上,该算法有着较好的性能,在精确度和召回率方面都有了明显的提高。
- 张付志侯娜刘慧马玉静
- 关键词:信息提取元数据提取条件随机场文本分块启发式搜索
- 一种相似重复元数据记录检测方法被引量:3
- 2009年
- 对联邦数字图书馆中重复元数据记录进行检测和管理,是保证元数据质量、提高联邦检索服务质量的关键。针对现有联邦数字图书馆中重复记录检测方法计算集中、准确度不高等缺点,提出一种快速高效的相似重复元数据记录检测方法,该方法基于改进的N-Gram方法,适合较大规模联邦数字图书馆。模拟实验结果表明,该方法能有效提高重复检测的性能,加快重复检测的速度。
- 王常武韩菁华张付志
- 关键词:元数据重复记录检测相似度
- 基于QoS的Web服务发现方法被引量:8
- 2010年
- 由于传统的基于关键字和简单分类的Web服务发现机制较少考虑服务质量(QoS),因此不能很好地满足用户的需求。针对该问题,提出一种基于QoS的Web服务发现模型,通过引入QoS代理机制以支持基于QoS的Web服务发布与发现。在此基础上,根据不同用户的QoS需求,提出一种基于QoS的Web服务发现算法。实验结果表明,该算法具有较高的准确率。
- 张付志周立娜赵伟伟许立永
- 关键词:WEB服务服务质量
- 基于TF*IDF的垃圾邮件过滤特征选择改进算法被引量:7
- 2009年
- 随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。
- 陈琦伍朝辉姚芳宋秀荣张付志
- 关键词:垃圾邮件过滤器贝叶斯