何明
- 作品数:26 被引量:174H指数:5
- 供职机构:北京工业大学更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于矩阵分解的协同过滤算法的并行化研究被引量:10
- 2015年
- 基于矩阵分解的协同过滤算法是近几年提出的一种协同过滤推荐技术,但其每项预测评分的计算都要综合大量评分数据,同时在计算时还需要存储庞大的特征矩阵,用单一节点来进行推荐将会遇到计算时间和计算资源的瓶颈。通过对现有的基于ALS(最小二乘法)的协同过滤算法在Hadoop上并行化实现的原理和特点进行深入的研究,得到了传统的迭代式算法在Hadoop上运算效率不高的原因。根据迭代式MapReduce思想,提出了循环感知任务调度算法、缓存静态数据、任务循环控制、迭代终止条件检测等方法。通过在Netflix数据集上的实验表明,迭代式MapReduce思想提高了基于ALS的协同过滤算法的并行化计算的效率。
- 王全民苗雨何明郑爽
- 关键词:协同过滤HADOOP
- 融合类别信息和用户兴趣度的协同过滤推荐算法被引量:11
- 2017年
- 协同过滤直接根据用户的行为记录去预测其可能感兴趣的项目,是现今最成功、应用最广泛的推荐技术。推荐的准确度受相似性度量方法效果的影响。传统的相似性度量方法主要关注用户共同评分项之间的相似度,忽视了评分项目中的类别信息,在面对数据稀疏性问题时存在一定的不足。针对上述问题,提出基于分类信息的评分矩阵填充方法,结合用户兴趣相似度计算方法并充分考虑到评分项目的类别信息,使得兴趣度的度量更加符合推荐系统应用的实际情况。实验结果表明,该算法可以弥补传统相似性度量方法的不足,缓解评分数据稀疏对协同过滤算法的影响,能够提高推荐的准确性、多样性和新颖性。
- 何明肖润刘伟世孙望
- 关键词:协同过滤推荐系统兴趣度
- 蚁群算法融合粗糙集理论的属性约简算法被引量:2
- 2010年
- 为了克服属性约简过程中寻找最小属性集算法存在时间复杂度高搜索空间大等不足,把属性抽象为节点,通过蚁群算法搜索得到节点的最少组合,使得其能代替原有的属性节点并保持决策系统的粗糙分类能力.针对蚁群算法初期信息素匮乏,收敛速度慢的问题,将蚁群算法和粗糙集理论融合,采用粗糙集理论的相关算法确定属性核,并将其作为蚁群算法的初始节点.利用蚁群算法的搜索能力,用于最小属性集的搜索.理论分析和实验结果表明,该算法可行有效.
- 何明马国亮孙立峰
- 关键词:蚁群算法粗糙集属性约简
- 基于Minifilter微框架的文件加解密系统的设计与实现
- 随着互联网的快速发展和信息技术广泛的应用,使得信息安全问题越来越受到人们的重视,相关的信息安全方面的研究也越来越多。目前,对信息保护主要是基于系统的安全和网络的安全两个大的方面。信息的保存方式主要是以文件的形式存储在计算...
- 何明
- 关键词:访问控制
- 一种基于注意力的多兴趣序列推荐方法及系统
- 本发明公开了一种基于注意力的多兴趣序列推荐方法及系统,提出了一个模型MUIR,该模型使用多个向量表示用户的不同层面的兴趣,并能够为用户提供多样化的推荐结果。采用基于自注意力的方法学习低级层面的表示,并利用上下文信息和辅助...
- 何明韩天槊
- 文献传递
- 一种基于差分隐私保护的协同过滤推荐方法被引量:19
- 2017年
- 由于推荐系统需要利用大量用户数据进行协同过滤,会给用户的个人隐私带来相当大的风险,如何保护隐私数据成为推荐系统当前面临的重大挑战.差分隐私作为一种新出现的隐私保护框架,能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护.针对推荐系统中的隐私保护问题,提出一种满足差分隐私保护的协同过滤推荐算法.首先,构建用户和项目的潜在特征矩阵,有效降低数据稀疏性;然后,采用目标扰动方法对矩阵中添加满足差分隐私约束的噪声得到噪矩阵分解模型;通过随机梯度下降算法最小化相关联的正则化平方误差函数来获取模型中的参数;最后,应用差分隐私矩阵分解模型进行评分预测,并在MovieLens和Netflix数据集上对算法的有效性进行评价.实验结果证明:所提出方法的有效性能够在有限的精度损失范围内进行推荐并保护用户隐私.
- 何明常盟盟吴小飞
- 关键词:隐私保护协同过滤推荐系统矩阵分解
- 基于遗传算法和粗糙集理论的增量式规则获取方法被引量:1
- 2008年
- 规则获取的增量式算法是数据挖掘领域的一个热点问题.基于粗糙集理论,从规则获取和优化两方面研究了基于遗传算法的增量式规则挖掘方法,它具有结构简单、搜索效率高、求解速度快等优点.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识,并且将遗传算法和规则挖掘算法相结合,建立了新的优化方法,提出了一种基于遗传算法的增量式规则挖掘的方法.在原有规则集的基础上进行规则和规则参数的增量式更新,避免了为更新规则而重新运行规则获取算法.试验结果表明,执行增量式GA的能够有效地获取最优规则.
- 何明
- 关键词:遗传算法粗糙集增量式挖掘
- 基于LDA主题模型的文本相似度计算被引量:98
- 2013年
- LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。
- 王振振何明杜永萍
- 关键词:主题模型LDA文本相似度GIBBS抽样
- 一种提升用户视频网站留存时间的推荐方法
- 本发明公开了一种提升用户视频网站留存时间的推荐方法,包括以下步骤:数据预处理、深度兴趣交叉网络模型构建、模型训练及结果生成。本发明中的深度兴趣交叉网络模型整体上被划分为数据转换模块、低阶特征提取模块、交叉网络特征提取模块...
- 何明刘宾
- 页面描述语言Postscript及其转换程序被引量:1
- 1994年
- 叙述和分析了国际通用的页面描述语言Postscript的构成、功能和特点.阐述了Postscript语言与4S(SuperScienceSettingSystem)文件转换程序的设计思想。
- 何明匡燕玲李小龙黄铮陈祖荫
- 关键词:程序语言页面描述语言