王洋洋
- 作品数:18 被引量:58H指数:6
- 供职机构:宁波大学更多>>
- 发文基金:国家社会科学基金浙江省教育厅科研计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于层级类别信息的标题自动分类研究被引量:6
- 2016年
- 针对标题文本特征少、特征维度高和分布不均匀导致分类性能不佳的问题,提出了一种利用分类体系结构信息的双向特征选择算法,并在该算法的基础上实现标题分类。该方法以具有严格层级关系的分类体系为应用前提,利用类别与词的同现及分布关系进行特征词和候选类别的双向选择,构建类别向量空间;通过分析标题文本特征词在层级类别向量空间的分布所表现出的类别语义信息,确定文本所在层级以及所在层级的候选类别;之后利用分类器对未能成功分类的标题进行分类。在人工标引数据集上的实验结果表明,该方法在不进行语料扩展和外部知识库添加的基础上仍可有效地确定文本所在层级,实现多级学科的分类;并可在识别类别语义信息的基础上,降低候选类别数目,提高分类效率。
- 葛文镇刘柏嵩王洋洋赵福青
- 关键词:向量空间
- 一种基于图卷积网络的文本多标签学习方法被引量:4
- 2021年
- 多标签学习广泛应用于文本分类、标签推荐、主题标注等.最近,基于深度学习技术的多标签学习受到广泛关注,针对如何在多标签学习中有效挖掘并利用高阶标签关系的问题,提出一种基于图卷积网络探究标签高阶关系的模型TMLLGCN.该模型采用GCN的映射函数从数据驱动的标签表示中生成对象分类器挖掘标签高阶关系.首先,采用深度学习方法提取文本特征,然后以数据驱动方式获得基础标签关联表示矩阵,为更好地建模高阶关系及提高模型效果,在基础标签关联表示矩阵上考虑未标记标签集对已知标签集的影响进行标签补全,并以此相关性矩阵指导GCN中标签节点之间的信息传播,最后将提取的文本特征应用到学习高阶标签关系的图卷积网络分类器进行端到端训练,综合标签关联和特征信息作为最终的预测结果.在实际多标签数据集上的实验结果表明,提出的模型能够有效建模标签高阶关系且提升了多标签学习的效果.
- 刘晓玲刘柏嵩王洋洋
- 基于改进鱼群和K-means的混合聚类算法被引量:9
- 2013年
- 针对传统K-means算法存在的缺陷,引进人工鱼群算法,提出了一种基于改进鱼群和K-means的混合聚类算法。聚类样本中心点初始化时,人工鱼各维参数随机选择在对应属性两个极值之间,同时为了降低计算复杂度,提高收敛效率,寻找全局最优,首先对随机选取的一小部分人工鱼进行K-means操作,然后对全体人工鱼的追尾算子引入粒子群策略,引导其学习,模拟人工鱼的行为。通过Matlab仿真实现算法,在费雪鸢尾花卉数据集和葡萄酒质量数据集进行了实验,算法的有效性和可行性得到了验证。
- 刘薇刘柏嵩王洋洋
- 关键词:人工鱼群K-均值聚类混合算法
- 一种基于用户行为的学术资源推荐方法
- 本发明公开了一种基于用户行为的学术资源推荐方法,特点是:包括步骤:①对资源库中所有学术资源从资源类型、学科分布、关键词分布和LDA主题分布四个维度建模,得到学术资源模型;②根据筛选规则,得到待推荐的学术资源集合;③获取用...
- 刘柏嵩尹丽玲王洋洋高元费晨杰
- 文献传递
- 一种基于用户行为的学术资源推荐方法
- 本发明公开了一种基于用户行为的学术资源推荐方法,特点是:包括步骤:①对资源库中所有学术资源从资源类型、学科分布、关键词分布和LDA主题分布四个维度建模,得到学术资源模型;②根据筛选规则,得到待推荐的学术资源集合;③获取用...
- 刘柏嵩尹丽玲王洋洋高元费晨杰
- 文献传递
- 一种学术资源推荐服务系统与方法
- 提供一种学术资源推荐服务系统与方法,用基于LDA的主题爬虫在互联网上爬取学术资源,用基于LDA的文本分类模型按预定A个类别分类后存储于本地的学术资源数据库,还包括学术资源模型、资源质量值计算模型、用户兴趣模型,在用户的终...
- 刘柏嵩王洋洋尹丽玲费晨杰高元
- 文献传递
- 群组推荐分析与研究综述被引量:10
- 2018年
- 随着大数据时代的到来,推荐系统的应用领域也愈发广泛,组推荐系统的推荐服务对象由单一用户扩展为群组成员,正成为推荐系统领域的研究热点之一。组推荐系统需要考虑所有群体成员的偏好,将各成员的偏好融合,缓解群组成员之间的偏好冲突,使推荐结果尽可能满足所有群组成员。主要对最近的组推荐的研究进展进行综述,分别对群组分类、群组发现、群组预测推荐的前沿进行总结,并概括了群组推荐的影响因素。最后,对组推荐的研究点及其展望分别进行阐述。
- 吴云昌刘柏嵩王洋洋费晨杰
- 关键词:推荐系统
- 基于归一化割的主题划分算法研究被引量:2
- 2013年
- 为了保证抽取信息的全面性,主题划分成了不可或缺的工作.借助同义词词林,从词语的语义角度计算文本中各个段落间的相似度,建立段落文本关系图.基于文本关系图对归一化割分割准则中权值矩阵的构建做出调整,使之更能体现出段落间的相似程度,并使用该准则对文本进行主题划分.结果表明,该方法无论是对连续段落还是跨段落表达同一主题的主题划分均较为有效.
- 王洋洋刘柏嵩刘薇
- 关键词:同义词词林主题划分
- 一种基于LDA的文本分类方法
- 提供一种基于LDA的文本分类方法,提取特征词集输入文本分类模型计算文本归属预定A个类别中的每个类别的概率,取概率值最大的作为其所属类别;预先用训练语料按设定主题数K让LDA主题模型训练,获得K个主题关联词集合;还预先用类...
- 刘柏嵩高元王洋洋尹丽玲费晨杰
- 文献传递
- 基于知识元的数字图书馆学科标引研究被引量:6
- 2013年
- 对数字图书馆图书按中图法分类和学科分类进行了比较,定义了新的知识元结构,利用知识元中出现的概念,通过中文Wikipedia概念库得到的丰富的语义信息,对抽取的图书概念与学科分类类目之间计算语义相似度、语义关联度,进行语义链接,最后展示了初步实现的数字图书馆学科标引系统.
- 刘薇刘柏嵩王洋洋
- 关键词:知识元语义知识