您的位置: 专家智库 > >

陈章

作品数:8 被引量:62H指数:5
供职机构:上海理工大学光电信息与计算机工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 7篇自动化与计算...
  • 1篇文化科学

主题

  • 2篇语言处理
  • 2篇神经网
  • 2篇神经网络
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇网络
  • 2篇相似度
  • 2篇法律
  • 2篇CNN
  • 1篇对象映射
  • 1篇多粒度
  • 1篇循环神经网络
  • 1篇引擎
  • 1篇引擎设计
  • 1篇映射
  • 1篇语义匹配
  • 1篇站内搜索
  • 1篇智能问答系统
  • 1篇搜索
  • 1篇推荐系统

机构

  • 8篇上海理工大学

作者

  • 8篇陈章
  • 6篇彭敦陆
  • 6篇刘丛
  • 2篇赵逢禹
  • 1篇王鹏
  • 1篇江文龙

传媒

  • 6篇小型微型计算...
  • 1篇计算机应用与...
  • 1篇情报学报

年份

  • 6篇2019
  • 1篇2016
  • 1篇2015
8 条 记 录,以下是 1-8
排序方式:
MGSC:一种多粒度语义交叉的短文本语义匹配模型被引量:11
2019年
语义匹配对许多自然语言处理任务至关重要,诸如信息检索中信息匹配、问答系统中问题和答案的匹配等.基于语义的匹配,即通过提取文本内在语义进行匹配度计算,是目前自然语言处理领域研究的热点.本文提出一种基于深度神经网络的文本语义匹配模型--多粒度语义交叉模型,从语义匹配的角度来解决文本匹配问题.模型首先通过循环神经网络获取短文本不同粒度的语义表示,然后从两个短文本不同粒度的语义交互信息中提取它们语义匹配信息,从而计算两个短文本的语义匹配度.实验表明,本文提出的基于多粒度语义交叉模型在短文本匹配上表现出较好的计算效果.
吴少洪彭敦陆苑威威陈章刘丛
关键词:语义匹配自然语言处理多粒度
Trans-NER:一种迁移学习支持下的中文命名实体识别模型被引量:15
2019年
目前存在的中文命名实体识别方法依赖于大量标注数据,但是某些领域标注数据的获取成本十分高昂.通过引入迁移学习技术,降低了实体识别模型对于大量标注数据的需求.论文从大规模非结构化文本数据出发,利用双向循环神经网络构建语言预测模型,将其作为迁移学习源模型;同时,基于上下文特征的字符级向量生成算法迁移源模型知识至实体识别模型,最终构建出迁移学习模型:Trans-NER.实验结果显示,提出的模型表现优于其他实体识别模型.
王银瑞彭敦陆陈章刘丛
关键词:自然语言处理命名实体识别
S2SA-BiLSTM:面向法律纠纷智能问答系统的深度学习模型被引量:3
2019年
利用司法领域的网络资源对用户所提的法律纠纷问题自动提供有价值的参考解决方案能在很大程度上降低人工成本和社会资源.为了智能化解决用户的法律纠纷问题,论文提出一种seq2seq(Sequence to Sequence,序列到序列)融合注意力模型和双向长短时记忆网络的法律纠纷自动问答深度学习模型——S2SA-Bi-LSTM.该模型从大规模法律纠纷问答对出发,利用BiLSTM获取输入序列的上下文信息,结合注意力机制对序列权重进行更新,通过编码得到输入序列的向量化表示.并在此基础上,本文修改了Bi-LSTM中输入门和遗忘门的参数并计算输出序列,以得到与输入序列相对应的输出序列.实验证明,所提模型在真实的数据集上生成的答案具有较高的准确率,MAP值和MRR值也优于已有研究.
涂海彭敦陆陈章刘丛
AM-CNN:一种基于注意力的卷积神经网络文本分类模型被引量:16
2019年
目前,大多数公开的文本分类数据集是相对平衡的,但对于真实文本分布来说,通常会出现类别极端不平衡的情况,这样的数据集会对模型训练产生影响.针对该问题,论文提出了一种基于卷积神经网络和注意力机制的文本分类算法——AM-CNN(Convolutional Neural Network with Attention Mechanism).算法利用循环神经网络捕捉文本的上下文信息,通过引入注意力机制得到文本类别的特征向量矩阵后运用卷积神经网络模型完成文本的分类,以降低在文本分类的训练过程中对小类别的不公平.实验结果表明,该算法对于提高文本分类的精度有较显著的效果.
王吉俐彭敦陆陈章刘丛
关键词:文本分类循环神经网络卷积神经网络
自注意力机制支持下的混合推荐算法被引量:8
2019年
协同过滤是推荐系统中最常用的一种方法,但推荐系统中评分矩阵的稀疏性、冷启动性和大多数推荐算法往往只从用户的角度出发忽略了商品间的关系等因素,限制了推荐算法的实际效果.论文提出一种基于自注意力机制(Self-Attention)的深度学习模型--AS-SADDL,用以进行建模用户交互数据及学习用户潜在偏好表示.该模型采用多重自注意力机制从用户的交互数据中挖掘数据间的关联关系,并通过深层神经网络学习用户潜在偏爱表示.同时用主成分分析法(PCA)对项目评分数据进行降维,并计算项目评分数据间的相似性,结合用户潜在偏爱表示与项目特征表示间的相似性作为最终结果,对用户进行项目推荐.在真实数据集上的实验表明,AS-SADDL模型具有较好的计算效果.
苑威威彭敦陆吴少洪陈章刘丛
关键词:推荐系统
加权映射匹配方法的站内搜索引擎设计
2016年
通用搜索引擎与网站提供的站内搜索机制都无法实现基于内容的企业网站信息查找。在分析企业网站信息的类型后,针对该问题提出一个通用站内搜索引擎架构。给出该引擎的设计思想,介绍对象映射匹配方法、加权对象相似度计算算法、索引构建等实现技术。实现基于网页内容、Word与pdf附件内容的查找定位。实验结果显示,该方法具有很高的查准率和查全率。该引擎可为企业网站的内容搜索与个性化服务提供支持。
江文龙赵逢禹陈章
关键词:站内搜索对象映射
基于分层分割的科研领域文本信息挖掘被引量:3
2015年
本文提出了一种分层分割的文本处理方法,根据科研文献的良构信息,将科研文献构建成分层信息模型,对于模型中不同节点,给出了相应的信息提取方法。对正文节点内容,提出一种间隔相似度计算方法进行文本分割,根据分割的结果进行主题词提取并根据提取结果进行科研文献相似性分析与文本挖掘。实验结果表明,科研文献分层信息模型的加权相似度适用于科研热点内容发现,分层分割能够实现科研文献不同节点内容对比分析与科研内容的挖掘。
王鹏赵逢禹陈章
关键词:文本分割相似度计算
ED-GAN:基于改进生成对抗网络的法律文本生成模型被引量:6
2019年
法律文本的自动生成能缓解我国法律服务行业中的人力资源不足的问题,对抗生成网络模型的出现为法律文本的自动生成提供了新思路.本文提出一种基于对抗生成网络的文本自动生成模型——ED-GAN(Generative Adversarial Networks based on Encoder-Decoder).在该模型的生成器中,首先将案情要素的关键词序列输入至编码器Encoder阶段的LSTM中编码成一隐含层向量,再将这个隐含层向量输入到解码器Decoder的LSTM中,并结合其各时间步的输出生成下一时间步的隐含层向量,进而得到各时间步的输出,生成文本序列.模型最后采用CNN网络来鉴别生成文本和真实文本之间的差距.实验验证表明,采用所提模型能够生成较理想的法律文本.
康云云彭敦陆陈章刘丛
关键词:GANCNN
共1页<1>
聚类工具0