国家自然科学基金(61305094)
- 作品数:6 被引量:50H指数:4
- 相关作者:朱林徐菲菲雷景生毕忠勤更多>>
- 相关机构:上海电力大学上海电力学院更多>>
- 发文基金:国家自然科学基金上海市教育发展基金上海市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 结合卷积神经网络和最小门控单元注意力的文本情感分析被引量:19
- 2020年
- 结合卷积神经网络CNN和最小门控单元MGU各自的优势,融合注意力机制,提出注意力C_MGU神经网络模型。通过CNN的卷积层模块捕捉提取文本的初步特征表示,利用Attention机制和MGU模块对文本的初步特征表示进行关键信息的加强和优化,并将生成的文本深层特征表示输入到Softmax层进行回归处理。对公开数据集IMBD、Sentiment140进行情感分类实验,结果表明该模型能够强化对文本的句义理解,可进一步学习序列相关特征,有效地提高情感分类的准确率。
- 徐菲菲芦霄鹏
- 关键词:情感分析
- 模糊加权流数据软子空间的聚类算法被引量:1
- 2013年
- 现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.
- 朱林雷景生毕忠勤徐菲菲
- 关键词:子空间聚类数据流聚类模糊聚类
- 基于ArcReLU函数的神经网络激活函数优化研究被引量:18
- 2019年
- 近年来深度学习发展迅猛。由于深度学习的概念源于神经网络,而激活函数更是神经网络模型在学习理解非线性函数时不可或缺的部分,因此本文对常用的激活函数进行了研究比较。针对常用的激活函数在反向传播神经网络中具有收敛速度较慢、存在局部极小或梯度消失的问题,将Sigmoid系和ReLU系激活函数进行了对比,分别讨论了其性能,详细分析了几类常用激活函数的优点及不足,并通过研究Arctan函数在神经网络中应用的可能性,结合ReLU函数,提出了一种新型的激活函数ArcReLU。实验证明,该函数既能显著加快反向传播神经网络的训练速度,又能有效降低训练误差并避免梯度消失的问题。
- 许赟杰徐菲菲
- 关键词:神经网络激活函数
- 基于BTM模型和改进聚类算法的热点话题检测被引量:4
- 2022年
- 随着网络中出现大量的新闻内容,如何在短期内为用户及时发现新闻热点话题越来越受到学者们的关注。提出一种基于BTM模型和改进K-Means聚类算法的中文新闻话题检测模型。对网易新闻语料库引入BTM模型,发现与主题相关的话题词,从而推断热点话题;针对K-Means算法初始值敏感等问题,将基于共轭梯度的人工鱼群算法引入传统的K-Means算法;利用改进K-Means聚类算法对得到的话题词进行聚类。实验结果表明,所提方法与传统方法相比可有效、准确提高话题的准确性。
- 徐菲菲陈赛红田宇
- 关键词:K-MEANS聚类共轭梯度人工鱼群
- 基于注意力机制的Siamese-BiLSTM短文本相似度算法被引量:4
- 2022年
- 提出将注意力机制引入至孪生网络(Siamese Network)结构,通过注意力机制对句子中单词进行重要性评分,以双向长短时记忆网络(BiLSTM)作为基准系统,获得文本语义的深层次特征表示,从而有效地提升短文本相似度的准确率。实验采用通用公开标注数据集Quora语句对集和蚂蚁金服句对集,结果表明,与传统神经网络以及Siamese-Net网络相比,所提出的算法在短文本相似度总体效果上有明显提升,验证了所提算法的有效性。
- 徐菲菲冯东升
- 关键词:相似度
- 中文文本主题聚类算法研究综述被引量:4
- 2021年
- 相对于传统的纸媒体,网络媒体中的数据具有更新速度快、用户参与度高、覆盖面广等特点。如何协助用户在较短时间了解网络媒体中的主题信息,是一个亟待研究的领域。目前,文本主题聚类的研究技术还不够成熟,且在国内处于不断研究的阶段,尤其是在中文文本领域。对国内外主题检测研究现状、主题挖掘基本步骤、聚类算法的优缺点等方面进行了系统的概述,指出了当前研究方法的不足以及未来可研究的方向。
- 徐菲菲陈赛红
- 关键词:聚类中文文本主题检测主题挖掘