公共文化服务平台

曾雪强: 作品数：33 被引量：105H指数：6; 供职机构：江西师范大学计算机信息工程学院更多>>; 发文基金：国家自然科学基金江西省自然科学基金教育部科学技术研究重点项目更多>>; 相关领域：自动化与计算机技术文化科学医药卫生更多>>

合作作者

基于核方法的潜在语义文本分类模型: 在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,...; 罗远胜王明文曾雪强; 关键词：文本分类核方法偏最小二乘核偏最小二乘; 文献传递

融合Emoji情感分布的多标签情绪识别方法: 2024年; 随着基于互联网的社交媒体兴起,Emoji由于具有以图形化方式快速准确地表达情绪的特点,目前已经成为用户在日常交流中广泛使用的图像文本。已有研究工作表明,在基于文本的情绪识别模型中考虑Emoji信息,对于提升模型性能具有重要的作用。目前,考虑Emoji信息的情绪识别模型大多采用词嵌入模型学习Emoji表示,得到的Emoji向量缺乏与目标情绪的直接关联,Emoji表示蕴含的情绪识别信息较少。针对上述问题,该文通过软标签为Emoji构建与目标情绪直接关联的情感分布向量,并将Emoji情感分布信息与基于预训练模型的文本语义信息相结合,提出融合Emoji情感分布的多标签情绪识别方法(Emoji Emotion Distribution Information Fusion for Multi-label Emotion Recognition,EIFER)。EIFER方法在经典的二元交叉熵损失函数的基础上,通过引入标签相关感知损失对情绪标签间存在的相关性进行建模,以提升模型的多标签情绪识别性能。EIFER方法的模型结构由语义信息模块、Emoji信息模块和多损失函数预测模块组成,采用端到端的方式对模型进行训练。在SemEval2018英文数据集上的情绪预测对比实验结果表明,该文提出的EIFER方法比已有的情绪识别方法具有更优的性能。; 刘烨刘仕鑫曾雪强左家莉; 关键词：情绪识别

潜在语义分类模型的中文分类性能研究: 潜在语义分类模型是针对潜在语义索引模型会丢失某些对分类贡献很大的特征问题进行扩展提出的文本分类模型.通过引入一组新的潜在语义变量,潜在语义分类模型同时考虑了文档集的词信息和类别信息.在以前研究工作的基础上,对潜在语义分类...; 曾雪强王明文陈素芬; 关键词：文本分类潜在语义索引偏最小二乘; 文献传递

数据科学新工科专业“12345”课外实践教学改革探索: 2023年; 数据科学与大数据技术作为高校近几年开设的新工科专业,如何培养学生的创新意识,提高学生解决实际问题的能力,是当前专业建设中面临的迫切问题。文章提出了“项目驱动、竞赛激励、教师指导、学研结合”的课外实践教学改革总体思路和“12345”课外实践教学改革方案,并提出以“搭平台、建机制、抓活动(项目+竞赛)、出成果”逻辑思路,通过强化平台和机制建设,抓项目研发和学科竞赛活动等措施,培养学生的创新意识和提高学生解决实际问题的能力。为新工科专业课外实践教学提供了有益参考。; 钟茂生吴水秀曾雪强罗玮; 关键词：课外实践教学

潜在语义分类模型的研究: 文本自动分类是组织和管理文本信息的有力手段,可以在较大程度上解决信息杂乱无章的问题,使用户更容易更准确地定位所需的信息.目前,文本自动分类是信息检索(Information Retrieval:IR)领域中最前沿的研究热...; 曾雪强; 关键词：文本分类潜在语义索引偏最小二乘回归; 文献传递

中文礼貌风格迁移的研究: 2023年; 该文研究了一个关于中文的礼貌迁移任务,该任务旨在保留原始文本的内容和意义的同时,将非礼貌的文本转换为礼貌的文本。针对这个任务,建设了一个中文礼貌风格迁移的语料库。并基于此,构建了结合文本对齐模块和流畅度评估模块的中文礼貌风格迁移模型,文本对齐模块在保证文本风格迁移的同时保留文本的内容,流畅度评估模块可以提升生成文本的流畅度。在中文语料库和英文语料库的实验表明,该方法在内容保存度和流畅度这两个指标上都有较强的竞争力。; 朱洪坤左家莉何思兰曾雪强王明文

基于情感词和多任务卷积神经网络的文本情感分布学习: 2023年; 不同于传统的情感分析范式,情感分布学习采用与示例关联的情感分布对多种情绪进行定量建模,可以较好地处理具有情绪模糊性的情感分析任务。针对现有情感分布学习方法缺乏考虑文本分析任务特有的情感词语言学先验知识的问题,该文提出一种基于情感词和多任务卷积神经网络(Lexicon enhanced Multi-Task Convolutional Neural Network,LMT-CNN)的文本情感分布学习模型,用于预测文本的情感分布和情绪标签。LMT-CNN模型的网络结构由文本语义信息模块、情感词的情感知识模块和多任务预测模块组成,采用端到端方式进行模型训练和预测。在7个常用的文本情感数据集上的对比实验结果表明,LMT-CNN模型具有比已有的情感分布学习方法更优的情感分布预测和情绪分类性能。; 江晨琳曾雪强郭小奉东雨畅左家莉王明文

基于核方法的潜在语义文本分类模型被引量：9: 2005年; 在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳。而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高。为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型。该模型比LSC模型能更好地表示文档空间的潜在语义结构信息。在R eu ter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能。; 罗远胜王明文曾雪强; 关键词：文本分类核方法潜在语义索引

基于程序设计竞赛的计算机创新型人才培养探索: 2023年; 创新型人才培养是高等院校应用型本科人才培养的重要目标,鼓励学生参加程序设计竞赛是提高计算机专业学生创新实践能力的有效途径之一。结合近几年江西师范大学计算机信息工程学院程序设计竞赛集训队的实践,探索并提出基于程序设计竞赛的创新型人才培养新模式,采用三级分队方式进行队员管理,以教练指导与队员以老带新相互结合的模式组织日常训练,通过各项竞赛实战强化提高队员的程序设计水平。新模式在创新型人才培养的实践中取得了良好的效果,江西师范大学在近年的各大程序设计竞赛中取得了优异成绩。; 曾雪强卢家兴吴水秀; 关键词：创新型人才培养程序设计竞赛程序设计能力实践教学

基于潜在语义的多类文本分类模型研究被引量：27: 2005年; 在文本分类中,一个文本往往有多类属性,而目前大多数分类模型均为二元分类模型。因此,提出一种基于潜在语义的多类分类模型。该模型同时考虑文档特征信息和文档的类属信息,在提取文档潜在语义信息的同时把对文档分类贡献大的特征信息保留下来。其结果是既能较好地解决文档中同义词和多义词的问题,又能解决多类属分类问题,并且能够探测到新类。在R eu ters文档集上的实验表明,在维数较低的情况下,分类效果比较好,性能比较稳定。; 叶浩王明文曾雪强; 关键词：多类分类潜在语义偏最小二乘

曾雪强

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

曾雪强

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈