彭云
- 作品数:33 被引量:200H指数:8
- 供职机构:江西师范大学更多>>
- 发文基金:江西省自然科学基金国家自然科学基金江西省高校人文社会科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学理学自然科学总论更多>>
- 时序化LDA的舆情文本动态主题提取被引量:3
- 2016年
- 随着互联网的发展,网络上产生了大量的舆情文本,提取这些文本的主题可以获取舆情的话题热点和演化趋势。由于舆情文本数据量巨大,并且主题具有随时间动态变化的特点,提出一种加入时间约束先验的LDA主题模型TC-LDA(Time Constrained LDA)。TC-LDA可以将文本数据转化为主题向量,大大降低了文本表示的维度,同时加入时间约束知识后实现了LDA的时序化转换,可以提高LDA捕捉动态主题的能力。实验结果表明,TC-LDA在主题词提取的准确率和召回率上与同类主题模型比较,具有更好的效果。
- 万红新彭云郑睿颖
- 关键词:LDA主题模型
- 融合语义关联和文本降维的社交媒体主题提取
- 2021年
- 随着互联网的普及,社交媒体平台上积累了大量的文本数据,并逐渐形成社交媒体文本大数据。这些文本数据的语法和语义结构复杂,需要运用数据挖掘、自然语言处理等相关技术提取关键词。基于此,笔者提出融合语义关联知识和文本降维模型的社交媒体主题提取模型。实验表明,该模型对复杂网络文本数据的主题提取具有较好的性能。
- 彭云万红新
- 关键词:语义关联主题模型社交媒体
- 基于语义约束LDA的商品特征和情感词提取被引量:54
- 2017年
- 随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
- 彭云万常选江腾蛟刘德喜刘喜平廖国琼
- 关键词:LDA模型语义约束
- 多媒体积件系统的开发与教学运用被引量:5
- 2006年
- 介绍了积件技术的背景、意义和体系结构,阐述了多媒体积件系统的开发技术,对于积件系统的网络化和智能化技术进行了探索。
- 万红新彭云
- 关键词:多媒体计算机辅助教学积件
- 语义约束和时间关联LDA的社交媒体主题词链提取被引量:3
- 2018年
- 网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率.
- 万红新彭云
- 关键词:社交媒体主题模型语义约束LDA模型
- ARMRDB模型中的聚类分析和规则提取
- 本文以江西省自然科学基金项目“数据挖掘的系统模型研究与实现”为课题主体,在深入研究模糊集理论和粗糙集理论和广泛了解国内外数据挖掘发展现状的基础上,提出了ARMRDB/(Association Rules Mining i...
- 彭云
- 关键词:关联规则模糊集粗糙集聚类分析属性约简
- 文献传递
- 模糊聚类分析系统的研究与实现被引量:2
- 2004年
- 本文提出了一个在关系数据库中实现模糊聚类的模型系统,阐述了该系统实现聚类的方法和过程,对于如何减少噪声数据的干扰、提高聚类分析的有效性和增强算法的鲁棒性等方面,进行了研究和探索。
- 万红新彭云聂承启
- 关键词:数据挖掘聚类模糊集聚类分析
- 操作系统自适应考试系统的设计与实现被引量:11
- 2001年
- 介绍了计算机操作系统自适应考试系统的自适应考试的基本理论、设计思想以及该系统的基本功能和实现技术。
- 彭云聂承启
- 关键词:操作系统自适应考试系统计算机
- 一种基于粗糙集的Web文本搜索算法被引量:1
- 2009年
- Web文本搜索是搜索引擎的重要功能,但是往往搜索的文本关联程度不高,大量搜索的文本结果不是关注度和兴趣度很高的文本集合。提出了基于粗糙集的Web文本搜索技术,直接从给定待搜索的文本关键词出发,通过不可分辨关系和不可分辨类确定搜索文本的内容约简,导出搜索文本的关联或分类规则,在一定程度上可以提高搜索文本的关联度和内聚度,约简文本搜索的结果集合,改善文本搜索的鲁棒性和有效性。
- 彭云万红新
- 关键词:粗糙集文本搜索搜索引擎
- 新型多媒体网络课程的构建研究
- 2005年
- 随着教育需求的不断扩大,以及新的计算机技术和通信技术的发展,原有的多媒体网络课程难以满足日益增长的教学和学习的需要。本文就如何构建新型的多媒体网络课程,从构建原则、构建思想和构建平台等方面进行了研究和探索。
- 彭云
- 关键词:网络课程建构主义积件