您的位置: 专家智库 > >

李晓红

作品数:12 被引量:54H指数:5
供职机构:西北师范大学计算机科学与工程学院更多>>
发文基金:国家自然科学基金甘肃省中青年科技研究基金甘肃省自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 11篇期刊文章
  • 1篇学位论文

领域

  • 11篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇文本
  • 3篇文本分类
  • 3篇相似度
  • 3篇矩阵
  • 2篇统计信息
  • 2篇中文
  • 2篇中文文本
  • 2篇中文文本分类
  • 2篇词项
  • 1篇带权
  • 1篇带权图
  • 1篇等式
  • 1篇短文
  • 1篇信息技术
  • 1篇信息技术与课...
  • 1篇信息技术与课...
  • 1篇信息增益
  • 1篇用户
  • 1篇语义相似
  • 1篇语义相似度

机构

  • 10篇西北师范大学
  • 2篇北京师范大学
  • 2篇兰州理工大学

作者

  • 12篇李晓红
  • 6篇马慧芳
  • 2篇曾宪桃
  • 2篇何廷年
  • 1篇鲁小勇
  • 1篇樊斌
  • 1篇蒋芸
  • 1篇宿云
  • 1篇张永
  • 1篇朱志强
  • 1篇曹林
  • 1篇谢蒙

传媒

  • 7篇计算机工程
  • 1篇计算机应用与...
  • 1篇数学教学研究
  • 1篇计算机工程与...
  • 1篇甘肃科技纵横

年份

  • 1篇2017
  • 5篇2016
  • 1篇2015
  • 4篇2009
  • 1篇2006
12 条 记 录,以下是 1-10
排序方式:
改进多种群差分进化算法的混沌系统参数估计被引量:6
2015年
针对混沌系统参数估计的多峰寻优问题,提出一种改进的多种群差分进化算法。改进差分进化算法的变异操作,使其前期更适合全局性搜索,利用α核心集对当前种群进行聚类,分别对聚类后的子群选用贪婪的差分变异算子完成深度搜索,比较所选取各子群的最优值,得到全局最优值作为是否结束搜索的判断依据,并将其应用到混沌系统参数估计中。实验结果表明,该算法对于多峰值、大空间的全局性参数估计在收敛速度、精度上优于混合量子进化算法、改进粒子群优化算法以及DE/best/2算法。
何廷年李晓红蒋芸
关键词:差分进化混沌系统参数估计多种群
中文文本分类技术研究
随着Internet技术的不断发展和成熟,各种数字化的信息越来越多并且还在不断增长,面对海量信息,人们已经不能简单地靠人工来处理所有的信息,况且手工分类已经对此无能为力,如何从巨量的信息中挖掘出用户感兴趣的信息已经成为当...
李晓红
关键词:中文文本分类特征选择算法最大熵模型不等式
文献传递
融合统计信息与语义相似度的特征扩展算法
2017年
通过分析短文本的高维性和稀疏性,提出一种融合特征词间统计信息与语义相似度的短文本特征扩展算法。根据词的贡献度对候选特征集进行筛选,得到扩展集合初始值。计算特征词之间的统计相关度,构建二元相关词对集合。利用外部知识库知网中的语义关系获取相关词对的义项集合并计算语义相似度,将满足条件的义项扩展为短文本的特征词,得到扩展后的特征集。实验结果表明,使用该算法对短文本进行特征扩展后,可显著提升分类器的分类效果。
李晓红曹林宿云马慧芳
关键词:语义相似度知网
信息技术与数学教学的整合被引量:2
2009年
“课程整合”的教学模式是我国21世纪基础教育教学改革的新型教学模式.它改变了传统以教师为中心的教学结构和教学模式,积极创造有利备件。从而达到培养学生创新精神.它的研究与实施为学生主体性、创造性的发挥创设了良好的基础,使学校教育朝着自主的、有特色的课程教学方向发展.那么它与数学的结合是利用信息技术所特有的优势来优化数学教学的目的.
李晓红
关键词:信息技术与课程整合理解力
一种基于谱分割的短文本聚类算法被引量:1
2016年
短文本具有稀疏高维的特点,现有聚类算法在大规模短文本上的聚类精度较低且效率低下。针对该问题,提出一种以谱聚类理论作支撑,基于谱分割准则RMcut的新聚类算法。依据谱聚类理论,将短文本集合构建成一张带权无向图,并计算得到文档-文档的相似度矩阵,为聚类算法提供信息。不断迭代地用2-way方式划分该图,划分过程中使用RMcut值作为划分是否终止的条件,利用Prim算法将原图中的顶点加入到聚族中,以得到质量较高的聚类结果。实验结果表明,该算法具有较高的时间性能,与K-means算法、词共现聚类算法及基于免疫的聚类算法相比,聚类结果更准确。
李晓红谢蒙马慧芳何廷年
关键词:相似度矩阵聚类算法
改进的频繁词集短文本特征扩展方法被引量:6
2016年
针对短文本结构短小、语义不足、难以建模的特点,提出一种利用改进频繁词集进行短文本特征扩展的方法。通过计算单词集的支持度和置信度,挖掘出具有共现关系和类别同向关系的频繁二元词集,并在挖掘出的频繁词集基础上定义关联关系对所选词集进一步扩充。同时,在TF-IDF的基础上引入词语信息增益表示词语在文本集合中的类别分布信息,以加强词语权重。由频繁词集通过改进后的词语权重构造出词语相似性矩阵,利用非负矩阵分解技术将其扩展至短文本特征空间,从而得到短文本模型。实验结果表明,该方法构造的短文本模型能显著提升短文本的聚类性能。
马慧芳曾宪桃李晓红朱志强
关键词:词语权重信息增益非负矩阵
基于离散粒子群优化的微博热点话题发现算法被引量:8
2016年
结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信息的挖掘,更新传统文本表示模型,利用DPSO算法从寻优角度发现微博热点话题及简化微博聚类过程,并将聚类质量评价指标作为适应度函数对聚类结果进行不断迭代优化,获得聚类结果的最优解。实验结果表明,该算法能够在大量微博中快速发现热点话题,具有较高的热点话题发现准确性及运行效率。
马慧芳吉余岗李晓红周汝南
关键词:粒子群优化
一种融合词项关联关系和统计信息的短文本建模方法
2016年
传统文本表示方法通常基于词袋模型,而词袋模型是基于文本中词项之间是相互独立的假设。最近也提出一些通过词共现来获取词项之间关系的统计分析方法,却忽略了词项之间的隐含语义。为了解决传统文本表示方法词袋模型对文本语义的忽略问题,提出一种融合词项关联关系和统计信息的短文本建模方法。通过词语之间的内联及外联关系耦合得到词语关联关系,充分挖掘了显示和隐含的语义信息;同时以关联关系作为初始词语相似度,迭代计算词语之间及文本之间的相似度,改善了短文本的表示。实验证明,该方法显著地提高了短文本聚类的性能。
马慧芳曾宪桃李晓红贠宁
关键词:词语相似度文本相似度
计算机校园网络建设浅议被引量:1
2006年
网络时代的即将到来,给人类教育带来的冲击是前所未有的,同时它也为教育提供了实现飞跃的机遇。教育要面向现代化、面向世界、面向未来,首先要面向网络。教育只有与网络有机结合,才能跟上时代的发展。只有充分有效的应用校园网络,才能导致整个教学模式与教育观念的彻底变革,才能适用新世纪培养高素质的创造型和复合型人才的需要。
李晓红
关键词:局域网校园网建设
中文文本分类中的特征词抽取方法被引量:19
2009年
针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有机的结合起来,构成新的特征选择方法。这种新方法综合考虑了特征的各类信息,从而更加准确地选取文本中的有效特征词,并且试验结果也验证了这种改进算法的可行性和有效性。
李晓红
关键词:特征抽取无词典分词文本分类
共2页<12>
聚类工具0