您的位置: 专家智库 > >

河北省科技支撑计划项目(10213581)

作品数:8 被引量:22H指数:3
相关作者:刘金岭王新功周泓杨凤霞刘国香更多>>
相关机构:淮阴工学院沧州师范学院更多>>
发文基金:河北省科技支撑计划项目淮安市科技支撑计划(工业)项目更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 7篇自动化与计算...
  • 1篇文化科学

主题

  • 5篇短信文本
  • 3篇信息流
  • 3篇聚类
  • 2篇文本
  • 2篇聚类方法
  • 2篇类方
  • 1篇迭代
  • 1篇迭代收敛
  • 1篇短信
  • 1篇语义信息
  • 1篇知网
  • 1篇手机
  • 1篇手机短信
  • 1篇数据库
  • 1篇特征词
  • 1篇统计信息
  • 1篇权值
  • 1篇文本聚类
  • 1篇文本相似度
  • 1篇文摘

机构

  • 8篇沧州师范学院
  • 8篇淮阴工学院

作者

  • 8篇刘金岭
  • 4篇王新功
  • 3篇周泓
  • 2篇刘国香
  • 2篇杨凤霞
  • 1篇宋连友
  • 1篇刘丹
  • 1篇范玉虹
  • 1篇倪晓红

传媒

  • 2篇计算机工程
  • 1篇计算机工程与...
  • 1篇计算机应用与...
  • 1篇情报杂志
  • 1篇微电子学与计...
  • 1篇现代图书情报...
  • 1篇中文信息学报

年份

  • 1篇2015
  • 2篇2013
  • 5篇2012
8 条 记 录,以下是 1-8
排序方式:
多对象RkNN查询在空间数据库中的应用被引量:1
2012年
针对空间数据库的RkNN查询概念和多个对象的查询特点设计了相关算法.对于一组查询Q,先是生成查询Q的最小圆域DOM(O,R),然后求出RkNN查询的初始化区域,最后通过消除查询错误数据点得到RkNN查询结果.通过对真实数据集进行的大量实验表明,文中提出的算法效率明显优于目前最好的反RkNN算法.
刘金岭杨凤霞刘国香
关键词:空间数据库
手机短信文本信息流的自动文摘生成被引量:4
2013年
针对手机短信文本信息流的特点,设计一种自动文摘生成模型。该模型利用词共现定义语义相似度,根据TF-IDF定义特征词权值以及文摘候选句权值。算法通过清除孤立点、根据权值筛选文摘句以及文摘句排序,生成冗余度较小且可读性较好的短信文本信息流文摘。相关数据实验证明,文摘句的生成质量和算法效率都比较高。
刘金岭倪晓红王新功
关键词:信息流文摘权值
基于短文本信息流的回顾式话题识别模型被引量:3
2015年
近几年来,短文本信息流广泛应用于一些全民媒体,它在公开传递信息同时携带了丰富且具有极大价值的信息资源。该文提出了一种回顾式话题识别模型,改进了权值计算方法,有效提取了具有较强分辨话题能力的关键词,在聚类过程中将BIC值作为话题类别合并依据,提高了聚类的准确率。通过进行时间段分隔和去掉孤立点信息提高了算法的效率。实验结果表明,该方法有效地提高了短文本信息流的话题检测准确率和效率。
周泓刘金岭王新功
关键词:信息流聚类
基于中文短信文本聚类的热点事件发现被引量:4
2013年
随着通信事业的快速发展,短信文本信息量非常巨大,乃至亿级,同时大类别短信文本中隐含着热点事件。现有聚类算法对海量短信文本进行聚类分析显得力不从心。利用短信文本在给定时间段中的内聚性,对待聚类的短信文本进行排序,并在聚类过程中清除孤立信息和小类别短信文本。实验表明,对于海量短信文本的大类别聚类效率是非常高的。
刘金岭王新功
基于知网的中文短信文本词汇链抽取方法
2012年
提出一种基于知网的中文短信文本词汇链抽取方法。根据知网的语义关系,利用相同语义类给出上下文词汇项信息,构造多条词汇链,表达短信文本的多条叙事线索,从中抽取富含短信文本信息的词汇链,表达短信文本的语义信息,采用词汇链的关键词集合进行文本分类。实验结果证明,该方法的抽取准确率较高,文本分类速度较快。
刘金岭刘丹周泓
关键词:知网短信文本词汇链关键词统计信息
基于手机短信信息流的热点事件识别被引量:3
2012年
随着手机通信技术的快速发展,短信文本数据流作为载体携带了越来越多的信息资源。为了挖掘出短信文本信息流中富含的一些舆论焦点、社会热点问题,提出热点事件识别算法。该算法采用词共现频度定义特征词相关度,综合前导信息集合及信息产生频率给出短信文本相似度,进而设计基于Single-Pass聚类模型的短信文本信息流在线分检算法。在真实数据集上实验表明,各项性能指标都有不同程度的提高。
刘金岭王新功周泓
关键词:短信文本信息流
基于初始中心迭代收敛的文本聚类方法
2012年
利用两三次的K-Means迭代得到初始簇的中心,选择一组具有良好区分度的方向构建IMIC坐标系,在该坐标系下,构造出各坐标轴的重新标度函数用以提高聚类决策的有效性。算法IMIC经过多次迭代,最后收敛到最终解。IMIC算法的时间复杂度与K-Means保持在同一量级上。实验结果表明,IMIC算法有较好的聚类质量。
刘金岭刘国香杨凤霞
关键词:迭代收敛文本聚类
基于语义信息的中文短信文本相似度研究被引量:9
2012年
在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加权,给出2篇短信文本相似度的计算方法。实验结果表明,该方法在F-度量值上优于TF-IDF算法及词语语义相似度算法。
刘金岭宋连友范玉虹
关键词:短信文本相似度特征词向量空间模型
共1页<1>
聚类工具0