您的位置: 专家智库 > >

陈智敏

作品数:4 被引量:6H指数:2
供职机构:广西大学计算机与电子信息学院更多>>
发文基金:国家自然科学基金广西壮族自治区自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 2篇漂移
  • 2篇中文
  • 2篇向量
  • 2篇关联词
  • 2篇KNN算法
  • 1篇多向量
  • 1篇要素提取
  • 1篇语义
  • 1篇语义关联
  • 1篇特征向量
  • 1篇最近邻
  • 1篇最近邻算法
  • 1篇文本
  • 1篇文本分类
  • 1篇文本特征
  • 1篇结合语义
  • 1篇改进KNN
  • 1篇KNN
  • 1篇K最近邻算法

机构

  • 4篇广西大学

作者

  • 4篇陈智敏
  • 3篇林啟锋
  • 3篇蒙祖强
  • 1篇陈秋莲

传媒

  • 1篇计算机应用
  • 1篇小型微型计算...
  • 1篇计算机工程与...

年份

  • 1篇2014
  • 3篇2013
4 条 记 录,以下是 1-4
排序方式:
结合语义和文本特征位串的高效KNN算法被引量:1
2013年
为了有效提高文本分类的效率,提出了一种基于语义相似的改进KNN算法。该算法结合了特征词的语义和文本的特征位串,由于考虑到文本向量中同义的关联特征词对文本相似度的贡献,有效地提高了文本分类的准确率和召回率;而基于文本特征位串进行的位计算方法,能从大量的训练文本集中筛选出可能的相似文本,较好地克服了KNN算法计算量大的问题。算法的分析与实验表明,改进的算法明显提高了KNN的计算效率,同时也提高了分类的准确率和召回率。
林啟锋蒙祖强陈秋莲陈智敏
关键词:语义关联K最近邻算法文本分类
中文报道关系识别与话题跟踪研究
随着网络技术飞速发展,网络信息规模急剧增大,提供自动高效的信息处理技术处理大规模新闻信息成为了必然。话题检测与跟踪是以新闻数据流为研究对象,通过对话题的发现、识别和追踪,为用户呈现组织后的话题结果,这对舆情分析,信息调研...
陈智敏
关键词:KNN算法
基于要素提取关联词对的中文报道关系检测被引量:2
2013年
针对现有中文报道关系检测的检测代价即误报率和丢失率较高的问题,在多向量空间模型基础上提取不同向量的要素(时间、地点、人物和内容)特征词组成关联词对,使用支持向量机(SVM)方法整合关联词对相似度和余弦相似度,从而提出了一种提取要素关联词对报道关系检测方法。所提方法补充表示了报道内容,为检测提供了更多的比较依据,识别代价降低了将近11%。实验结果验证了算法的有效性。
陈智敏蒙祖强林啟锋
基于改进KNN的话题跟踪算法被引量:2
2014年
针对现有的话题跟踪中由于数据不平衡性和话题漂移性造成误报率和丢失率较高的问题,在类别选择的基础上,以话题为单位的邻近报道最大平均相似度代替最大相似度和作为跟踪报道的判定依据,更新话题特征向量,从而提出一种基于改进KNN的话题跟踪算法.所提方法解决了由于数据不平衡和话题漂移带来的跟踪代价较高的问题.实验结果中识别代价降低了7%,验证了算法的有效性.
陈智敏蒙祖强林啟锋
关键词:特征向量KNN
共1页<1>
聚类工具0