您的位置: 专家智库 > >

安徽省高校省级自然科学研究项目(KJ2009A63)

作品数:4 被引量:9H指数:2
相关作者:蔚承建焦庆争更多>>
相关机构:安徽师范大学南京工业大学更多>>
发文基金:国家自然科学基金安徽省高校省级自然科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 4篇语言处理
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇文本分类
  • 2篇文本分类方法
  • 2篇类方
  • 1篇信任
  • 1篇信任机制
  • 1篇可靠度
  • 1篇可信计算
  • 1篇标准差

机构

  • 4篇安徽师范大学
  • 4篇南京工业大学

作者

  • 4篇焦庆争
  • 4篇蔚承建

传媒

  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇计算机工程与...

年份

  • 3篇2010
  • 1篇2009
4 条 记 录,以下是 1-4
排序方式:
高效的信任机制线性文本分类方法
2010年
基于信任机制设计了一种无须特征选择的高效的线性文本分类方法。面向特征与文档类的信任关系,使用bata概率密度函数评估特征的可靠度,提出特征对文档类的忠诚度的计算模型,基于忠诚度实现简单的线性文本分类器。采用20Newsgroup、复旦中文分类语料、SEWM2007评测语料等3个具有典型特征的单标签语料集,以朴素贝叶斯、KNN为比照算法进行了比较实验。实验结果表明,相对于传统算法,该算法分类性能显著提高,对不均匀语料和高维特征处理表现出很强的稳定性,同时算法执行速度快,适于大规模文本分类。
焦庆争蔚承建
关键词:文本分类信任机制可靠度自然语言处理
分布权值调节概率标准差的文本分类方法被引量:2
2009年
针对文本分类问题,基于特征分布评估权值调节特征概率标准差设计了一种无须特征选择的高效的线性文本分类器。该算法的基本思路是使用特征概率标准差量化特征在文档类中的离散度,并作为特征的基础权重,同时以后验概率的Beta分布函数为基础,运用概率确定性密度函数,评估特征在类别中的分布信息得到特征分布权值,将其调节基础权重得到特征权重,实现了线性文本分类器。在20Newsgroup、复旦中文分类语料、Reuters-21578三个语料集进行了比较实验,实验结果表明,新算法分类性能相对传统算法优势显著,且稳定、高效、实用,适于大规模文本分类任务。
焦庆争蔚承建
关键词:文本分类自然语言处理
一种基于特征投票的文本分类方法被引量:1
2010年
基于特征投票机制设计一种线性文本分类方法,运用信任机制理论分析文档类别对特征的信任关系,给出具体特征信任度的模型,并在Newsgroup、复旦中文分类语料、Reuters-21578 3个广泛使用且具有不同特性的语料集上与传统方法进行比较。实验结果表明,该方法分类性能优于传统方法且稳定、高效,适用于大规模文本分类任务。
焦庆争蔚承建
关键词:文本分类自然语言处理
一种可靠信任推荐文本分类特征权重算法被引量:6
2010年
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。
焦庆争蔚承建
关键词:文本分类可信计算自然语言处理
共1页<1>
聚类工具0