您的位置: 专家智库 > >

米晓芳

作品数:5 被引量:4H指数:2
供职机构:烟台大学计算机学院更多>>
发文基金:山东省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 5篇自动化与计算...

主题

  • 4篇语义索引
  • 4篇索引
  • 4篇潜在语义
  • 4篇潜在语义索引
  • 4篇文本分类
  • 3篇语义
  • 3篇语义差异
  • 3篇网页
  • 2篇网页分类
  • 2篇SVM算法
  • 1篇特征抽取
  • 1篇网页聚类
  • 1篇文本挖掘
  • 1篇聚类
  • 1篇包含度
  • 1篇SVM
  • 1篇FCM聚类
  • 1篇抽取

机构

  • 5篇烟台大学

作者

  • 5篇米晓芳
  • 4篇宋宜斌
  • 4篇王立宏
  • 3篇秦洋

传媒

  • 1篇计算机工程
  • 1篇烟台大学学报...
  • 1篇2007年北...

年份

  • 3篇2008
  • 2篇2007
5 条 记 录,以下是 1-5
排序方式:
基于潜在语义差异的医学网页聚类被引量:2
2008年
采用潜在语义索引的全局模型和局部模型表示医学网页时,模糊聚类结果的类间包含度很大。该文提出一种新的潜在语义差异模型,将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用FCM算法进行聚类并计算类间包含度。实验发现,对给定的5类医学网页进行聚类时,采用差异模型时的类间包含度平均约为全局模型的85%、局部模型的80%。
米晓芳秦洋王立宏宋宜斌
关键词:潜在语义索引文本挖掘FCM聚类包含度
基于潜在语义差异的医学网页分类
通过分析潜在语义索引的各种模型提出一种新的潜在语义差异模型。将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用SVM算法进行分类并计算分类正确率和F<,1>指标。实验发现:在差异模型表示下,分...
米晓芳秦洋王立宏宋宜斌
关键词:潜在语义索引文本分类SVM算法
文献传递
基于潜在语义差异的医学网页分类
通过分析潜在语义索引的各种模型提出一种新的潜在语义差异模型。将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用 SVM 算法进行分类并计算分类正确率和 F指标。实验发现:在差异模型表示下,分类...
米晓芳秦洋王立宏宋宜斌
关键词:潜在语义索引文本分类
文献传递
一种潜在语义索引差异模型被引量:2
2008年
通过对全局模型和局部模型的分析,提出一种新的潜在语义索引差异模型,能将类别信息反应在词项中.以医学网页为实验对象,将网页中的文本抽取出来并分别用全局模型和差异模型表示,采用SVD和SLSI降维,利用SVM算法进行分类并计算分类正确率和F1指标.实验发现:采用差异模型表示时,2种降维技术下分类正确率和F1指标较全局模型都有明显提高;同时采用差异模型和SLSI算法并不能对分类结果有更大改善.
米晓芳王立宏宋宜斌
关键词:潜在语义索引文本分类SVM算法
一种潜在语义索引差异模型及其应用
目前,文本自动分类是信息检索领域中的研究热点之一,传统的文本分类方法是采用词作为特征构建特征向量,但是文本中词的数量非常大,导致了特征向量空间的维数非常高,因此需要对文本进行降维。目前降维技术主要有两种:特征选择和特征抽...
米晓芳
关键词:文本分类特征抽取
文献传递
共1页<1>
聚类工具0