教育部科学技术研究重点项目(207018)
- 作品数:8 被引量:22H指数:3
- 相关作者:李德玉王素格南瑞贤张雪芬贾俊芳更多>>
- 相关机构:山西大学山西大同大学上海大学更多>>
- 发文基金:教育部科学技术研究重点项目国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 一种有效的高维分类数据聚类方法研究被引量:2
- 2011年
- 随着数据规模的不断增大,提高K-modes聚类算法或模糊K-modes聚类算法的运行效率成为了一个重要问题.为了提高其算法执行效率,提出了一种基于分治法的高维分类数据聚类方法.该方法并不是一次性对所有的数据进行聚类,而是将分类数据集分成若干个子集,对每个子集同时进行聚类,最后对聚类结果进行融合以形成最终的聚类结果.实验结果表明大多数情况下较传统的方法在聚类的速度上有显著的提高.
- 贾俊芳李德玉
- 关键词:聚类分析模糊聚类分治法分类数据评价指标
- 基于支持向量机的文本倾向性分类研究被引量:6
- 2008年
- 文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.
- 王素格杨安娜李德玉魏英杰李伟张武
- 关键词:支持向量机信息增益
- 相对知识粒度序决策表的属性约简方法
- 2011年
- 序决策表中的知识约简越来越受到关注,在优势类和知识粒度的基础上,引入了序决策表中的一种知识相对粒度,度量了属性集在序决策表中的相对不确定性,进而给出了属性相对重要度的定义。并设计了序决策表的一种启发式属性约简算法,通过实例分析和验证了算法的有效性。
- 贾俊芳
- 一种基于区间数偏离度的方案排序方法被引量:3
- 2010年
- 针对特征取值为区间数的方案排序问题,提出两个区间数的偏离度概念用以构造方案间的偏离度矩阵,并给出一种基于总体偏离度优化的特征权重确定方法.利用提出的区间数向量的相对贴近度概念刻画一个方案接近于另一个方案的程度,进而对候选方案的优劣排序.该方法提出的各种度量较直观、易于理解,并通过实例验证方法的有效性和实用性.
- 徐艳霞李德玉胡建龙
- 关键词:区间数区间值信息系统
- 基于粗糙集的地学空间关系规则抽取和应用——以珠江三角洲土地利用为例被引量:6
- 2009年
- 空间关系反映了地理现象与其环境间的复杂的关联关系,对于地学问题的求解有着重要的作用。因此,有效地抽取地学现象内蕴的主要空间关系规则,将有利于提高地学问题求解的精度和效率。本文探讨了基于粗糙集的地学空间关系表达以及空间关系规则抽取流程。并以珠江三角洲2000年土地利用为例,抽取2000年深圳、香港城镇用地和农村居民点内蕴的空间关系规则。
- 曹峰杜云艳葛咏李德玉温伟
- 关键词:粗糙集土地利用
- 基于统计方法的面向旅游问句分类实验研究被引量:3
- 2009年
- 根据旅游领域知识的特点,设计了面向旅游问句的分类体系。利用信息增益、互信息、交叉熵和2χ统计四种特征选择方法及支持向量机分类器,对网上常见的旅游真实问句分类进行了实验研究,实验结果表明:在现有问句分类体系下,信息增益的特征选择方法在特征空间维数为550维时,分类旅游问句的结果是最佳的。
- 张雪芬李德玉王素格南瑞贤
- 关键词:支持向量机