国家教育部博士点基金(20060247039)
- 作品数:36 被引量:308H指数:10
- 相关作者:苗夺谦王睿智冯琴荣徐菲菲魏莱更多>>
- 相关机构:同济大学教育部山西师范大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术建筑科学理学文化科学更多>>
- 决策表属性约简的相对划分粒度表示被引量:13
- 2008年
- 粗糙集理论认为知识就是分类.本文对知识的分类能力给予了量化,提出利用划分粒度来定量地表示知识的分类能力.在划分粒度概念基础上,针对决策表定义了相对划分粒度并研究了它的性质,相对划分粒度可以定量表示决策表的条件属性子集相对于决策属性的分类能力的强弱;最后证明了对一致决策表的属性约简来说,相对划分粒度表示与Pawlak提出的代数表示是等价的.
- 冯琴荣苗夺谦程昳
- 关键词:粗糙集决策表
- 多决策表缺失属性补齐算法的研究被引量:2
- 2009年
- 不完备数据是造成信息系统不确定的主要原因之一,对数据挖掘、知识发现等造成了困难。已有的大多数不完备数据的填补算法主要考虑单个决策表的情况,有关多决策表缺失属性补齐算法却报道不多。为此,首先定义了多决策表的属性综合重要性;并以此为启发式信息,基于多决策表的内在关联性,依次补齐缺失属性;最后,实验证明该算法是有效可行的。
- 焦娜苗夺谦张红云
- 关键词:粗糙集理论
- 基于模糊粗糙集的知识系统证据推理被引量:1
- 2008年
- 针对 Dubois 模糊粗糙集、Radzikowska 模糊粗糙集、双论域上的模糊粗糙集,分别定义各自对应的模糊信任(似然)函数,证明模糊信任(似然)函数等于其对应的模糊集的下(上)近似质量,据此建立模糊决策表的证据推理模型.实例表明,该模型是行之有效的.
- 程昳苗夺谦冯琴荣
- 关键词:模糊粗糙集
- 基于层次分类的脱机手写字符识别被引量:1
- 2009年
- 人类在进行字符识别活动时,会根据对象复杂度的不同,采用不同的识别方法。对于结构简单的字符,利用宏观整体信息识别;对于易混淆的形近字,利用微观具体信息区分。为了模拟人类智能进行字符识别活动的过程,设计了一种基于层次分类的脱机手写字符识别算法。该算法将分类器划分为宏观层和微观层,宏观层模拟简单字符识别过程,利用基于梯度的统计特征描述整体信息,完成识别;微观层模拟形近字识别过程,利用基于主曲线的结构特征描述具体信息,完成区分。算法还引入了可信度概念,用以量度推理过程及识别结果的不确定性程度。给出了形近字的定义及区分规则。实验表明,提出的算法有效地提高了脱机手写字符的识别率,对形近字的区分效果尤佳。
- 王云鹏苗夺谦岳晓东
- 关键词:手写字符识别形近字主曲线
- 一种对奇异值不敏感的ISOMAP被引量:3
- 2007年
- ISOMAP是一种经典的非线性降维方法,能够有效地发现高维非线性数据集的低维几何结构,但该算法对奇异值和噪声非常敏感。利用具有鲁棒性的主成分分析(Robust PCA)来探测奇异点,并对奇异点进行适当处理以降低ISOMAP对其的敏感程度。所提出的算法直观且易于理解,实验结果也证明它具有较好的鲁棒性,而且在奇异点较多的情况下仍能保持数据的整体结构。
- 魏莱王守觉徐菲菲
- 关键词:流形学习主成分分析等度规映射
- 一种自适应邻域选择算法被引量:3
- 2008年
- 提出一种自适应邻域选择算法,适用于所有基于局部的流形学习算法.该算法能够根据数据集分布的不同密度和曲率选择合适的邻域大小,同时结合局部多维尺度变换(LMDS),在合适的邻域下直接降维并通过全局整合得到数据集的低维坐标.实验表明该算法可较好恢复较复杂数据集的低维几何结构.
- 魏莱王守觉徐菲菲
- 关键词:流形学习非线性降维
- 知识的划分粒度表示法被引量:14
- 2009年
- 对知识的分类能力给予量化,提出一种知识表示法——划分粒度表示法,利用划分粒度可定量表示知识的分类能力.首先给出粗糙集理论中主要概念的代数表示,其次定义知识的划分粒度并研究它的性质,最后证明知识的代数表示与划分粒度表示是等价的.
- 冯琴荣苗夺谦程昳徐菲菲
- 关键词:粗糙集信息系统知识约简
- 一种基于隐含子类信息的粗糙集中文文本分类方法被引量:3
- 2008年
- 中文文本分类是中文信息检索和Web挖掘等领域的研究热点。现有的一些分类方法在特征选择阶段存在不足,忽略了隐含的子类信息。本文提出了一种提升隐含子类的关键词权值的方法,从而可以发现有价值的子类信息,进而使用粗糙集构建分类器。实验结果表明这种方法在不增加待约简词汇数量的情况下有效地提高了文本分类的查全率。
- 金凯民苗夺谦段其国
- 关键词:中文信息处理粗糙集向量空间模型
- 一种基于粗糙集理论的谱聚类算法被引量:6
- 2009年
- 谱聚类算法利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。现有谱聚类算法的聚类结果多为精确集,而真实数据集中重叠现象广泛存在。基于粗糙集理论提出了一种新的谱聚类算法,其主要思想是对谱聚类算法进行粗糙集扩展,使得聚类结果成为具有下近似和上近似定义的、类与类之间存在重叠区域的结构。实验表明,该算法与现有的谱聚类算法相比,稳定性和准确率都有一定的提高。
- 郑吉苗夺谦王睿智钟才明
- 关键词:粗糙集谱聚类K均值聚类
- 基于覆盖的粗糙聚类算法被引量:2
- 2008年
- 传统的聚类算法大都得到了样本集的一个划分,类之间是严格的互斥关系,而现实世界中类与类之间往往没有明确的边界。该文将粗糙集理论引入到聚类分析中,提出了一种基于覆盖的粗糙聚类算法KMMRSC,它用多个中心点代表一个类,并用上、下近似来刻画样本的归属,类与类之间是一种覆盖关系。实验结果表明,该算法聚类质量优于k-均值算法,且能发现非球状簇。
- 王慎超苗夺谦陈敏王睿智
- 关键词:粗糙聚类