教育部科学技术研究重点项目([2000]175) 作品数:51 被引量:537 H指数:13 相关作者: 杨炳儒 游福成 宋威 徐章艳 唐菁 更多>> 相关机构: 北京科技大学 北京印刷学院 广西师范大学 更多>> 发文基金: 教育部科学技术研究重点项目 国家自然科学基金 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 理学 文化科学 更多>>
KDD中双库协同机制的研究(Ⅱ) 被引量:6 2002年 在“KDD中双库协同机制的研究 (Ⅰ )”的理论基础上 ,实现了对知识库的简约并实现了双库协同机制的两个协调器 ,从而建立了由KDD融入双库协同机制的新结构模型———KDD ,这是一个在结构和功能上相对于KDD而言的开放的、优化的扩体。基于双库协同机制与KDD ,提出了挖掘关联规则和聚类规则的新算法 ,充分体现了内在机理研究对主流发展的影响 ,开辟了一条全新的研究方向与路径。 杨炳儒 王建新 孙海洪关键词:知识发现 双库协同机制 知识库 Fuzzy集上基于一般蕴含算子的三I算法 被引量:5 2005年 由于三I算法中的蕴含算子都是特定的,选择适合某一特定问题的蕴含算子十分困难。将经典蕴含算子泛化后得到Fuzzy集上一般蕴含算子的定义,本文将三I算法推广到一般蕴含算子上,并给出了基于一般蕴含算子的三I算法通用的计算公式,分析了基于一般蕴含算子的三I算法的还原性,这为在特定问题中用其它优化算法选择合适的蕴含算子提供了可能性。 蔡卫东 徐章艳 丁军 杨炳儒关键词:三I算法 还原性 FUZZY集 知识发现系统内在机理 被引量:5 2002年 介绍了杨炳儒教授独立提出的知识发现系统内在机理中的3个机制——双库协同机制、双基融合机制、信息扩张机制,及在其上构建的KDD*,KDK*,KD(D&K),ESKD结构模型,并介绍了在知识表示方法、发现算法与自动评价方法等方面的创新性成果. 杨炳儒 周颖关键词:知识发现系统 体系结构 双库协同机制 一种基于图结构挖掘WEB用户访问模式的方法 被引量:6 2004年 挖掘Web用户访问模式常用的技术有Web挖掘特有的路径分析技术和数据挖掘领域的传统技术。文章首先分析了现有路径分析技术的不足,然后从Web用户访问模式挖掘过程预处理的结果用户会话文件开始,提出了一种基于Web拓扑结构(图结构)挖掘用户访问模式的方法,提高了发现模式的精确性和效率,并在实验室对该方法进行了简单实现和实际日志数据的测试。 张素兰 杨炳儒 范艳梅关键词:WEB用户访问模式 数据挖掘 基于DCSSM的文本特征提取及文本挖掘研究 被引量:3 2005年 提出了用模式作为复杂类型数据的知识表示方法,结合结构化数据挖掘给出了基于复杂类型数据知识发现的结构模型——发现特征子空间模型DCSSM。在此基础上讨论了文本特征提取及文本挖掘的方法。 梁开健关键词:文本特征提取 动态挖掘进程中参数演化与矛盾域分布规律的研究 2007年 基于内在认知机理的知识发现理论研究基础,宏观地描述了其核心内容之一-信息扩张机制的内涵及主要研究内容,给出了动态挖掘进程规律的部分成果,详细阐述了参数演化规律及矛盾域的分布规律,揭示了动态(在线)挖掘进程中潜在的本质、规律与复杂性,为进一步解决海量数据、动态数据给挖掘进程带来的本质的、极富挑战性的难题奠定了较为坚实的理论基础。 杨炳儒 张帆 韩彦岭关键词:知识发现 KDD中因果关联规则的评价方法 被引量:29 2002年 在KDD(knowledge discovery in database)中,对所发现的知识进行评价是一个很重要的环节.提出了一种针对KDD中因果关联规则的自动评价方法.该评价方法采用了全新的、有效的知识表示方法(语言场和语言值结构)和推理机制(因果关系定性推理机制),并且具有通用性和交互性的特征.给出了此评价方法的理论依据和构造过程,并提供了相应的算法.通过对具体实例的运行检验,证明了此评价方法的有效性.通过与相关工作的比较,证明了其先进性. 杨炳儒 綦艳霞关键词:KDD 感兴趣度 数据库 知识发现状态空间模型研究及其应用 2005年 结构化数据挖掘与复杂类型数据挖掘既有联系,又有区别。如何将这两者统一起来,建立一个统一的理论框架,以指导数据挖掘与知识发现研究,已经成为一个迫切需要解决的问题。本文提出了知识发现状态空间统一模型UMKDSS,将结构化数据挖掘与复杂类型数据挖掘联系起来,为复杂类型数据挖掘提供理论指导。文章是后给出了UMKDSS在Web文本挖掘中的应用实例。 游福成 杨炳儒关键词:数据挖掘 知识发现 状态空间模型 非结构化数据 知识模板 知识发现领域的两大猜想 被引量:5 2007年 针对目前知识发现所面临的机遇和挑战,提出了知识发现"逆问题猜想"和知识发现"磁铁效应猜想"。这两个猜想构成相互关联的统一的有机体,本质上是围绕着要解决"海量"这一难题。讨论了猜想研究的基础,实现的可行性以及可能的研究内容。 杨炳儒关键词:知识发现 数据挖掘 一种改进的基于正区域的决策树算法 被引量:9 2008年 首先分析了基于正区域、基于粗糙边界和基于依赖度的属性选择标准的关系,并证明了这三种属性选择标准彼此等价。然后以正区城的属性选择标准为代表,分析了基于正区域的决策树生成算法的优点和不足。针对这些不足。给出了一种新的属性选择标准,即基于伴随正区域的属性选择标准。用新的属性选择标准生成的决策树一般具有叶子数目较少,叶子的平均深度也较小,且叶子具有较强的泛化能力。最后,用一实例说明了新的属性选择标准的优越性。 高静 杨炳儒 徐章艳 宋威关键词:决策树 粗糙集 正区域 依赖度