何明
- 作品数:19 被引量:205H指数:10
- 供职机构:西安交通大学电子与信息工程学院计算机科学与技术系更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于主题划分的有组织P2P搜索算法被引量:22
- 2005年
- 提出一种基于主题划分的P2P搜索算法———主题覆盖网络搜索算法(TONS).TONS在有组织P2P网络基础上,将结点按主题组织成覆盖网络,使含有相似主题的结点链接在一起,因此可以根据内容将查询限定在P2P网络的局部范围内.通过在覆盖网络中随机添加一些长距离链接,使覆盖网络具有Small-World特性.TONS为有组织的P2P系统提供了一种能依据部分匹配、多关键词等复杂条件搜索结点数据对象的有效方法,与现有的有组织P2P系统相比,它可以将搜索的查全率提高74.7%,并减少P2P网络信息搜索的平均路径距离和平均消息数目.
- 傅向华冯博琴马兆丰何明
- 关键词:主题划分信息搜索
- 基于Rough集潜在语义索引的Web文档分类被引量:14
- 2004年
- Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约简算法生成分类 规则,最后利用多知识库进行文档分类。通过试验比较,该方法具有较好的分类效果。
- 何明冯博琴傅向华
- 关键词:粗糙集潜在语义索引WEB文档分类信息过滤信息检索
- 基于增量式遗传算法的粗糙集分类规则挖掘被引量:23
- 2004年
- 从规则获取和优化两个方面研究了基于遗传算法(GA)的增量式粗糙集分类规则挖掘方法.通过研究决策表和决策规则系数,建立了基于粗糙集表示和度量的知识理论,将GA和粗糙集分类规则挖掘算法相结合,在保持原有知识完备的前提下,利用GA对以增量形式获得的分类规则进行优化,获取最优分类规则.试验结果表明,执行增量式GA所需时间较执行一般GA所需时间要少,可有效完成分类规则优化的任务,同时还可提高分类的精度,使分类结果具有更好的可理解性.
- 何明冯博琴马兆丰傅向华
- 关键词:粗糙集数据挖掘
- 可在线增量自学习的聚焦爬行方法被引量:25
- 2004年
- 将Web爬行看作执行序列动作的过程,结合改进的快速Q学习和半监督贝叶斯分类器,提出一种新的具有在线增量自学习能力的聚焦爬行方法.该方法从获取的页面中抽取特征文本,根据特征文本评估页面的主题相关性,预测链接的Q值,然后基于Q值过滤无关链接.当得到主题相关页面时产生回报,将回报沿链接链路反馈,更新链路上所有链接的Q值,并选择相应的特征文本作为训练样本,增量地改善主题评估器和Q值预测器.实验结果表明,该方法具有很快的自学习能力,获取的页面数目和精度均优于离线聚焦爬行方法,更符合Web资源发现的要求.
- 傅向华冯博琴马兆丰何明
- 关键词:资源发现半监督学习
- 基于粗糙集理论的混合智能知识获取方法研究
- 何明
- 关键词:知识获取人工智能粗糙集遗传算法数据挖掘
- 基于查询扩展的Web链接主题提取算法被引量:4
- 2005年
- HITS(Hypertext-Induced Topic Search)算法被广泛用于Web链接结构分析,但它很容易产生主题漂移.从语义相关性角度进行分析,发现HITS算法产生主题漂移的原因在于页面被投影到错误的潜在语义基上.提出一种基于查询扩展的超链主题提取算法,利用用户查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,再利用HITS算法计算Web页面的权威值和中心值.实验结果表明,基于查询扩展的超链主题提取算法可以很好地改善HITS算法所导致的主题漂移问题,更适合于Web查询的需要.
- 傅向华冯博琴马兆丰何明
- 关键词:链接分析主题提取WEB查询资源发现
- 一种基于遗传算法的Rough集多知识抽取方法被引量:4
- 2005年
- Rough集理论为知识约简提供了一种有效的方法.提出了一种基于遗传算法的Rough集多知识抽取方法.针对决策系统中知识约简的不唯一性,构造了一种多约简算法,创建了多知识.在此基础上,利用遗传算法从一个更高的层次对多知识进行优化,并从中抽取最优知识集.试验结果分析表明,通过遗传算法优化后抽取的多知识较单体知识具有更高的精度,使知识的表示更具广义性.
- 何明冯博琴马兆丰傅向华
- 关键词:粗糙集遗传算法知识约简
- 一种不确定性条件下的自适应知识学习方法被引量:1
- 2005年
- 通过研究决策表和决策规则的不确定性,分析了由不分明关系划分的粒度引起的规则不确定性的两个方面,即不一致性和随机性,建立基于信息熵和粗糙集表示的不确定性信息度量的方法.利用该方法计算决策表局部最小确定性,并以此为阈值来控制规则集生成的数量,避免不必要的冗余规则的生成.同时结合Skowron的缺省规则获取算法,实现了没有领域先验知识条件下的不确定知识的自适应学习过程.试验结果表明,阈值的选取是合理的,在保持较高的决策正确率的同时,有效地控制了规则集的生成.
- 何明冯博琴马兆丰傅向华
- 关键词:粗糙集不确定性自适应学习
- 粗糙集理论框架下的神经网络建模研究及应用被引量:17
- 2005年
- 为协调决策支持和分类,引入了一种新的方法,该方法将粗糙集理论和神经网络有机地结合在一起,提出了一种基于粗糙集理论的神经网络模型构造方法.首先,利用粗糙集理论智能数据分析的能力,对神经网络进行预处理,抽取关键成分作为神经网络的输入,从而确定粗糙神经网络的初始拓扑结构.在此基础上,进一步研究和分析了该模型的实现步骤,并应用原始数据对网络进行训练,最后将该模型应用于分类规则的抽取.试验结果比较表明,该模型可以有效地提高分类的精度.
- 何明李博马兆丰傅向华
- 关键词:神经网络粗糙集数据挖掘
- 增量构造负相关异构神经网络集成的方法被引量:8
- 2004年
- 基于负相关异构网络,提出了一种增量构造异构神经网络集成(NNE)的方法.该方法在训练成员网络时,不仅调整网络的连接权值,而且动态调整网络的结构,从而在提高单个网络精度的同时增加各成员网络之间的差异度,减小网络集成的泛化误差.该方法包括构造最佳异构网络(BHNN)和构造异构网络集成(HNNE)两个部分,BHNN基于负相关学习动态构造多个最佳网络,HNNE利用训练好的最佳网络增量地构造异构NNE.使用网络泛化误差和集成泛化误差,整个集成过程可自动完成,无需预先确定成员网络的结构.分别对回归和分类问题进行了实验,相对于单个网络,该方法在测试数据集上的错误率降低了17%~85%,与已有的Boosting、Bagging等网络集成方法相比,错误率也有不同程度的改善.
- 傅向华冯博琴马兆丰何明
- 关键词:神经网络集成负相关学习