江苏省高技术研究计划项目(BG2005019) 作品数:21 被引量:261 H指数:9 相关作者: 崔志明 赵朋朋 张书奎 龚声蓉 刘纯平 更多>> 相关机构: 苏州大学 江苏省计算机信息处理技术重点实验室 更多>> 发文基金: 江苏省高技术研究计划项目 教育部科学技术研究重点项目 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
Deep Web查询接口选择 被引量:12 2006年 越来越多的信息隐藏在W eb查询接口之后,在此情况下如何寻找与用户查询最相关的数据源接口就变得越来越重要。文中提出了一种Deep W eb查询接口选择算法,该算法是完全依赖于查询接口特征的。给定大量异构的Deep W eb数据源,目标是选择与用户查询最相关的查询接口集。通过对实际查询接口特征的观察,发现了查询接口上谓词间的相关性。基于此发现,设计了一种基于共同出现谓词相关度模型的数据源选择算法,用于选择与用户查询最相关的查询接口集。 郑冬冬 崔志明关键词:接口对象 满足QoS约束的自适应Ad Hoc网络路由算法 2007年 自组网是由一组带有无线收发装置移动节点组成的一个能够支持多跳的临时性计算机通信网络,其拓扑的动态变化是该类网络的一个重要特征,文章提出了一种满足QoS约束的自适应路由算法,将业务的多个QoS参数进行综合评判,对比各条路径综合路由状态,选择出最适合业务请求的路径。仿真显示该算法在支持QoS的同时,对移动Ad Hoc网络因拓扑动态变化而引起的信息不精确性有很好的适应度。 张书奎关键词:多约束 移动AD HOC网络 QOS路由 Deep Web查询接口的自动判定 被引量:29 2007年 传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。 高岭 赵朋朋 崔志明关键词:深网 网页表单 特征提取 朴素贝叶斯分类 基于主动队列管理的集群计算负载平衡系统 被引量:3 2007年 在分析了分组到达率和服务率的关系及主动队列管理AQM(Active Queue Management)的Balanced RED算法的基础上,提出了一个计算连接权重的动态分配算法"基于AQM加权时序动态法"(Weighted Opportunity Dynamic Algorithm based onAQM),它具有对终端用户透明、能自动找出最佳服务器来处理请求的特点,从而实现集群计算服务器的负载平衡。另外据此算法设计并实现了一个支持服务器集群的动态负载平衡原型系统,实验结果表明该算法在负载平衡的效能上有明显的提高。 张书奎关键词:主动队列管理 集群计算 调度器 融合全局和局部特征的Fisherfaces方法 被引量:3 2008年 提出了一种融合全局和局部特征的Fisherfaces方法。在Fisher线性准则下,抽取出图像全局特征和局部特征的最佳分类特征。计算待识别样本和训练样本集的加权欧氏距离。在最近邻准则下,判别待识别样本的类别,在ORL人脸库上进行的对比实验结果表明该方法的优越性。 王慧泽 龚声蓉 刘纯平关键词:人脸识别 主成分分析 基于语义的Deep Web数据源自动发现技术 被引量:8 2007年 为了方便用户快捷高效的使用DeepWeb中内容丰富、主题专一的高质量信息,对DeepWeb数据源发现研究已成为一个非常迫切的问题。目前通用的方法是基于关键词的主题过滤策略,这样容易发现一些不相关的数据源,为此提出一种新的基于语义的DeepWeb数据源聚焦爬行方法,利用朴素贝叶斯分类算法自动发现DeepWeb数据源,实验验证了该方法的有效性。 方巍 胡鹏昱 赵朋朋 崔志明关键词:WEB 语义 表单 基于查询接口特征的Deep Web数据源自动分类 被引量:20 2006年 搜索引擎可以很好地搜索出大部分可索引页面,然而,Internet上有大量的页面是由后台数据库动态产生的,传统的搜索引擎搜索不出这部分页面,我们称之为DeepWeb。其中大部分DeepWeb是结构化的,它提供结构化的查询接口和结构化的结果。把这些结构化的DeepWeb数据源按所属领域进行组织可以方便用户浏览这些有价值的资源,并且这也是大规模DeepWeb集成搜索的一个关键步骤。提出了一种基于查询接口特征的DeepWeb数据源自动分类方法,并通过实验验证该方法是非常有效的。 赵朋朋 高岭 崔志明关键词:DEEP WEB 数据集成 Deep Web爬虫爬行策略研究 被引量:28 2006年 如今Web上越来越多的信息可以通过查询接口来获得,为了获取某DeepWeb站点的页面用户不得不键入一系列的关键词集。由于没有直接指向DeepWeb页面的静态链接,当前大多搜索引擎不能发现和索引这些页面。然而,近来研究表明DeepWeb站点提供的高质量的信息对许多用户来说是非常有价值。这里研究了怎样建立起一个有效的DeepWeb爬虫,它可以自动发现和下载DeepWeb页面。由于DeepWeb惟一“入口点”是查询接口,DeepWeb爬虫设计面对的主要挑战是怎样对查询接口自动产生有意义的查询。这里提出一种针对查询接口查询自动产生问题的理论框架。通过在实际DeepWeb站点上的实验证明了此方法是非常有效的。 郑冬冬 崔志明关键词:DEEP WEB DEEP WEB爬虫 一种自适应的Harris角点检测算法 被引量:98 2008年 分析Harris角点检测算子的实现原理及其不足,提出一种基于图像分块和邻近角点剔除策略的自适应Harris角点检测算法,检症测出的角点均匀分布,有效避免了角点聚簇现象。实验结果表明,该算法检测出的角点分布更均匀合理,能很好地适应图像拼接等实际应用。 赵万金 龚声蓉 刘纯平 沈项军关键词:角点检测 HARRIS算子 特征提取 关于中国Deep Web的规模、分布和结构 被引量:22 2007年 随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:1中国Deep Web查询接口往往位于站点浅层,94.6%的Deep Web查询接口出现在站点的前3层;2中国Deep Web大约有24,000个站点,28,000个Web数据库和74,000个查询接口;3中国Deep Web大部分是非结构化的,其中64%是非结构化的Web数据库;4中国Deep Web分布于多种不同的主题领域;5目前主要的中文搜索引擎已覆盖国内Deep Web大约二分之一的页面. 赵朋朋 崔志明 高岭 仲华关键词:DEEPWEB WEB数据库 查询接口