国家自然科学基金(69933010)
- 作品数:79 被引量:880H指数:15
- 相关作者:施伯乐张亮汪卫胡运发刘国华更多>>
- 相关机构:复旦大学燕山大学上海理工大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- Web权威资源挖掘的一种有效方法
- 2003年
- 如何有效利用Web上的信息,传统的基于(基于频繁度的Web图的权威资源挖掘)算法利用Web页面间链接结构隐含地表达着"谁是权威"这个事实,提出了一种有效方法.文中诠释了新的权威页面定义,提出了带阶的频繁子图和权威社团等概念.
- 楼宇波
- 关键词:信息检索频繁子图权威页面WEB挖掘
- PHC:一个基于分层的快速聚类算法
- 1.引言聚类分析是一个将指定数据集中的数据进行归类的过程,其遵循的原则是每个类内部各对象间的相似性尽可能最大,而不同类对象间的相似性尽可能最小。当前,国内外的聚类分析工作重点之一是聚类分析算法,形成了如基于分割的算法、基...
- 周皓峰袁晴晴程尊平施伯乐
- 文献传递
- 基于术语关联图的查询重组被引量:1
- 2004年
- 当用户向搜索引擎提交查询时 ,查询术语之间一般会存在内在关联。发现这种术语关联 ,对更好地描述用户的意图具有积极的研究意义。本文在术语关联网络TAN的基础上 ,首先设计查询术语关联图构造算法 (QTAG)勾勒出用户查询中的术语关联 ;其次 ,利用术语权重调整算法 (TWA)修改术语权重 ,从而形成新的更侧重于目的的查询。
- 罗永强周华奇肖金升
- 关键词:WWW分布式信息检索向量模型搜索引擎
- 基于相邻字对信息的中文文档分类研究被引量:9
- 2001年
- 本文首次提出利用相邻字对信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现中文文档分类的领域无关性和时间无关性 .分别利用 Naive Bayes和 k NN分类方法建立了基于相邻字对信息的中文文档分类系统 .
- 周水庚俞红奇胡江滔付辛胡运发
- 关键词:文档分类中文文档分类信息处理
- 基于商用数据库管理系统的字符串数据的加密存储与查询被引量:6
- 2005年
- 在非可信环境下对数据进行加密是保护数据库中数据安全的一种有效方法,但如何对加密数据进行高效地查询是一个难点,引起了研究界的重视.本文提出加密字符数据的一种存储结构,除了加密数据以外,还以加密的方式存储了原始数据的特征值,并基于这种结构实现了对加密数据的两阶段查询方法,通过实验证明其性能较先解密后查询的方法有较大的提高.
- 王正飞汪卫施伯乐
- 关键词:数据库安全加密精确查询CRT
- 规则加权的文本关联分类被引量:5
- 2005年
- 近年来,基于关联规则的文本分类方法受到普遍关注。虽然在一般情况下这种方法可获得较好的分类效果。但当样本特征词分布明显不均时,分类规则在各类别的分布也出现不均,从而导致分类准确率下降。本文设计和实现的基于规则权重调整的关联规则文本分类算法可有效地解决这一问题。该算法根据误分类训练样本的数量定义规则强度。对强规则通过乘以小于1的调整因子降低其权重,而弱规则乘以大于1的调整因子提高其权重。实验结果表明经过规则权重的调整,分类质量显著提高。
- 陈晓云胡运发
- 关键词:计算机应用中文信息处理
- 有效提取Web权威资源
- Web资源是一个巨大的、动态的信息集合,但是大多数信息对于用户来说是不感兴趣的.如何从Web中提取用户感兴趣的信息是令人关心的问题.现在关于提高Web信息搜索质量的研究有很多,但仍然不够有效,无法满足用户的各种要求.提出...
- 吴颖华周皓峰王晨汪卫施伯乐
- 关键词:WEB信息搜索链接分析权威页面
- 文献传递
- 面向对象的Web工程被引量:11
- 2003年
- 分析了 Web应用的特点和目前所面临的一些问题 ;基于面向对象的概念 ,提出了多层次、多视图的 Web应用开发模型 ,以对象作为建模的基本实体 ,提供了 Web应用的高层描述 ,支持 Web服务的任意粒度的抽象、封装、重用以及 Web导航特性的分析 ;提出了基于 XML 的面向对象 Web建模语言 OOWML 并实现了编译工具 ,能够自动生成Web应用的目标语言 .与已有的方法相比 ,本文提出的模型为
- 杨卫东詹梅施伯乐
- 关键词:面向对象WEB工程数据模型超媒体模型状态图导航模型
- ESPM——频繁子树挖掘算法
- 随着互联网的发展,频繁模式的挖掘由频繁项集扩展到结构化数据:树和图.在这些结构上的挖掘工作被应用于更为复杂的领域,比如生物信息学、网络日志和XML文档.提出了一个新颖的算法:ESPM,以挖掘有序标号树中的频繁子树.不同于...
- 朱永泰王晨洪铭胜汪卫施伯乐
- 关键词:数据挖掘频繁子树
- 文献传递
- 分布式自治数据源的联合查询被引量:9
- 2004年
- 不同数据源之间数据结构和表示方法的不同以及这些数据源在查询能力上受到的限制 ,使得对分布式异构数据源的集成和综合查询成为一个困难的问题 基于元数据描述 ,在语义正确的前提下 ,根据不同查询条件和不同数据源能力 ,自动构造查询计划是解决这个问题的一个可行方向 ,并可以根据实际需要有不同的具体方法 ,以快速构造查询计划为目的的直观算法 ,和以充分利用各种数据源尽可能全面构造所有可能的查询计划为目的的闭包算法是其中两种典型的方法 。
- 陈彤兵胡金化汪保友施伯乐
- 关键词:信息集成元数据描述数据模式