赵相国
- 作品数:20 被引量:34H指数:4
- 供职机构:东北大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于引力概念的聚类质量评估算法被引量:3
- 2007年
- 为了定量分析聚类算法的聚类结果,提出了基于引力概念的聚类质量评估算法.该算法将数据空间中的数据点视为带有单位质量的质点,通过分析聚类结果中数据点之间的引力关系来评估聚类结果的质量.在一个聚类结果中,各类中的数据点之间引力大并且噪音数据受到的引力小,这样的聚类结果视为质量较高的聚类结果.相反,如果类中数据间的引力较小而噪音数据所受到的引力较大,这样的聚类结果就是一个质量不高的聚类结果.在几个不同的数据集上,对算法的有效性和高效性进行了测试.实验结果表明,该算法能在极短的响应时间内得到聚类结果评估值,正确地反映聚类结果的优劣.提出的算法可以引导聚类方法自动发现最佳聚类结果而无需人工干预.
- 于勇前赵相国陈衡岳王国仁
- 关键词:聚类引力聚类算法数据挖掘
- 基于压缩叶子流的XML Twig查询
- 在XML数据库中的XML Twig查询是最近查询所关注的焦点,特别是基于整体的算法.很大部分查询算法是通过对XML文档进行编码来实现的,但是,这些算法忽略了文档中双生节点的共有特性.提出了用路径标记来代替已有的编码策略,...
- 董科王国仁宁博毛克明赵相国
- 关键词:TWIG查询
- 文献传递
- 非结构化数据管理关键技术及应用
- 王国仁王波涛孙永佼赵大哲周勇赵相国杨金柱张峰刘庆利
- 随着大数据时代的到来,非结构化数据管理技术在国民经济各领域的应用需求日益突出,根据权威部门预测,非结构化数据应用具有近万亿美元市场规模。虽然与国外相比,国内大数据市场起步较晚,且存在非结构化数据管理核心技术缺乏等问题,但...
- 关键词:
- 关键词:数据管理非结构化数据
- XML函数依赖的定义及分析被引量:1
- 2006年
- 函数依赖是XML数据约束研究的重要组成部分.针对XML中存在的复杂的多种形式的函数依赖约束,分析了数据约束的特点,引入节点值相等的概念,提出了一种DTD的路径语言,进而提出了一种新的XML函数依赖(XFD)的定义,包括相对XFD和绝对XFD.其中,绝对键和相对键是XFD的特例.研究了XFD的逻辑蕴涵与闭包问题,给出一组相应的推理规则,并证明了推理规则的正确性及完备性.
- 赵相国王国仁张恩德丁大斌霍欢
- 关键词:XML函数依赖
- XML的函数依赖被引量:3
- 2008年
- 为了表达引起数据冗余的XML函数依赖,研究了XML中存在的复杂的多种形式的函数依赖约束,提出了一种DTD的路径语言,对于导航和定位XML文档的内容具有较强的表达能力.提出了一套XML模式及文档的形式化描述方法,进而提出了一种XML函数依赖(XFD)的定义.与以前的XML函数依赖的定义进行比较,展示了XFD可以表达更多的XML上存在的函数依赖,可以概括以前的基于路径表达式定义的XML函数依赖的约束能力.
- 赵相国王国仁韩东红丁大斌
- 关键词:XML函数依赖数据约束
- 面向对象XML数据索引技术被引量:6
- 2005年
- 提出了一种面向对象XML数据的索引模式路径仓,路径仓是紧凑地、准确地表示面向对象的XML数据的一棵树,是两级双向树:组级和元素级.在组级上,路径仓提供路径信息、类层次信息,类层次信息存储以索引类为根的类层次子树上特有的元素和属性的对象标识符,而继承的元素和属性的对象标识符存在较高的层次中,可以在查询早期阶段减少大量存储空间;在元素级,它保存从孩子元素到父亲元素的信息,快速存取元素的父亲,提高查询处理效率.不使用全局标志符而是用基于组的引用,可以按组区分不同类型的元素值聚簇相同类型元素值并且索引它们.
- 张晓琳赵相国王国仁
- 关键词:索引查询处理
- 通过精练查询空间改善高维数据的相似性查询
- 2005年
- 提出了一种新的高维查询空间过滤策略,通过将高维数据动态投影到低维的数据空间中,然后在投影空间中对查询空间进一步过滤,精练并快速缩小查询空间.同时提出了一种有效的投影策略基于最大间隔投影,这种投影策略能够提高投影空间的精练能力.而且,设计了一种新的高维索引结构MS-tree,并将新的过滤策略运用于MS-tree的范围查询.实验结果表明,这种查询空间精练策略能够有效的提高索引的性能,降低相似性查询的IO代价和CPU代价.
- 周项敏赵相国王国仁
- 关键词:高维索引相似性查询
- 基于抽样方法的不确定极限学习机
- 2015年
- 实际应用中的大量数据具有不确定属性,而传统的挖掘算法无法直接应用在不确定数据集上.针对不确定数据的分类问题,提出一种基于抽样方法的不确定极限学习机.该算法通过抽样的方法,对不确定数据集中样本的抽样实例进行学习和分类,得到该不确定样本的所属类别的概率,从而实现了传统极限学习机分类算法对不确定数据的分类,并极大降低了不确定对象实例的枚举代价.实验结果表明,该算法在不确定数据的分类问题中具有较好的有效性和高效性.
- 赵相国毕鑫张祯喻鑫
- 关键词:极限学习机
- XML函数依赖的定义及分析
- 函数依赖是XML数据约束研究的重要组成部分.针对XML中存在的复杂的多种形式的函数依赖约束,分析了数据约束的特点,引入节点值相等的概念,提出了一种DTD的路径语言,进而提出了一种新的XML函数依赖(XFD)的定义,包括相...
- 赵相国王国仁张恩德丁大斌霍欢
- 关键词:XML函数依赖
- 文献传递
- XML函数依赖的定义及分析
- 函数依赖是XML数据约束研究的重要组成部分.针对XML中存在的复杂的多种形式的函数依赖约束,分析了数据约束的特点,引入节点值相等的概念,提出了一种DTD的路径语言,进而提出了一种新的XML函数依赖(XFD)的定义,包括相...
- 赵相国王国仁张恩德丁大斌霍欢
- 关键词:XML函数依赖
- 文献传递