国家自然科学基金(60303030) 作品数:12 被引量:13 H指数:2 相关作者: 冯剑琳 冯玉才 王元珍 李曲 方琼 更多>> 相关机构: 华中科技大学 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 重庆市自然科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 更多>>
前缀立方的索引 被引量:3 2005年 前缀立方是最近提出的一种新的数据立方结构。它利用前缀共享和基本单元组有效地缩小了数据立方的尺寸,相应减少了数据立方的计算时间。为提高前缀立方的查询性能,本文提出了它的一种索引机制Prefix-CuboidTree。文中用真实数据集和模拟数据集进行大量实验,证明了该索引机制的查询性能。 丁胡临 冯剑琳 聂晶关键词:浓缩数据立方 数据立方 索引机制 前缀 查询性能 元组 基于浓缩数据立方的内存实化小方的动态选择 被引量:2 2005年 OLAP通常使用预计算数据立方的方法提高可能的聚集查询的响应速度,在内存实化预计算的数据,可以更进一步加快响应的速度,但是受到内存空间的限制。在浓缩数据立方的环境中,动态地选择一定的数据小方在内存实化,加快响应速度,并更好地适应不同的查询模式。给出了在动态选择模型中,特定存储方式下的查询分解和响应算法。 王元珍 张晨静 李曲 冯剑琳关键词:浓缩数据立方 SAT-FOIL+:基于句子级关联的文本分类 被引量:1 2005年 以往基于词语关联的方法在挖掘频繁项集和关联规则时,都是将整个文本看作一个亨务来处理的,然而文本的基本语义单元实际上是句子。那些同时出现在一个句子里的一组单词比仅仅是同时出现在同一篇文档中的一组单词有更强的语义上的联系。基于以上的考虑,我们把一篇文档里的一个句子作为一个单独的事务,从而提出了一种基于句子级关联的分类方法SAT-FOIL。并在本文中提出新的得分模型来获得改进的新算法SAT-FOIL+。通过在标准的文本集Reuters上的大量实验,不仅证明新模型的优越性,而且证明了SAT-FOIL+分类效果同其他几种分类方法是可比的,并且要远远好于以往的基于文档级关联的分类方法。另外,挖掘出来的分类规则还具有易读性,并且易修改。 冯玉才 李曲 何玉 冯剑琳关键词:文本分类 频繁项目集 EFFICIENT COMPUTATION OF HIERARCHICAL PREFIXCUBE 2006年 The rollup and the drilldown are quite frequent based on dimension hierarchies in on-line analytical processing (OLAP), but prefixCube does not directly support dimension hierarchies. The PrefixCube is extended for incorporating hierarchical data cubes, i.e. cubes with hierarchical dimensions ,thus obtaining HierPrefixCube. HierPrefixCube retains advantages on computation and organization of PrefixCube, and it can directly support aggregate queries on levels of the dimension hierarchy. 颜文跃 方琼 王元珍关键词:CLUSTER 基于近似查询的在线分组聚集及其应用 被引量:2 2005年 通过分析在线聚集与在线动态重排序技术,结合近似查询处理和国会抽样方法,提出了在线分组聚集方案,该方案具有广泛的应用前景。 冯玉才 张鹏程一种新的前缀立方索引机制 被引量:1 2007年 前缀立方在浓缩数据立方的基础上利用前缀共享和基本单元组技术有效地缩小了数据立方的尺寸.由于前缀共享产生的分组结构,浓缩数据立方的索引CuboidTree并不适合前缀立方.所以,根据前缀立方包含分组结构的特性,结合BUB-Tree和R-Tree技术对CuboidTree进行改造,最终得到了一种新的索引机制Bound-CuboidTree.实验证明,这种索引机制比已有的前缀立方索引Prefix-CuboidTree更适合前缀立方的结构. 聂晶 冯剑琳 王元珍一种实化视图的合并算法 被引量:2 2005年 对于拥有大量实化视图的实际数据库应用系统,提出了视图合并的方法以减少整个视图 的数量,缩减实化视图的搜索空间;还提出了归并树和基于归并树的快速有效的合并算法。实验表 明,实化视图的合并是快速寻找可能响应查询的实化视图的一种有效途径,可以显著改进查询处理的 性能。 陈长清 程恳关键词:实化视图 一种双样本多分形视图尺寸估计算法 2005年 视图尺寸估计是数据仓库实化视图选择和分配预聚集视图存储空间的前提。本文提出了双样本多分形视图尺寸估计算法MDS;同时,为了研究MDS算法的有效性,本文把它与Cardenasn formula、SF 和FMS算法进行了比较。实验结果表明,MDS算法优于其它算法。 曹忠升 李累含有SPREADSHEET子句的实化视图匹配 2006年 含有SPREADSHEET子句的SQL语句,增强了传统SQL语句的多维计算能力.本文研究含有SPREADSHEET子句的实化视图匹配,利用实化数据加快spreadsheet查询的响应速度.文中提出了含有SPREADSHEET子句的视图匹配算法.实验结果表明,含有SPREADSHEET子句的视图匹配方法,具有良好的查询响应能力和良好的可扩展性. 颜文跃 王元珍 张晨静 冯剑琳PrefixCube计算的优化 被引量:5 2004年 基本单元组浓缩把那些由同一条基表元组聚集计算得到的立方元组浓缩成一条,从而减小数据立方的体积。共享前缀技术通过消除元组之间的前缀冗余来进一步压缩数据立方。PrefixCube就是将基本单元组的浓缩与共享前缀结合,而提出的一种有效的数据立方组织形式。在本文中,我们以批处理模式进一步优化计算PrefixCube,从而减少PrefixCube的计算时间代价。通过在模拟数据集和真实数据集上的实验证明,在大多数数据集上,以批处理模式计算PrefixCube要优于一般模式计算PrefixCube。 冯玉才 方琼 李曲 冯剑琳关键词:数据立方 元组 批处理 模拟数据 实数