傅珊珊
- 作品数:6 被引量:9H指数:2
- 供职机构:华侨大学计算机科学与技术学院计算机科学与技术系更多>>
- 发文基金:福建省自然科学基金福建省科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 从XML到关系数据模型的映射
- 1引言XML是W3C为适应Internet发展而推出的新标记语言。随着大量XML数据的出现,如何有效地管理这些数据已成为必须解决的重要问题。
- 傅珊珊雷庆吴扬扬
- 关键词:XML
- 文献传递
- 基于频繁结构的XML文档聚类被引量:4
- 2008年
- 研究基于频繁结构的XML文档聚类方法,其频繁结构包括频繁路径和频繁子树。首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征,对文档进行聚类。实验结果表明FrePathMiner算法和FreTreeMiner算法找到频繁结构的数量都比传统的ASPMiner算法多,这就可以为文档聚类提供更多的结构特征,从而获得更高的聚类精度。
- 傅珊珊吴扬扬
- 关键词:层次聚类
- 一种挖掘XML文档频繁子树的方法被引量:2
- 2007年
- 本文主要研究从由带标签有序树构成的森林中挖掘嵌入式频繁子树,具体做法是:首先对XML文档进行预处理,生成最简结构树SST,然后从SST中挖掘出频繁子树。本文提出了SSTMiner算法,该算法针对TreeMiner算法存在的瓶颈问题,结合当前所处理的SST的结构特点进行改进,进一步提高了算法执行的效率。实验证明,本文提出的方法能够准确高效地挖掘出XML文档中的频繁子树。
- 傅珊珊吴扬扬
- 关键词:XML频繁子树
- 抽取XML文档到关系数据库被引量:4
- 2006年
- XML在关系数据库中的存储问题是XML研究领域中的一个重要问题。在总结多种映射方法的基础上,提出了一种方法将多个相似的XML文档进行解析,根据映射关系,生成各自的关系模式,并分析归纳出一个集成的关系模式,然后创建一个关系数据库,并在映射关系的基础上提取并存储XML文档数据到关系数据库。此方法以较为简洁的结构保存了XML文档的数据信息,其最大的特点就是不用考虑文档的模式信息(DTD,XML Schema)。并通过一个具体的实验结果来说明这种方法的有效性。
- 傅珊珊吴扬扬
- 关键词:可扩展标记语言关系数据库映射关系
- 基于聚类的XML文档集成管理方法研究
- XML作为Internet上信息表示和交换的一个标准,如何在关系数据库中有效地存储和查询这些数据已成为XML研究领域的一个重要问题。目前几乎所有的商业数据库产品(如三大商业RDBMS产品SQL Server,Oracle...
- 傅珊珊
- 关键词:XML文档集成管理数据存储
- 文献传递
- 从XML到关系数据模型的映射
- XML是W3C为适应Internet发展而推出的新标记语言.随着大量XML数据的出现,如何有效地管理这些数据已成为必须解决的重要问题.
目前基于关系数据库的XML存储和查询的一般策略是:先建立XML模式(DTD...
- 傅珊珊雷庆吴扬扬
- 关键词:XML文档关系数据模型映射规则XML查询
- 文献传递