吴林
- 作品数:2 被引量:5H指数:1
- 供职机构:华中科技大学计算机科学与技术学院更多>>
- 发文基金:湖北省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 倒排索引压缩及在RDBMS全文检索中的实现被引量:5
- 2005年
- 提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率.
- 朱虹吴林
- 关键词:倒排索引索引压缩
- DM4全文检索机制的设计
- 在数据库管理系统DM4中实现了全文索引机制,并在大数据量情形下进行了测试,表明采用B+树存储倒排索引时,尽管能够和传统的DBMS融合,充分利用其事务处理、故障恢复机制,但是带来的问题是索引占用空间的膨胀.若采用适当的压缩...
- 朱虹吴林
- 关键词:数据库管理系统