福建省自然科学基金(2010J01324)
- 作品数:3 被引量:3H指数:1
- 相关作者:林鸿蔡坚勇何晓明陈圣群李静更多>>
- 相关机构:福建师范大学福建江夏学院更多>>
- 发文基金:福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 基于n-gram中英文字符串分割算法实现被引量:2
- 2012年
- 相似字符串的模糊查询是信息检索的重要组成部分,一直是人们研究的热点。目前基于关键词的查询技术都是前缀匹配,无法查找到与搜索字符串相似的结果。该文提出一种基于n-gram的中英文字符串分割技术的算法,该技术主要是对字符串进行中英文识别,然后基于n-gram按照指定长度进行分割,该技术是实现基于关键词的模糊查询技术的基础。该技术在数据清洗以及学位论文TMLC系统和垃圾邮件过滤等方面也有重要的应用前景。
- 何晓明洪亲蔡坚勇林鸿
- 关键词:模糊查询N-GRAM数据挖掘
- 基于XML电子病历的索引策略研究与实现被引量:1
- 2011年
- 为了提高XML电子病历系统查询和处理时间,采用倒排索引方法,引入LRU替换算法,并引进更新策略。该索引策略花费少量空间索引,但却适应了电子病历的实时更新,大大地提高了查询和处理时间。给出了此策略实现算法的同时,通过实验验证了它的有效性和优越性。
- 陈圣群李静洪亲
- 关键词:XML电子病历索引策略
- 一种由B+树实现的倒排索引
- 2011年
- 索引作为整个数据检索系统的重要组成部分,一直是人们研究的热点。倒排索引结构以其快的查询速度、高的查询效率得到青睐。而B+树作为一种成熟的数据结构,是创建索引的首选。该文提出了一种由B+树实现的倒排索引结构,结合了B+树与倒排索引的优点,查询速度快、效率高,在数据挖掘以及数据查询等方面应用广泛。
- 李文洪亲滕忠坚石兆英
- 关键词:倒排索引B+树数据查询