您的位置: 专家智库 > >

陈白尘

作品数:7 被引量:10H指数:3
供职机构:东北大学信息科学与工程学院更多>>
发文基金:国家自然科学基金高等学校优秀青年教师教学科研奖励计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 2篇会议论文

领域

  • 7篇自动化与计算...

主题

  • 3篇过滤器
  • 3篇DNA序列
  • 2篇索引
  • 2篇索引结构
  • 1篇生物信息
  • 1篇生物信息学
  • 1篇生物序列
  • 1篇生物序列分析
  • 1篇轻量
  • 1篇轻量级
  • 1篇字符
  • 1篇字符串
  • 1篇解析度
  • 1篇近邻查询
  • 1篇聚类
  • 1篇K近邻
  • 1篇K近邻查询
  • 1篇LPR
  • 1篇查询

机构

  • 7篇东北大学
  • 1篇上海宝信软件...

作者

  • 7篇陈白尘
  • 7篇王镝
  • 7篇王国仁
  • 5篇赵毅
  • 3篇徐莹颖
  • 3篇于长永
  • 2篇吴青泉
  • 1篇郑若石
  • 1篇毛克明
  • 1篇王斌
  • 1篇徐恒宇
  • 1篇韩冬红

传媒

  • 2篇计算机研究与...
  • 1篇华中科技大学...
  • 1篇小型微型计算...
  • 1篇东北大学学报...
  • 1篇第二十三届中...

年份

  • 1篇2007
  • 5篇2006
  • 1篇2005
7 条 记 录,以下是 1-7
排序方式:
音乐数字序列中主题重复片段的查找
2006年
随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两个重要问题.从音乐作品中重复片段的意义和听众对音乐作品的感知两个角度出发,定义了一种新的音乐数据重复片段--主题重复片段,并提出了查找算法.考虑到查找过程的复杂性,基于音乐数字序列中(δ,γ)相似性,设计了δ过滤器及γ过滤器,在线性时间内得到重复片段的候选集,提高了查找的效率.实验结果表明,算法在查找效率上是令人满意的.
陈白尘王镝王国仁赵毅于长永徐莹颖
关键词:过滤器
DNA序列中基于后继数组索引的LPR查找算法被引量:4
2006年
DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n).
王镝王国仁吴青泉陈白尘赵毅毛克明
关键词:DNA序列LPR
DNA序列中基于后继数组索引的SATR查找算法被引量:4
2007年
研究了基因序列分析中的DNA序列相似性重复片段的查找问题.在对重复片段的相似性衡量进行分析之后,基于海明距离提出了新的相似度衡量标准模式相似度和片段相似度,并在此基础上提出了一个新的相似性重复片段的定义SATR(segment-similarity based approximate tandem repeats).在进行SATR的查找时,采用了一个轻量级的索引后继数组,并设计出在后继数组上进行SATR查找的算法.实验评估和性能分析表明,基于后继数组的SATR查找算法在查找结果和查找时间上都要优于其他同类方法.
王镝赵毅陈白尘王国仁
关键词:DNA序列
音乐数字序列中主题重复片段的查找
随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两...
陈白尘王镝王国仁赵毅于长永徐莹颖
关键词:过滤器
文献传递
音乐数字序列中主题重复片段的查找
随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两...
陈白尘王镝王国仁赵毅于长永徐莹颖
关键词:过滤器
文献传递
CMRS:聚类的多解析度字符串索引结构
2006年
随着基因测序技术和人类基因组计划的发展,从大量的生物数据中寻找相似的序列就越来越成为当前研究的热点问题.本文提出了一种聚类的多解析度字符串索引结构,用于解决生物序列的相似性查询问题.首先,以较小容量的MBR(最小绑定矩形)构造基因序列的多解析度字符串索引结构,然后通过对MBR的聚类以及保序技术的应用,减小索引中MBR的平均体积,从而增加了查询向量到索引的空间距离,提高了索引的过滤能力.还给出了一种新的后处理方法,通过大量的减少编辑距离的计算,提高索引的性能.文中给出了该索引结构并详细介绍了索引的相关算法.实验表明,该索引结构是一种有效的处理生物数据的相似性查询的索引结构.
郑若石王镝徐恒宇王国仁陈白尘
关键词:K近邻查询生物信息学
一种可用于生物序列分析的轻量级索引结构被引量:3
2005年
针对目前可用于重复片断查询的索引结构所需空间过大的问题,通过对序列中重复片断的分析提出一种轻量级数据结构———后继数组,它是基于基数排序方法建立的.后继数组也适用于多序列分析.理论分析表明了后继数组及多序列后继数组在存储空间上的优势.实验结果表明后继数组仅需要约原序列长度5倍的存储空间,在建立时间上后继数组也要优于后缀树等索引结构.
王镝王国仁陈白尘吴青泉王斌韩冬红
关键词:DNA序列
共1页<1>
聚类工具0