赵毅 作品数:6 被引量:8 H指数:2 供职机构: 东北大学信息科学与工程学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
音乐数字序列中主题重复片段的查找 2006年 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两个重要问题.从音乐作品中重复片段的意义和听众对音乐作品的感知两个角度出发,定义了一种新的音乐数据重复片段--主题重复片段,并提出了查找算法.考虑到查找过程的复杂性,基于音乐数字序列中(δ,γ)相似性,设计了δ过滤器及γ过滤器,在线性时间内得到重复片段的候选集,提高了查找的效率.实验结果表明,算法在查找效率上是令人满意的. 陈白尘 王镝 王国仁 赵毅 于长永 徐莹颖关键词:过滤器 DNA序列中基于后继数组索引的LPR查找算法 被引量:4 2006年 DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n). 王镝 王国仁 吴青泉 陈白尘 赵毅 毛克明关键词:DNA序列 LPR DNA序列中基于后继数组索引的SATR查找算法 被引量:4 2007年 研究了基因序列分析中的DNA序列相似性重复片段的查找问题.在对重复片段的相似性衡量进行分析之后,基于海明距离提出了新的相似度衡量标准模式相似度和片段相似度,并在此基础上提出了一个新的相似性重复片段的定义SATR(segment-similarity based approximate tandem repeats).在进行SATR的查找时,采用了一个轻量级的索引后继数组,并设计出在后继数组上进行SATR查找的算法.实验评估和性能分析表明,基于后继数组的SATR查找算法在查找结果和查找时间上都要优于其他同类方法. 王镝 赵毅 陈白尘 王国仁关键词:DNA序列 音乐数字序列中主题重复片段的查找 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两... 陈白尘 王镝 王国仁 赵毅 于长永 徐莹颖关键词:过滤器 文献传递 音乐数字序列中主题重复片段的查找 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两... 陈白尘 王镝 王国仁 赵毅 于长永 徐莹颖关键词:过滤器 文献传递 DNA序列中基于边界索引的LMIR查找算法 A序列中的反向重复序列在人类基因研究中具有重要的生物意义,因而成为生物序列分析领域中的一个重要课题。本文根据非精确匹配的反向重复序列的生物结构特征,基于匹配相似程度和模式间隔提出了新的非精确匹配反向重复序列定义LMIR(... 赵毅 王国仁 刘晓光关键词:DNA序列