国家自然科学基金(60273079) 作品数:27 被引量:80 H指数:5 相关作者: 王国仁 王镝 张晓琳 王晓虹 韩东红 更多>> 相关机构: 东北大学 辽宁石油化工大学 上海宝信软件股份有限公司 更多>> 发文基金: 国家自然科学基金 高等学校优秀青年教师教学科研奖励计划 辽宁省自然科学基金 更多>> 相关领域: 自动化与计算机技术 生物学 更多>>
基于IPS的FTP协议事件检测引擎的设计与实现 2008年 事件检测引擎是基于FTP协议解析引擎中的重要组成部分之一。在对传统的网络安全技术进行研究的基础上,设计和实现了基于IPS的FTP协议事件检测引擎。阐述了FTP协议事件检测引擎的总体框架,建立了相关的模型。该引擎采用先进的NEL语言开发平台,实时地检测出异常流量,实现了实时、高性能的网络安全。 王晓虹 李佳惠 王国仁 张艳凤关键词:IPS FTP 基于Web的电信闭环决策支持系统的研究与实现 被引量:2 2007年 通过对电信数据的分析,提出了基于Web的电信闭环决策支持系统的实现方案。确定了电信领域的决策分析主题,建立了相关的联系和模型,阐述了采用基于数据仓库的四层结构的电信闭环决策支持系统的系统架构和功能。运用联机分析处理、数据挖掘等分析决策手段实现了对电信数据多角度、多层次的查询、分析及决策功能。 王晓虹 王国仁 于勇前 洪洋关键词:数据仓库 基于签名的XML结构连接过滤技术 与传统数据库查询不同,XML数据库查询不仅查找数据,还查找数据之间的结构关系.因此,对基本的"父子"和"祖先后代"关系的查询处理,就成为XML查询的关键.最近,用结构连接算法处理这些结构关系十分流行.首先利用XML文档的... 杨川 孙冰 汤南 王国仁 王斌 霍欢关键词:XML 签名 过滤器 文献传递 决策树的并行训练策略 被引量:4 2004年 随着生物科学技术的发展,其数据量的增长也非常迅速,很难在一定合理的时间内对数据进行建模和分析,因此,对并行数据挖掘算法的研究已变成解决此问题的重要途径。决策树途径已被广泛用作一种重要的分类工具,本文研究了几种决策树的并行训练策略并对它们的性能进行了比较。 刘欣阳 王国仁 乔百友 韩东红关键词:决策树 数据挖掘 人工神经元网络 统计模型 并行后缀树的构造及查询算法 被引量:5 2004年 针对生物信息领域中传统后缀树构造算法在时间和空间上的限制,从结构并行的角度提出了一种新颖的、适用于生物信息学应用的并行后缀树结构和相应的构造算法·该算法首先将给定字符串分成若干连续的片段,并在各个处理机上分别构造这些片段的后缀树,形成了一种分布于多个处理机上的并行后缀树结构·该并行算法不仅大大缩短了后缀树的构造时间,而且避免了主存大小的限制·经分析,其性能优于现有的任何一种并行算法·在此基础上,提出了一种高效的基于这种并行后缀树的字符串匹配算法,解决了传统后缀树的基本查询问题· 乔百友 葛健 王国仁 韩东红关键词:后缀树 字符串匹配 生物序列 生物信息学 音乐数字序列中主题重复片段的查找 2006年 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两个重要问题.从音乐作品中重复片段的意义和听众对音乐作品的感知两个角度出发,定义了一种新的音乐数据重复片段--主题重复片段,并提出了查找算法.考虑到查找过程的复杂性,基于音乐数字序列中(δ,γ)相似性,设计了δ过滤器及γ过滤器,在线性时间内得到重复片段的候选集,提高了查找的效率.实验结果表明,算法在查找效率上是令人满意的. 陈白尘 王镝 王国仁 赵毅 于长永 徐莹颖关键词:过滤器 DNA序列中基于后继数组索引的LPR查找算法 被引量:4 2006年 DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n). 王镝 王国仁 吴青泉 陈白尘 赵毅 毛克明关键词:DNA序列 LPR 用继承扩展XML-RL 被引量:28 2005年 XML 正在成为 Internet上数据描述和交换的标准 ,用一些重要的面向对象的特征扩展基于高级数据模型上的以规则为基础的 XML查询语言 XML - RL .首先用元素层次 ,多重继承和多态扩展了 XML - RL数据模型 .然后扩展 XML - RL以支持多态元素 ,多态引用 ,独占元素和独占引用 . 张晓琳 王国仁XML数据聚簇技术研究 被引量:4 2005年 在分析DOM标准中数据访问的特点后,提出了两种XML数据聚簇存储方法:基于父子关系的XML数据聚簇存储方法和基于兄弟关系的XML数据聚簇存储方法·针对两种典型树遍历操作,分析了两种XML聚簇存储方法发生I/O的概率,给出了两种DOM树遍历路径表达式查询算法,即深度优先查询算法和宽度优先查询算法·基于XMark和XMach测试基准进行了性能评价· 乔百友 王国仁 韩东红 赵相国关键词:XML DOM树 性能评价 生物序列模式分析中神经网络的并行训练策略 2004年 神经网络作为模式识别、数据挖掘等方面的有效工具,已被广泛应用到生物序列的模式分析中,而生物序列的超大规模、超长同时也给神经网络提出了挑战,即必须解决训练时间过长、效率低下的问题。本文提出了若干适合生物应用的神经网络并行训练策略,并按其神经网络粒度进行分类,同时分析和比较了各种策略的代价。 王镝 吴青泉 王国仁 于戈关键词:神经网络 生物信息学