内蒙古自治区自然科学基金(20080404MS0908)
- 作品数:3 被引量:11H指数:1
- 相关作者:裴志利梁艳春管仁初时小虎杨晨更多>>
- 相关机构:内蒙古民族大学吉林大学南京大学更多>>
- 发文基金:内蒙古自治区自然科学基金博士科研启动基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 权吸引子传播算法及其在文本聚类中的应用被引量:10
- 2010年
- 吸引子传播算法(affinity propagation,AP)是一种新的高效聚类算法.由于AP算法简单易用,它已被广泛应用到数据挖掘的各个领域.在AP算法中,相似性度量具有重要作用.另一方面,传统的文本挖掘常采用向量空间模型和满足欧氏空间的相似性度量.这种方法的优点是简单且易于实现,但随着数据规模的膨胀,向量空间将变得高维稀疏并将导致计算复杂度快速增长.为解决此问题,给出了相似特征集、排斥特征集和仲裁特征集的概念,在这些概念的基础上提出了一种能够包含文本结构信息的非欧空间相似性度量方法.并提出了一种新的聚类算法,称之为权吸引子传播算法(weight affinity propagation,WAP).为检验提出算法的聚类效果,选用标准数据集Reuters-21578进行了验证.实验结果表明WAP明显优于k-means聚类算法、具备非线性特征的SOFM聚类算法和采用经典相似性度量的吸引子传播算法等3种经典聚类算法.
- 管仁初裴志利时小虎杨晨梁艳春
- 关键词:文本聚类
- 电子细胞模型Analog-Cell中基因表达调控的模拟实现
- 2011年
- 电子细胞模型的研究是人工生命的重要研究领域之一,Analog-Cell是国内第1个电子细胞图形模型,用于在分子水平上图形化的模拟真核细胞的基因表达过程.扩展的Analog-Cell添加了在基因表达过程中起重要作用的酶和调控因子,利用状态控制机制,设计并实现了转录、mRNA的加工和翻译3个阶段中基因表达调控的主要反应的算法,并结合模拟示例展示了这些算法的运行结果.模拟实验结果表明,设计的算法符合生物学原理,使Analog-Cell具备了一定的图形化模拟基因表达调控反应的能力.最后,指出了上述工作给Analog-Cell带来的新优势,并对下一步工作进行了展望.
- 韩霄松裴志利卢欣华纪兆华梁艳春
- 关键词:生物信息学人工生命电子细胞基因表达基因表达调控
- 基于aspect封装的需求级特征复用方法被引量:1
- 2011年
- 可复用的软件资产的确定为软件复用活动提供了基础.特征模型通过特征以及特征之间的关系来有效地组织特定领域的软件需求,为领域需求的复用提供有力支持.面向方面系统设计着眼于减少软件开发中需求或代码的纠结,将识别出的横切关注点封装成aspect,有利于开发模块化良好的软件产品以及高效的软件维护和复用.为方便特征复用,提出了一种在系统需求分析级别对特征模型进行aspect化封装的方法,可提取出遗留系统中的可复用部分.首先,通过分析同一领域遗留系统的需求文档,识别出系统关注点,建立领域的关注点层次结构;其次,基于领域关注点层次结构,提取领域特征,并对相似特征进行aspect化封装,形成特征层次模型;最后,基于建立的特征模型以及封装的aspect开发新系统,达到软件复用目的.基于新方法进行了实例分析,通过复用两个不同的Web遗留系统得到一个新的Web系统.可以看出新方法对同一个领域中的多遗留系统地复用有较好的指导意义.
- 罗术通裴志利张长海金英