公共文化服务平台

张礼: 作品数：28 被引量：55H指数：3; 供职机构：南京林业大学信息科学技术学院更多>>; 发文基金：国家自然科学基金中央高校基本科研业务费专项资金江苏省自然科学基金更多>>; 相关领域：自动化与计算机技术医药卫生生物学农业科学更多>>

合作作者

多实验平台下基因及异构体表达分析综述被引量：2: 2017年; 转录组学研究近几年成为生命科学和医学领域的研究热点,基因表达水平测量则是转录组学研究的基础。差异基因表达分析对于了解基因功能具有重要作用,而差异异构体表达分析则能够反映选择性剪切变化的情况。当前大规模测量基因表达水平的实验平台主要包括基因芯片,以及基于高通量测序技术的RNA-Seq。首先介绍广泛使用的Affymetrix传统3'基因芯片、外显子芯片、较新的全转录组芯片,以及基于RNA-Seq技术的Illumina平台4个主流实验平台的技术原理;其次从基因表达水平计算和差异表达分析两方面介绍每个平台下一些主流数据分析方法和该研究设计的方法,分析每个平台下各数据分析方法的优劣,并进一步展示在标准数据集上一些代表性方法的对比结果。; 王凯莉张礼刘学军; 关键词：RNA-SEQ 基因表达分析

改进的RNA-Seq数据转录组表达分析研究被引量：3: 2015年; 基于高通量测序的RNA-Seq(RNA-sequencing)是用于转录组研究的一种新技术,针对该技术在转录组表达分析研究中存在的读段多源映射和读段非均匀分布等难点,提出一个改进的转录组表达研究方法 LDASeqII(Improvement of latent Dirichlet allocation for sequencing data)。模型利用剪接异构体结构信息对参数进行约束并进行外显子读段数目归一化处理,解决了读段非均匀分布下的多源映射问题。通过引入"伪外显子"和"伪转录本"分别处理接合区读段和噪声读段。将模型应用到真实数据集上,并与原LDASeq(Latent Dirichlet allocation for sequencing data)模型和目前流行的Cufflinks与RSEM(RNA-Seq by expectation maximization)方法进行对比。结果显示,改进方法获得了更为准确的转录本及基因表达水平计算结果。; 石新新刘学军张礼; 关键词：基因表达 RNA-SEQ 非均匀性

基于RNA-seq数据的差异基因和异构体检测被引量：2: 2016年; 基因和异构体表达水平的差异检测是获取基因和异构体功能的重要途径,目前差异检测已经是转录组研究中一个重要的研究方向.RNA-seq技术近年来被广泛用于差异基因的检测.为模拟读段的非均匀分布,通常采用负二项分布对读段计数进行建模.现存的负二项分布模型大都是直接对基因读段计数进行建模,不能进行差异异构体检测.提出基于PGseq模型计算出的基因和异构体表达水平的负二项分布模型,采用exact test方法进行差异分析,解决了异构体的差异检测的问题.经实验验证,该方法在基因和异构体两方面的差异检测中都具有较高的准确度和灵敏度.; 王黎黎刘学军张礼; 关键词：RNA-SEQ 差异基因负二项分布 EXACT TEST

基于并行计算的大规模外显子芯片数据分析: 2015年; 快速准确地计算出转录组表达水平对转录组研究具有重要的作用。本文针对伽玛分布的概率模型(Gamma model for exon array data,GME)在处理大规模外显子芯片数据集上效率低下的特点,提出一种充分利用多核处理机或者集群环境来提高效率的并行计算方法。首先分析GME模型的原理,其次分析模型并行算法的选择,最后在不同规模的数据集上分析并行计算的效率。通过实验验证了并行计算极大地提高了模型的计算效率。实验结果表明,与先前的串行计算相比,并行计算使得GME模型更适用于大规模的外显子芯片分析。; 张武军刘学军张礼; 关键词：基因表达并行计算

基于多样本RNA-Seq数据的表达水平估计方法被引量：1: 2016年; 随着下一代高通量DNA测序的快速发展,RNA-Seq测序已成为转录组学分析的标准技术。在处理多样本RNA-Seq数据时,现有表达水平估计方法通常基于单个样本逐个处理,忽略了基因读段分布在样本间高度相似的特点。因此,提出了一个基于多样本RNA-Seq数据的表达水平估计方法,称为MRSeq。其关键是通过建立偏差曲线估计模型获得基因读段分布在样本之间的共享特征,通过偏差权重将共享特征嵌入到模型中,用来修正读段数据,同时通过增加稀疏约束来表现基因和异构体表达水平之间的稀疏性。进而将该模型应用到多个真实数据集进行评测,与目前主流方法的比较结果表明:MRSeq不仅能得到准确的基因和异构体表达水平,同时也获得了更有意义的生物解释。; 张礼刘学军陈松灿; 关键词：RNA-SEQ

任意形状林业目标物的像素级自动标注算法: 2023年; 在林业智能应用问题中,经常需要对遥感图像中的非刚性目标如“火”“烟”“云”等进行识别。由于此类目标物受限于颜色不确定(或渐变)以及无固定形状,导致现有图像标注方法的性能不佳甚至失效。因此,针对如何准确地选择目标物的兴趣区域(region of interest,ROI),进而提高像素标记的速度以及准确率进行了研究。针对图像目标物形状的非凸性,提出了任意形状ROI的像素级自动标注算法,该算法可将任意形状的兴趣区域转化为多个凸区域问题,针对分解后的每个凸壳内的像素进行提取、训练、标记。基于无人机拍摄的高清图像集,通过将其与边界框法、凸壳法、图像分割以及图像抠图方法进行实验对比,证明该方法存在易操作,符合人类视觉,求解速度快,可批量操作,且能够实现非刚性目标的像素级自动标注等特点。; 陈瑞园杨绪兵范习健张礼业巧林; 关键词：图像标注凸壳

高通量RNA-seq测序数据的基因表达水平分析研究: 近年来，新一代高通量DNA测序技术的快速发展，给人类研究基因组学和转录组学提供了巨大的技术支持，取得前所未有的成就。基于新一代测序技术的RNA-seq技术，正快速取代传统基因芯片技术，成为研究转录组学的标准技术手段。RN...; 张礼; 关键词：基因表达非参数模型

保留非全长读段的ISO-seq数据转录组表达分析被引量：2: 2019年; 近年来,基于单分子测序技术的ISO-seq数据以其超长读段长度被越来越多地应用于转录组新型异构体预测研究,但目前大多数研究工作只用到全长读段数据,丢失了非全长读段数据中较多有用信息,因而数据没有得到充分利用。针对这一问题,本文在保留非全长读段的基础上提出了两个能同时预测异构体结构和计算其表达比例的模型基于狄利克雷采样的异构体探测与预测(Dirichletsampling for isoform detection and prediction,DSIDP)和基于马尔科夫链的异构体探测与预测(Markovchain for isoform detection and predition,MCIDP)。两个模型均从全长读段中建立异构体预测集,并采用全长读段和非全长读段计算异构体表达比例。DSIDP将所有读段比对至异构体预测集,并使用Dirichlet采样解决多源映射问题,MCIDP使用马尔科夫链模拟基因外显子之间的选择性剪切,该模型还能预测出数据中没有全长读段的异构体。本文采用模拟数据和真实数据验证了两个模型的有效性。; 刘学军瞿锡垚张礼

针对SAR图像的树形稀疏表示结构识别算法研究被引量：2: 2017年; 为了提高SAR图像的目标识别能力,在一般稀疏表示方法的基础上,提出了一种基于树形稀疏表示结构识别算法—稀疏表示树,以提高目标型号的识别准确率。稀疏表示树是由多个节点组成的树形分类器,在每个节点上设计针对该节点设计的稀疏表示字典和分类器。在单个节点上利用稀疏表示算法求解未知样本的特征向量,并按照重构误差最小原则实现目标型号识别。稀疏表示树方法根据父节点识别结果,将稀疏表示结果相似的样本型号作为子集传递到子节点,并设计新的字典和分类器进行识别。在MSTAR SAR图像数据集上的实测结果表明,所构建的稀疏表示树与数据集数据分布情况一致,并且将目标型号识别率提高至84%,与传统的稀疏表示分类器方法相比,在不增加太多时间开销的条件下可有效提高目标型号的识别准确率。; 陈春林张礼刘学军; 关键词：字典学习

基于KL散度的RNA-Seq数据差异异构体比例检测被引量：3: 2017年; 近年来,RNA-seq技术被广泛应用于差异表达基因和异构体的检测,但目前大多数方法都是识别单个异构体的差异表达,无法同时检测同一个基因中所包含异构体表达比例的差异,因此提出一个差异异构体比例检测方法。该方法基于先前设计的sLDASeq模型,运用该模型中隐含变量的概率分布,采用KL散度进行差异异构体比例的分析。首先使用最新的SEQC数据集评估sLDASeq模型表达水平的性能,结果表明该方法能准确地估计基因中异构体的比例。接着通过模拟数据集进行差异异构体比例的检测,与其他方法相比,实验结果表明该方法在差异异构体比例检测方面具有较高的准确性。; 欧书华刘学军张礼; 关键词：KL散度

张礼

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

张礼

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈