您的位置: 专家智库 > >

文献类型

  • 6篇期刊文章
  • 1篇学位论文

领域

  • 6篇医药卫生
  • 2篇理学

主题

  • 5篇维数
  • 5篇高维
  • 5篇高维数据
  • 2篇先验
  • 2篇控制方法
  • 2篇贝叶斯
  • 2篇FDR
  • 2篇NON-LO...
  • 1篇单核
  • 1篇单核苷酸
  • 1篇单核苷酸多态
  • 1篇单核苷酸多态...
  • 1篇多态
  • 1篇多态性
  • 1篇血脂
  • 1篇血脂异常
  • 1篇职业倦怠
  • 1篇职业卫生
  • 1篇生活质量
  • 1篇数据分析

机构

  • 7篇山西医科大学
  • 1篇山西省肿瘤医...
  • 1篇绍兴市疾病预...

作者

  • 7篇许树红
  • 6篇王彤
  • 3篇王慧
  • 3篇陶然
  • 2篇王聪
  • 2篇乔楠
  • 2篇田双双
  • 2篇崔燕
  • 2篇梁洁
  • 2篇董晓强
  • 2篇刘晓萌
  • 2篇高倩
  • 1篇马晋峰
  • 1篇孙红卫
  • 1篇范晔
  • 1篇李艳艳

传媒

  • 3篇中国卫生统计
  • 2篇中华疾病控制...
  • 1篇中华流行病学...

年份

  • 1篇2020
  • 1篇2018
  • 4篇2017
  • 1篇2016
7 条 记 录,以下是 1-7
排序方式:
高维组学数据分析中的贝叶斯变量选择方法被引量:2
2017年
随着基因组测序技术和生物信息学的迅猛发展,近几年涌现了大量与疾病相关的组学数据即所谓高维数据。对于这类组学数据,共同特点是自变量个数p通常远大于观察例数n,且自变量间往往高度相关,从成千上万个组学数据中识别出真正有意义的自变量带来一些统计学挑战。本文对高维数据中的贝叶斯变量选择方法做论述。
董晓强许树红陶然王彤
关键词:高维数据
基于LASSO类方法的Ⅰ类错误的控制被引量:2
2017年
全基因组关联研究(genome-wide association studies,GWAS)是在全基因组范围内同时研究上百万个单核苷酸多态性(single nucleotide polymorphism,SNP)位点与疾病或某些性状之间的关联,从而筛选出可能的致病SNP位点,进而对这些位点进行人群验证和实验分析。在GWAS研究中比较传统的分析方法是针对每个SNP和结局变量间关联进行单因素分析的假设检验,而待分析的SNP数量有几十万甚至上百万个,使得检验次数十分巨大,如果不采用合适的方法进行多重性校正来妥善控制Ⅰ类错误,会产生许多假阳性结果,对这些结果进行验证将耗费很多时间和财力,造成不必要的损失。针对全基因组测序数据进行多因素建模常采用的分析策略为降维和变量选择。
许树红王慧孙红卫王彤
关键词:单核苷酸多态性高维数据
基于LASSO的FDR控制方法及其在高维数据生存分析中的应用被引量:5
2018年
目的基于LASSO-Cox模型探索交叉验证(cross validation)、pcvl法(penalized cross-validated log-likelihood)、EBIC准则(extended bayesian information criterion)、平稳选择(stability selection)四种方法在控制FDR(false discovery rate)方面的表现及其变量选择效果。方法通过模拟研究评价各方法在不同删失比例、自变量间不同相关程度以及回归系数的不同稀疏水平下的FDR和PSR(positive select rate),并从GEO上下载DLBCL数据进行基因与预后间的关联分析。结果模拟结果表明,在不同删失比例、自变量相关程度和稀疏水平的情况下,平稳选择法控制FDR的能力都优于其他方法且其变量选择效能也较高。EBIC准则在相关程度低、自变量较稀疏时表现较好,当样本量较小时结果较保守。pcvl法虽然不容易漏掉有效应的变量,但其FDR仍较高。实例结果显示,EBIC准则只选出1个基因,平稳选择法选出的基因中大部分有统计学意义且与其他方法的结果重合度高。结论在基于LASSO-Cox模型的高维数据生存分析中平稳选择法能较好地控制FDR且其变量选择效能也较高。
许树红董晓强陶然高雪高倩高倩王彤
基于non-local先验的贝叶斯变量选择方法及其在高维数据分析中的应用
2020年
目的对高维数据进行变量筛选并构建预测模型是组学数据分析的研究热点之一。本研究旨在为结局为二分类变量的高维组学数据筛选自变量并构建预测结局的稀疏统计模型。方法本研究通过模拟研究和实例分析阐释基于non-local先验的贝叶斯变量选择方法--乘积逆矩先验(product inverse moment,piMOM)相较于惩罚类方法ISIS-光滑平切绝对偏差(iterative sure independence screening-smoothly clipped absolute deviation,ISIS-SCAD)和ISIS-最小最大凹惩罚(iterative sure independence screening-minimax concave penalty,ISIS-MCP)在高维数据中变量筛选及其预测效果的性能优劣。结果模拟研究发现:在高维的情况下,经piMOM、ISIS-SCAD和ISIS-MCP方法筛选所得变量的平均真阳性数和受试者工作特征曲线下面积(AUC,area under curve)基本相等,ISIS-SCAD、ISIS-MCP的平均假阳性数、回归系数均方误差以及预测均方误差明显高于基于non-local先验的贝叶斯变量方法所获得的对应值。piMOM方法分析弥漫大B细胞淋巴瘤实例数据共识别5个有意义的基因,AUC为0.996;ISIS-SCAD识别7个基因,AUC为0.975;ISIS-MCP识别7个基因,AUC为0.968。结论在模型选择相合性和预测准确性方面,piMOM方法与ISIS-SCAD和ISIS-MCP相比,具有优势,在一定意义上可有效控制假阳性率。
马金沙董晓强高倩陶然许树红李艳艳王彤
关键词:高维数据弥漫性大B细胞淋巴瘤
男性煤矿工人高体力活动水平与不同定义下血脂异常水平的关联性被引量:3
2017年
目的探讨山西大同煤矿集团男性工人体力活动度对血脂异常的影响。方法采用两阶段整群分层抽样方法抽取大同煤矿共3 656名男性矿工进行调查。血脂异常的诊断依据中国成人血脂异常防治指南,并分为四种情况。体力活动度的评价依据国际体力活动问卷处理指南的要求分为低、中、高三水平。结果在男性煤矿工人中,体力活动低、中、高三水平所占比例分别为17.65%、15.18%和67.17%。在控制了混杂因素(年龄、体质指数(body mass index,BMI)、腰臀比、吸烟情况、饮酒情况等)的情况下,与低体力活动水平相比,高体力活动水平与高甘油三酯(triglyceride,TG)水平(OR=0.72,95%CI:0.58~0.90)、低高密度脂蛋白(high density lipoprotein,HDLC)水平(OR=0.68,95%CI:0.55~0.84)、高低密度脂蛋白(low density lipoprotein,LDL-C)水平(OR=0.68,95%CI:0.55~0.85)、血脂异常A(OR=0.68,95%CI:0.55~0.84)、血脂异常B(OR=0.67,95%CI:0.54~0.84)、血脂异常D(OR=0.44,95%CI:0.20~0.97)均有关联(均有P<0.05),而中体力活动水平与血脂异常的发生关联均无统计学意义(均有P>0.05)。结论研究结果表明,适当高强度的体力活动是男性煤矿工人血脂异常的保护因素。
陶然黄建军孙晨明马晋峰范晔乔楠梁洁刘晓萌崔燕田双双王聪王慧许树红王彤
关键词:血脂异常职业卫生流行病学研究
煤矿井下工人职业倦怠对生活质量影响的路径分析被引量:2
2016年
目的探讨同煤集团井下工人职业倦怠对其生活质量的影响。方法采用两阶段分层抽样的方法,选取同煤集团井下工人1 998名,对其进行关于一般情况、生存质量和职业倦怠的调查。结果井下工人生存质量量表各维度得分分别为生理维度13.72,心理维度12.90,社会维度14.11,环境维度12.10,均高于中值12.00;生存质量量表4个维度得分与职业倦怠量表3个维度得分呈负相关;路径分析显示,玩世不恭和成就感低落对生存质量的4个维度都有直接负向效应,而情绪衰竭对生存质量的生理、社会、环境3个维度有直接负向效应。结论煤矿井下工人的生活质量整体偏低;职业倦怠程度越高其生活质量就会越差;情绪衰竭、玩世不恭与成就感低落是影响生活质量的重要因素。
刘晓萌黄建军孙晨明乔楠崔燕田双双王聪王慧梁洁许树红王彤
关键词:生活质量问卷调查
基于LASSO的FDR控制方法及其在高维数据生存分析中的应用
目的:针对传统的LASSO调整参数选择方法中错误发现率(False Discovery Rate, FDR)过高的问题,介绍三种控制 FDR的调整参数选择方法的基本原理,并基于LASSO-Cox模型探索CV法(Cross...
许树红
关键词:卫生统计
共1页<1>
聚类工具0