马双鸽
- 作品数:17 被引量:153H指数:6
- 供职机构:中国人民大学统计学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:经济管理医药卫生理学社会学更多>>
- 污染数据的稳健稀疏成组变量选择方法研究被引量:3
- 2018年
- 实证研究中的真实数据往往不完全符合模型的分布假设,存在污染数据的情况。大数据时代,大规模数据集的污染情况更加普遍。针对当数据存在不同来源污染时,构建基于最小密度势差异准则的成组Bridge模型,并设计有效算法完成稀疏成组变量选择。数值模拟研究说明该方法在不同污染数据情形及污染比例下具有良好的稳健性与稀疏性。关于婴儿出生体重影响因素的实证研究展示了该方法在应用研究中的优秀表现。
- 李扬许文甫马双鸽
- 关键词:污染数据
- 基于文本先验信息的贷款信用风险评估模型被引量:10
- 2021年
- 本文利用现有信用风险研究所蕴含的信息,构建了一个新的贷款信用风险评估模型—PIPL。该模型先通过文本挖掘技术对现有研究进行文本信息搜集,得到关于信用风险指标的先验词频以体现指标的重要性,再通过惩罚变量选择法将先验词频量化为先验因变量,最后基于先验因变量和原始数据构建模型,并通过弹性网筛选风险指标。模拟分析显示PIPL模型能自动识别先验信息的质量,当先验信息质量高时,它赋予先验信息较高的权重,从而改进了指标选择和分类效果,当先验信息质量较低时,它能自动降低先验因变量在模型中的权重,表现出稳健的分类效果。实证分析从知网挖掘123篇文献获取文本信息,并以P2P网贷数据为例,发现PIPL模型通过先验信息提高了分类的准确性,并表现出了良好的稳健性。
- 王小燕张中艳马双鸽
- 关键词:LOGISTIC回归贷款信用风险
- 基于动态SEIR模型的传染性疾病预测和政策评估被引量:4
- 2022年
- 突发传染病防控问题是近年来引起社会广泛关注的焦点话题,突发传染病不仅会对人们生命健康造成巨大威胁,还会对经济发展、社会稳定造成严重影响,实现突发传染病的及时预警、实时监控和合理预测对传染病防控有着非常重要的现实意义.本文在传播动力学SEIR(Susceptible Exposed Infectious Removed)模型的基础上,提出动态SEIR(dynamic SEIR)模型来研究突发传染病的传播趋势.该模型不仅可以考虑人口流动对疾病传播的影响,而且可以根据防控干预措施对模型参数进行动态估计,更符合传染病的病毒传播特点,有更好的预测效果.最后,本文提供相应的R软件包dSEIR供研究者使用.
- 方匡南任蕊朱建平马双鸽王晓峰
- 关键词:突发传染病传染病预测
- 山西省中老年居民医疗消费与医保使用现状调查
- 2018年
- 目的了解山西省中老年居民住院治疗和门诊治疗医疗消费和医疗保险的使用情况以及影响医疗费用支出和医疗保险使用的因素。方法于2016年7月对山西省1100名≥45岁的居民进行横断面调查。结果在调查前的1年时间里,分别有852人(87.65%)和620人(63.78%)接受了住院治疗和门诊治疗,分别有73人(8.57%)和365人(58.87%)在住院治疗和门诊治疗中未使用医疗保险;住院治疗者不使用保险的最主要原因是没有参加保险(39.7%),门诊治疗者不使用保险的最主要原因是治疗费用不包括在保险使用范围内(47.4%);两种治疗方式下,使用保险者的临床治疗费用和治疗总费用均明显高于不使用保险者;年龄、受教育程度、户口类型以及就诊医院类型选择影响医疗保险的使用;职业、就诊医院类型、是否有慢性病、平均个人收入、住院治疗的次数、教育程度和婚姻状况会影响医疗费用的支出。结论社会人口学特点会影响中老年居民在治疗过程中费用水平与保险使用情况;建议社保部门加快推进医保制度整合,提高医保使用效率。
- 姜昆王瑞王瑜马晨瑾马双鸽马双鸽
- 关键词:医疗保险抽样调查
- 群智体系网络结构的自治调节:从生物调控网络结构谈起
- 2021年
- 群体智能作为人工智能2.0时代最突出的研究方向之一,受到了工业界和学术界研究者们的广泛关注。传统的人工智能模型倾向于使用全连通网络结构,认为全连通网络结构的人工智能模型具有更高的准确率。然而,在面对存在强干扰的复杂对抗环境时,智能决策体系需要面对由通信干扰甚至针对性攻击所造成的系统结构扰动。在不失准确性的前提下,为了能够更快、更稳定地进行实时响应,需要智能系统的结构具有实时自治响应调整机制。此类自治响应调整机制在自然界中的调控网络中很常见。文中通过引入DReSS表征族来定量分析随机网络与真实网络中结构扰动对于系统演化的影响,对比了不同网络结构对于结构扰动的抗干扰能力,并提出了一套群智体系网络结构的自治调节构想。
- 殷子樵郭炳晖马双鸽马双鸽孙怡帆郑志明
- 关键词:群体智能计算生物学复杂网络
- 台湾居民医疗保险、医疗支出调查及其启示被引量:2
- 2012年
- 台湾全民健保由于财务收支及其他问题,于2011年年初出台了二代健保修正法,对保费计算标准、缴纳及个人承担比例等做了较大调整,政策调整对台湾居民的医疗支出有何影响?本文根据相关数据拟对台湾在二代健保修正法实施后家庭医疗保险覆盖率、医疗支出及其影响因素进行了初步研究,并进而提出值得大陆进行新一轮医保制度改革借鉴之处。
- 方匡南马双鸽谢邦昌
- 关键词:医疗保险财务收支修正法
- 不平衡数据的企业财务预警模型研究被引量:28
- 2016年
- 在股票市场中,由于被评为"ST"的公司数量远远少于普通的公司,所以用于训练财务预警模型的数据有着严重的不平衡性。而一般的分类模型如logistic回归等并不具备处理不平衡数据的能力。本文应用加权L1正则化支持向量机(w-L1SVM)构建一个可以处理不平衡数据的财务预警模型:一方面,w-L1SVM通过对两类样本的损失函数进行加权处理,有效地解决了样本不平衡性带来的预测精度问题;另一方面,w-L1SVM通过引入LASSO罚,使得模型在训练的过程中可以直接进行特征选择。通过数值模拟,本文验证了w-L1SVM在非平衡数据分类问题中的预测和特征选择表现。在实证研究中,本文针对我国股票市场机械、设备、仪表板块中的上市公司构建了一个基于w-L1SVM的财务预警模型,结果显示基于w-L1SVM的财务预警模型可以有效选择重要的财务指标并预测被评为"ST"的公司,并且其预测效果显著优于非加权的传统模型,这充分说明了w-L1SVM在财务预警问题中的适用性。
- 李扬李竟翔马双鸽
- 关键词:财务预警
- 基于网络结构Logistic模型的企业信用风险预警被引量:59
- 2016年
- 随着计算机和互联网的快速发展,特别是在大数据时代,企业积累了大量有关企业经营、财务等相关数据,变量众多且关系纷繁复杂,如果利用传统的logistic回归建立企业信用风险预警模型往往效果不好。本文在充分考虑变量间的网络结构(Network)关系基础上,提出了网络结构Logistic模型,通过惩罚方法同时实现变量选择和参数估计。蒙特卡洛模拟表明网络结构Logistic模型要优于其他方法。最后,我们将其应用到我国企业信用风险预警中,充分考虑财务指标间的网络结构关系,科学地选择评估指标,构建更加适合我国国情的企业信用风险预警方法。
- 方匡南范新妍马双鸽
- 关键词:企业信用风险网络结构LOGISTIC模型
- 宁夏回族自治区中老年居民医保使用和医疗消费现状调查研究
- 2020年
- 目的了解宁夏回族自治区中老年人群医疗保险使用情况和医疗消费情况,分析影响医疗保险使用和医疗消费支出的影响因素,为降低当地中老年人群的医疗负担提供建议。方法对宁夏地区45岁及以上中老年人群进行了抽样调查,应用Wilcoxon秩和检验、χ~2检验、多元线性回归和两分类logistic回归等方法进行分析。结果宁夏回族自治区山区和川区被调查者在教育水平、职业、家庭人均收入、体检频率上存在差异。调查前一年里分别有293人(37.66%)、461人(59.25%)和598人(76.86%)有过住院治疗、门诊治疗和自我治疗,其中分别有26人(8.87%)、281人(60.95%)和410人(68.56%)在治疗中没有使用医疗保险。未使用医疗保险的主要原因都是因为治疗费用不包括在保险使用范围内。年龄、职业、地区、是否有慢性病和就诊医院类型是影响医疗保险使用的主要因素。年龄、婚姻状态、教育程度、职业、就诊医院类型、户籍地、是否有慢性病及是否使用医保影响着医疗费用的支出。结论进一步扩充医疗保险药品目录,加强对弱势群体的宣传及政策倾斜,构建城乡统一的居民医疗保险制度,继续实施"山川有别"政策。
- 蒋妍张育铭朱彦頔李扬王晓军马双鸽王瑜
- 关键词:医疗保险影响因素
- 双向聚类方法综述被引量:6
- 2020年
- 传统的聚类方法由于无法提取样本和变量间的局部对应关系,并且当数据具有高维性和稀疏性时表现不佳,因此学者们提出了双向聚类,基于样本和变量间的局部关系,同时对样本和变量进行聚类,形成一系列子矩阵的聚类结果。近年来,双向聚类发展迅速,在基因分析、文本聚类、推荐系统等领域应用广泛。首先,对双向聚类方法进行梳理与归纳,重点阐述稀疏双向聚类、谱双向聚类和信息双向聚类三类方法,分析它们之间的区别和联系,并且介绍这三类方法在多源数据的整合分析、多层聚类、半监督学习以及集成学习上的发展现状和趋势;其次,重点介绍双向聚类在基因分析、文本聚类、推荐系统等领域的应用研究情况;最后,结合大数据时代的数据特征和双向聚类存在的问题,展望双向聚类未来的研究方向。
- 方匡南陈远星张庆昭马双鸽
- 关键词:子矩阵