陈梅玲
- 作品数:4 被引量:23H指数:3
- 供职机构:北京航空航天大学经济管理学院更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家高技术研究发展计划更多>>
- 相关领域:理学自动化与计算机技术环境科学与工程更多>>
- 基于Gram-Schmidt过程的判别变量筛选方法被引量:3
- 2011年
- 利用Gram-Schmidt过程,在自变量集合中选择对判别分类解释性最强的信息,删除对分类无显著解释作用的信息以及重复解释的信息,并把挑选出来的解释变量集合变换成若干直交变量.一方面实现了判别分析模型中的变量筛选,同时也解决了自变量多重共线条件下的有效建模问题.在选入变量的过程中运用F统计量检验变量的判别作用,更容易被统计应用人员所接受.为了说明所提算法的合理性和有效性,以Fisher判别分析建模为例,通过仿真数据建模取得了合理准确的分析结论.
- 王惠文陈梅玲Gilbert Saporta
- 流式大数据下随机森林方法及应用被引量:5
- 2015年
- 流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这个问题,分析了随机森林的算法特点,提出了根据决策树的准确度进行随机森林剪枝的思路。同时为了适应数据的变化,结合准确度间隔的概念提出生成、验证并补充新决策树的方法,最终形成可以不断随数据更新的随机森林,满足流式大数据环境对算法的要求。使用实际数据对改进后方法的可行性进行了验证,证明新方法在真实流式大数据场景中有着更高的分类准确度,最后分析讨论了随机森林方法如何进一步研究改进的主题。
- 刘迎春陈梅玲
- 关键词:决策树大数据社交网站搜索引擎剪枝分布式系统
- Gram-Schmidt回归及在刀具磨损预报中的应用被引量:14
- 2008年
- 多元线性回归是一种应用广泛的统计分析方法.在实际应用中,当自变量集合存在严重多重相关性时,普通最小二乘方法就会失效.为解决这一问题,利用Gram-Schmidt正交变换,提出一种新的多元线性回归建模方法——Gram-Schmidt回归.该方法可实现多元线性回归中的变量筛选,同时也解决了自变量多重相关条件下的有效建模问题.将该方法应用于机械加工过程中刀具磨损的预报分析,有效地进行了变量筛选,并得到了解释性强同时拟合优度也很高的模型结果.
- 王惠文陈梅玲Gilbert Saporta
- 关键词:多元线性回归刀具磨损
- 污染行业集中度与大气污染排放综合评价被引量:1
- 2016年
- 在我国经济快速发展的同时,环境污染问题也变得日趋严重。其中,工业污染与排放是造成环境污染的主要原因。本文基于中国31个省、自治区和直辖市的统计数据,利用偏最小二乘回归方法,构造了地区工业污染行业集中度与大气污染排放程度两个综合评价指数,并研究了中国各地区的污染分布特点。研究结果表明,地区大气污染排放程度与污染行业集中度之间存在很强的相关关系;而北京等地虽然污染行业集中度不高,但其实际污染情况会受到周边地区的严重影响。因此,还需要更加重视区域间的产业结构协调发展和综合环境治理,通过降低污染行业的排放,最终达到降低污染程度的目的。
- 王惠文顾杰陈梅玲
- 关键词:偏最小二乘回归