您的位置: 专家智库 > >

杨杏丽

作品数:20 被引量:41H指数:3
供职机构:山西大学更多>>
发文基金:国家自然科学基金山西省科技基础条件平台建设计划项目国家社会科学基金更多>>
相关领域:自动化与计算机技术理学经济管理文化科学更多>>

文献类型

  • 11篇期刊文章
  • 6篇专利
  • 2篇学位论文

领域

  • 15篇自动化与计算...
  • 3篇理学
  • 1篇经济管理
  • 1篇文化科学

主题

  • 7篇正则
  • 7篇正则化
  • 5篇组块
  • 3篇语义
  • 3篇预处理
  • 3篇神经网
  • 3篇神经网络
  • 3篇雾霾
  • 2篇地基
  • 2篇学习算法
  • 2篇语言处理
  • 2篇语义角色
  • 2篇时间序列预测
  • 2篇数据空间
  • 2篇数据预处理
  • 2篇图像
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇网络
  • 2篇细粒度

机构

  • 19篇山西大学

作者

  • 19篇杨杏丽
  • 8篇王钰
  • 6篇李济洪
  • 2篇王瑞波
  • 2篇王瑞波
  • 2篇曹学飞
  • 1篇张娜
  • 1篇杨静
  • 1篇谷波
  • 1篇李国臣
  • 1篇牛倩
  • 1篇陈萌萌

传媒

  • 2篇计算机技术与...
  • 1篇云南师范大学...
  • 1篇系统科学与数...
  • 1篇应用概率统计
  • 1篇中文信息学报
  • 1篇计算机与现代...
  • 1篇计算机科学
  • 1篇中国科技成果
  • 1篇无线互联科技
  • 1篇计算机科学与...

年份

  • 4篇2023
  • 7篇2021
  • 3篇2020
  • 1篇2019
  • 1篇2015
  • 1篇2014
  • 1篇2010
  • 1篇2009
20 条 记 录,以下是 1-10
排序方式:
分类学习算法的性能度量指标综述被引量:18
2021年
在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各性能度量指标的提出背景、意义以及适用范围,分析了各种性能度量之间的差异,提出和分析了各方法中有待进一步研究的问题和方向。进一步,通过实验数据横向(每类度量中各方法之间的类内差异)和纵向(3类度量之间的类间差异)对照了各性能度量指标之间的差异,分析了各性能度量指标在分类算法选择上的一致性。
杨杏丽
关键词:错误率混淆矩阵
一种基于特征增强ConvLSTM的雾霾预测方法
本发明涉及一种基于特征增强ConvLSTM的雾霾预测方法。目的是解决现有的雾霾预测方法过多地依赖前提假设、预测结果准确率不高、未运用数据空间信息的技术问题。技术方案为:一种基于特征增强ConvLSTM的雾霾预测方法,包括...
王钰张钰洁杨杏丽
文献传递
一种基于正则化交叉验证的语义角色识别的聚合方法
本发明给出了一种基于正则化交叉验证的语义角色识别的聚合方法,属于自然语言处理技术领域。采用神经网络模型来构造语义角色识别的聚合方法,通过合理选择超参数配置,进而得到多个合适的子模型,并对这些子模型聚合提升语义角色识别的性...
曹学飞杨杏丽
基于规则的中文阅读理解问题回答技术研究被引量:1
2009年
该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%,且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。
李济洪杨杏丽王瑞波张娜李国臣
关键词:计算机应用中文信息处理问答系统正交表
基于交叉验证深度CNN特征集成的地基气象云图分类方法
本发明属于地基气象云图分类技术领域,具体涉及基于交叉验证深度CNN特征集成的地基气象云图分类方法。本发明首先利用卷积神经网络模型提取地基气象云图像的深层CNN特征,然后基于交叉验证进行CNN特征的多次重抽样,最后,基于多...
王钰章豪东杨杏丽李济洪
文献传递
方差正则化的分类模型选择准则被引量:1
2019年
在传统的机器学习中,模型选择常常是直接基于某个性能度量指标的估计本身进行,没有考虑估计的方差,但是这样的忽略极有可能导致错误模型的选择。于是考虑在分类模型选择研究中添加方差的信息的方法,以提高所选模型的泛化能力,即将泛化误差性能度量指标的组块3×2交叉验证估计的方差估计作为正则化项添加到传统模型选择准则中,提出了一种新的方差正则化的分类模型选择准则。模拟和真实数据实验验证了在分类模型选择问题中,提出的模型选择准则相比传统方法选到正确分类模型的概率更大,验证了方差在模型选择中的重要性以及提出的模型选择准则的有效性。进一步,理论上证明了在二分类问题的模型选择中,该模型选择准则具有选择的一致性。
房立超王钰杨杏丽李济洪
关键词:泛化误差
融合深度神经网络特征的ARIMAX雾霾PM2.5预测
2023年
目前,雾霾污染问题是关乎国计民生的重大问题,它已经对人们的生产、生活、身体健康,以及生态环境和气候变化都产生了很大的影响。这样,如何通过监测雾霾变化获取的雾霾相关信息去准确预测雾霾污染物的浓度,以防治和减轻雾霾造成的严重后果变得尤为重要。因此,通过在简单有效的传统ARIMAX模型基础上融入深度神经网络语义特征,提出了一种新的雾霾PM2.5浓度预测框架。首先,把对雾霾预测有显著影响的气象因子温度、压力、相对湿度数据转换为图像数据;然后,运用ResNet-50(Residual Network-50)卷积神经网络模型提取深度语义特征,进而运用主成分分析(Principal Component Analysis,PCA)技术处理高维特征,得到最佳深度神经网络特征组合;最后,用ARIMAX技术建立雾霾PM2.5浓度预测模型。在收集的山西省2015~2019年PM2.5浓度和气象因子数据集上验证了该预测框架在皮尔逊相关系数(Pearson’s Correlation Coefficient,PCC)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)度量下,对于1、3、5和7天长短期预测,都始终优于传统的简单差分自回归滑动平均(Autoregressive Integrated Moving Average,ARIMA)模型、三因素ARIMAX模型、多元回归模型、ResNet-多元回归模型、长短期记忆网络(Long and Short-Term Memory,LSTM)模型和支持向量机(Support Vector Machine,SVM)模型。
张钰洁王钰杨杏丽
一种基于投票策略的高维特征选择方法
本发明公开了一种基于投票策略的高维特征选择方法,涉及集成特征选择领域。该方法包括:(1)给定特征维度为d的有限数据集D<Sub>n</Sub>,利用正则化组块m×2交叉验证的方法对数据集进行切分,得到2m个样本大小为n/...
杨杏丽李济洪王子慧王瑞波王钰
文献传递
基于正则化KL距离的交叉验证折数K的选择被引量:4
2021年
在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不是这样。因此,可以通过度量训练集和测试集的分布一致性来进行K折交叉验证折数K的选择。直观地,KL(Kullback-Leibler)距离是一种合适的度量方法,因为它度量了两个分布之间的差异。然而直接基于KL距离进行K的选择时,从多个数据实验结果发现随着K的增加KL距离也在增大,显然这是不合适的。为此,提出了一种基于正则化KL距离的K折交叉验证折数K的选择准则,通过最小化此正则KL距离来选择合适的折数K。进一步多个真实数据实验验证了提出准则的有效性和合理性。
褚荣燕王钰杨杏丽李济洪
关键词:正则化
一种融入正则化特征表示策略的深度神经网络气象云图像压缩方法
本发明涉及一种融入正则化特征表示策略的深度神经网络气象云图像压缩方法,目的是解决现有神经网络方法在获取图像有用特征的同时引入冗余特征,降低图像分析精度的技术问题。技术方案为:它包括如下步骤:编码网络、特征学习;计算特征表...
王钰杨静杨杏丽
共2页<12>
聚类工具0