王志海 作品数:83 被引量:464 H指数:11 供职机构: 北京交通大学计算机与信息技术学院 更多>> 发文基金: 国家自然科学基金 北京市自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 农业科学 更多>>
数据结构课程研究性教学理论及方法探索 被引量:11 2012年 研究数据结构课程的理论与实践内容体系及研究性教学理论与方法,提出协同教学和多元教学等观点。实践证明,这些探索在培养创新人才方面收到了良好的效果。 徐薇 王志海关键词:数据结构 研究性教学 协同教学 一种频繁模式决策树处理可变数据流 被引量:11 2016年 数据流中可能包含大量的无用信息或者噪声,频繁模式挖掘可以去除这些无用信息,且频繁模式比单个属性包含了更多的信息.因此,挖掘频繁的、有区分力的模式,可以用于有效的分类.该文提出一个两步骤算法PatHT(Pattern-based Hoeffding Tree)生成决策树用于可变数据流分类.第一步,设计增量更新算法CCFPM(Constraintsbased and Closed Frequent Pattern Mining),用于生成闭合约束频繁模式集合CFPSet(Closed Frequent Pattern Set).CCFPM中采用滑动窗口模型和时间衰减模型处理实例,设计一种均值衰减因子设置方法得到高完整性和准确性的模式集合.第二步,增量更新方法 HTreeGrow(Hoeffding Tree Growing)生成基于CFPSet的概念漂移决策树.该方法使用概念漂移检测器监督概念改变,自动调整分类模型.针对高密度和低密度的数据流,设计了不同使用模式集合的方法.在真实和模拟数据流上的实验分析表明,与其他同类算法相比,提出的方法对稳态数据流处理时可以明显提高正确率或可以明显降低训练时间,在处理不同概念漂移特性的可变数据流时也具有很好的分类效果. 韩萌 王志海 丁剑关键词:决策树 频繁模式挖掘 数据挖掘 基于局部梯度和二进制模式的时间序列分类算法 被引量:4 2022年 时间序列分类问题是时间序列数据挖掘中的一项重要任务,近些年受到了越来越广泛的关注.该问题的一个重要组成部分就是时间序列间的相似性度量.在众多相似性度量算法中,动态时间规整是一种非常有效的算法,目前已经被广泛应用到视频、音频、手写体识别以及生物信息处理等众多领域.动态时间规整本质上是一种在边界及时间一致性约束下的点对点的匹配算法,能够获得两条序列间的全局最优匹配.但该算法存在一个明显的不足,即不一定能实现序列间的局部合理匹配.具体的讲,就是具有完全不同局部结构信息的时间点有可能被动态时间规整算法错误匹配.为了解决这个问题,提出了一种改进的基于局部梯度和二进制模式的动态时间规整算法LGBDTW(local gradient and binary pattern based dynamic time warping),通过考虑时间序列点的局部结构信息来强化传统动态时间规整算法.所提算法虽然实质上是一种动态时间规整算法,但它通过考虑序列点的局部梯度和二进制模式值来进行相似性加权度量,有效避免了具有相异局部结构的点匹配.为了进行全面比较,将所提出的算法应用到了最近邻分类算法的相似性度量中,并在多个UCR时间序列数据集上进行了测试.实验结果表明,所提出的方法能有效提高时间序列分类的准确率.此外,实例分析验证了所提出算法的可解释性. 郝石磊 王志海 刘海洋关键词:动态时间规整 时间序列相似性 数据挖掘 基于卡方检验的Android恶意应用检测方法 被引量:6 2019年 移动终端爆发式增长造成了恶意应用的大量出现,给用户的隐私安全和财产安全带来了巨大的危害.为提高Android应用恶意性检测的准确性,本文将卡方检验与基尼不纯度增量相结合获取更有价值的特征属性;并改进朴素贝叶斯算法提高Android应用恶意性判断的准确性.实验结果表明:新的特征处理方法能够有效提高检测性能;同时,改进后的朴素贝叶斯算法相比原始算法而言准确率有较大的提升. 刘亚姝 王志海 李经纬 赵烜 文伟平关键词:恶意软件 卡方检验 朴素贝叶斯 一种基于YOLOV8的家禽健康监测系统及监测方法 本发明涉及家禽健康监技术领域,具体地说是一种基于YOLOV8的家禽健康监测系统及监测方法,包括数据采集、数据传送模块和健康监测终端,数据采集包括安装板、智能摄像头、电源、照明灯,数据传送模块包括数据存储单元和图像传输单元... 刘子乐 王志海一种基于粗糙集合理论的树扩张型贝叶斯网络分类器 被引量:5 2004年 在许多实际问题中朴素贝叶斯分类器的属性独立性假设是不成立的,为了进一步提高分类精度,许多研究者提出了一些试图放宽属性独立性假定的方法,其中树扩张型朴素贝叶斯分类器是近来广泛研究的一种有效的方法.基于基本粗糙集合理论中属性不精确或部分依赖关系的定义,提出了一种新的选择性受限树型贝叶斯网络分类器.通过实验表明该分类器在大多数实际问题上比当前两种最新的TAN分类器具有更低的误分类率,并且保持了计算上的高效性. 王志海 张璠关键词:朴素贝叶斯分类器 粗糙集 贝叶斯网络 关注目标的课程建设探索与实践 被引量:1 2017年 面向大类人才培养体系,对接基于《华盛顿协议》的工程认证标准,遵照结果导向教育理论,同时结合比较教育,提出关注培养目标的课程建设理念,从专业知识结构优化、课程目标定位和课程目标评价3方面,探讨计算机与信息类专业本科课程建设。 艾丽华 于双元 徐薇 王志海关键词:课程建设 比较教育 工程教育认证 基于条件对数似然函数导数的贝叶斯网络分类器优化算法 被引量:19 2012年 通常基于鉴别式学习策略训练的贝叶斯网络分类器有较高的精度,但在具有冗余边的网络结构之上鉴别式参数学习算法的性能受到一定的限制.为了在实际应用中进一步提高贝叶斯网络分类器的分类精度,该文定量描述了网络结构与真实数据变量分布之间的关系,提出了一种不存在冗余边的森林型贝叶斯网络分类器及其相应的FAN学习算法(Forest-Augmented Nave Bayes Algorithm),FAN算法能够利用对数条件似然函数的偏导数来优化网络结构学习.实验结果表明常用的限制性贝叶斯网络分类器通常存在一些冗余边,其往往会降低鉴别式参数学习算法的性能;森林型贝叶斯网络分类器减少了结构中的冗余边,更加适合于采用鉴别式学习策略训练参数;应用条件对数似然函数偏导数的FAN算法在大多数实验数据集合上提高了分类精度. 王中锋 王志海关键词:数据挖掘 分类器 贝叶斯网络 Boosting算法中基分类器权重的动态赋值方法 Boosting是一种有效的分类器组合方法,其通过加权投票来组合多个基分类器的方式来进行分类。在对基分类器进行权重赋值时,一般Boosting算法根据基分类器在当前训练集合上的错误率或某种变形来对基分类器分配权重。显然这... 付彬 王志海 王中锋关键词:元学习 组合分类器 BOOSTING方法 基于局部扰动的时间序列预测对抗攻击 2024年 时间序列预测模型已广泛应用于日常生活中的各个行业,针对这些预测模型的对抗攻击关系到各行业数据的安全性.目前,时间序列的对抗攻击多在全局范围内进行大规模扰动,导致对抗样本易被感知.同时,对抗攻击的效果会随着扰动幅度的降低而明显下降.因此,如何在生成不易察觉的对抗样本的同时保持较好的攻击效果,是当前时间序列预测对抗攻击领域亟需解决的问题之一.首先提出一种基于滑动窗口的局部扰动策略,缩小对抗样本的扰动区间;其次,使用差分进化算法寻找最优攻击点位,并结合分段函数分割扰动区间,进一步降低扰动范围,完成半白盒攻击.和已有的对抗攻击方法在多个不同深度模型上的对比实验表明,所提出的方法能够生成不易感知的对抗样本,并有效改变模型的预测趋势,在股票交易、电力消耗、太阳黑子观测和气温预测这4个具有挑战性的任务中均取得了较好的攻击效果. 张耀元 原继东 原继东 刘海洋 王志海关键词:时间序列预测 差分进化