丁剑 作品数:19 被引量:97 H指数:6 供职机构: 北方民族大学计算机科学与工程学院 更多>> 发文基金: 国家自然科学基金 宁夏回族自治区自然科学基金 国家民委科研基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于Lucene引擎的电子商务网站站内搜索系统 2010年 通过对搜索引擎工具包Lucene的分析器、索引包、文档等结构分析,对数据库、Web页面、PDF文件等将要检索的数据源,进行统一接口设计,将这些数据统一转换为XML文件,实现门户网站快速高效及可灵活定制的站内全文搜索。 丁剑关键词:LUCENE 分词 基于交叉验证的BP算法的改进与实现 被引量:31 2008年 针对BP算法存在的收敛速度慢等问题提出改进方案,修改其相关参数并且提出如何选择合适的隐藏层节点个数。同时针对学习样本数据的有限性、BP算法易陷入局部最小值和容易出现过拟合等问题进行了研究,提出了采用多重交叉验证的再改进BP算法。仿真结果表明,交叉验证BP算法提高了网络学习的效率。 韩萌 丁剑关键词:神经网络 BP算法 过拟合 误差函数 基于Flex和FMS的远程教学直播系统的设计与实现 被引量:6 2011年 结合Flex流技术、Web技术和数据库技术,采用Flash Media server构建一套能够在校园网内进行流畅直播的教学系统,并给出具体的实现方法,同时也对今后的远程教育工作提供一种新的思路。使用该系统,可以在网络直播的同时,将需要的教学片段、节目录制下来,结合校园网的VOD视频点播系统,供校园网内的师生随时点播观看。 丁剑关键词:FLEX FMS 远程教学 直播 概念漂移数据流挖掘算法综述 被引量:13 2016年 数据流是一种新型的数据模型,具有动态、无限、高维、有序、高速和变化等特性。在真实的数据流环境中,一些数据分布是随着时间改变的,即具有概念漂移特征,称为可变数据流或概念漂移数据流。因此处理数据流模型的方法需要处理时空约束和自适应调整概念变化。对概念漂移问题和概念漂移数据流分类、聚类和模式挖掘等内容进行综述。首先介绍概念漂移的类型和常用概念改变检测方法。为了解决概念漂移问题,数据流挖掘中常使用滑动窗口模型对新近事务进行处理。数据流分类常用的模型包括单分类模型和集成分类模型,常用的方法包括决策树、分类关联规则等。数据流聚类方式通常包括基于k-means的和非基于k-means的。模式挖掘可以为分类、聚类和关联规则等提供有用信息。概念漂移数据流中的模式包括频繁模式、序列模式、episode、模式树、模式图和高效用模式等。最后详细介绍其中的频繁模式挖掘算法和高效用模式挖掘算法。 丁剑 韩萌 李娟关键词:数据流挖掘 聚类 概念漂移 残疾人呼叫系统研究与设计 2013年 呼叫系统的主要功能是残疾人的手持呼叫终端通过GPS从卫星获取坐标数据,将位置信息通过移动网络或短信发送至政府调度部门或其监护人手持设备中。其中监护人端设备将直接读取短信坐标并显示位置,同时提醒其进行救助,政府调度部门接收信号将与数据库比对从而对该残疾人提供针对性的帮助。 马光华 徐亚苹 李洁 丁剑关键词:呼叫中心 基于交叉验证的神经网络实现 被引量:10 2008年 针对神经网络BP算法存在收敛速度慢、学习数据有限和网络学习过程易陷入局部最小值等问题,提出对标准BP算法相关参数进行调整并选择合适的隐藏层个数的方法,然后采用交叉验证方法对BP算法做了再改进。仿真结果表明基于交叉验证的BP算法优于传统的BP算法。 丁剑 韩萌关键词:神经网络 BP算法 误差函数 一种频繁模式决策树处理可变数据流 被引量:10 2016年 数据流中可能包含大量的无用信息或者噪声,频繁模式挖掘可以去除这些无用信息,且频繁模式比单个属性包含了更多的信息.因此,挖掘频繁的、有区分力的模式,可以用于有效的分类.该文提出一个两步骤算法PatHT(Pattern-based Hoeffding Tree)生成决策树用于可变数据流分类.第一步,设计增量更新算法CCFPM(Constraintsbased and Closed Frequent Pattern Mining),用于生成闭合约束频繁模式集合CFPSet(Closed Frequent Pattern Set).CCFPM中采用滑动窗口模型和时间衰减模型处理实例,设计一种均值衰减因子设置方法得到高完整性和准确性的模式集合.第二步,增量更新方法 HTreeGrow(Hoeffding Tree Growing)生成基于CFPSet的概念漂移决策树.该方法使用概念漂移检测器监督概念改变,自动调整分类模型.针对高密度和低密度的数据流,设计了不同使用模式集合的方法.在真实和模拟数据流上的实验分析表明,与其他同类算法相比,提出的方法对稳态数据流处理时可以明显提高正确率或可以明显降低训练时间,在处理不同概念漂移特性的可变数据流时也具有很好的分类效果. 韩萌 王志海 丁剑关键词:决策树 频繁模式挖掘 数据挖掘 基于JSP和Java Beans的网上自动抽题组卷系统 2004年 以网上自动抽题组卷系统为案例背景 。 丁剑 景永俊关键词:JSP JAVA BEANS 面向对象 基于Web的虚拟现实的研究与应用 被引量:4 2009年 该文介绍了如何用VRML建立基于Internet的逼真的,交互式的虚拟教室,以及虚拟教室在实践教学中的应用。 丁剑 魏昕 景永俊关键词:VRML 虚拟现实 虚拟教室 JAVA 一种使用shapelets的增量式时间序列分类 被引量:1 2016年 根据时间序列数据维度高、实值有序、数据间存在自相关性等特点,对时间序列分类过程进行研究。研究了当前比较流行的时间序列分类方法;从图像处理的角度出发,提出了一种将图片信息转化为时间序列数据的ITTS方法。shapelets作为最能够表示一条时间序列的子序列,随着时间的推移,这个特征序列可能会动态地发生变化。基于这样的思想,提出了一种基于动态发现shapelets的增量式时间序列分类算法IPST。该算法能够较好地动态发现当前最优的k个shapelets,从而提高时间序列分类的准确度。得到的shapelets集合还可以与多个传统的分类器结合,从而获得更佳的分类效果。 丁剑 王树英关键词:时间序列 增量式学习