辽宁省科学技术计划项目(2013405003) 作品数:14 被引量:28 H指数:4 相关作者: 任永功 刘洋 王存睿 赵月 王玉玲 更多>> 相关机构: 辽宁师范大学 大连民族大学 东北大学 更多>> 发文基金: 辽宁省科学技术计划项目 国家自然科学基金 大连市科技计划项目 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 更多>>
基于MapReduce的改进的Apriori算法及其应用研究 被引量:10 2017年 随着移动通信和互联网技术的迅猛发展,如何高效地分析移动用户的需求并及时推送有用信息成为数据挖掘领域的热点之一。针对上述问题,提出一种基于云计算Hadoop平台的分布式关联规则MRS-Apriori算法。该方法在经典Apriori算法的基础上优化了数据库编码规则,增加了判断标记Judgemark来判断事务项是否频繁,提高了MRS-Apriori算法在连接时扫描数据库的效率。在编码的基础上,采用Hadoop平台下的MapReduce编程框架模型实现并行化处理,提高了迭代时连接步骤的效率,降低了大规模数据样本运算的时间开销。实验结果表明,改进的MRS-Apriori算法可以有效地减少运算时间,在处理大规模数据集上具有较高的准确性。 赵月 任永功 刘洋关键词:关联规则 频繁项集 MAPREDUCE框架 一种利用不完整数据检测交通异常的方法 被引量:4 2016年 城市化进程的加快带来了严重的交通问题,检测交通异常成为数据挖掘领域的热点之一。传统道路管理主要是应用视频监控,使得处理交通问题的效率受限。鉴于上述原因,提出了一种利用不完整数据检测交通异常的方法(Traffic Anomaly Detection,TAD)。首先,利用相关性聚类从手机数据中获取车辆密度信息,降低处理不完整数据的计算开销;然后,设计一个自适应无参数检测算法,根据手机呼叫量变化率捕捉车辆的分散式动态异常,以解决道路状况不确定性难题;最后,提出异常轨迹算法来追踪异常分布路线并预测影响范围,提高异常检测效率。实验结果表明,TAD方法在不同的实验环境下能够有效地检测交通异常,与现有算法相比,所提算法在有效性和伸缩性上效果更好。 王玉玲 任永功关键词:异常检测 不完整数据 基于用户相关性的动态网络媒体数据无监督特征选择算法 被引量:5 2018年 移动互联网、社交媒体的快速发展,极大推动了各个领域对文本、图像、视频等网络媒体数据处理的需求.该类数据具有高维度、动态更新、内容复杂的特性,增加了特征计算以及分类难度.同时,当前网络媒体数据的特征选择方法主要针对静态数据,并且对数据格式规范性要求较高.针对上述问题,为保证对动态网络媒体数据的实时特征提取,该文提出了一种基于用户相关性的动态网络媒体数据无监督特征选择算法(Unsupervised Feature Selection Algorithm for Dynamic Network Media Based on User Correlation,UFSDUC).首先,对社交网络中的交互用户进行关系分析,作为无监督特征选择的约束条件.然后,利用拉普拉斯算子构建用户相关性的特征选择模型,量化相关用户之间的关系强弱,通过拉格朗日乘子法给出特征模型中最优用户关系的数学方法.最后,基于梯度下降法设定动态网络媒体数据的阈值,用以计算非零特征权值来更新最优特征子集,达到对网络媒体数据进行有效分类的目的.该算法可在保证用户在相关性完整的基础上对动态网络媒体数据进行准确、实时的特征选择.该文采用3个标准网络媒体数据集,同时与5种目前较为流行的同类型算法进行对比以验证算法的有效性. 任永功 王玉玲 刘洋 张晶关键词:梯度下降法 基于WLAN信号的线下客流分析技术研究 2015年 构建基于WLAN信号分析的非接触线下客流分析方法及系统。通过底层驱动使无线网卡在监听模式下抓取区域内的WLAN信号,通过监听阵列追踪顾客的无线信号行为,构建算法对数据进行分析和处理,形成客流分析数据为商业决策提供支撑。 王存睿 段晓东关键词:客流分析 族系间眼动行为模式多样性研究 2016年 中国是一个多民族国家,不同民族由于遗传、地域和文化等因素形成了不同的风俗和思考方式。为了研究不同民族观察事物时的眼动行为模式,利用Tobii眼动仪采集不同民族在求解数独问题时眼动轨迹表达数据,将不同族系被试的表达数据压缩为16维数据向量来构建数据集;分析对比布依族、蒙古族、朝鲜族、侗族和汉族等5个民族眼动行为数据集的多样性,利用多种机器学习方法对得到的数据进行测试分析。实验结果表明,族系间眼动行为存在多样性,同时为进一步深入探索不同族系间眼动行为的多样性提供了依据。 刘朋 逯波 段晓东 王存睿关键词:族系 基于秩约束密度敏感距离的自适应聚类算法 被引量:2 2017年 传统的聚类算法一般使用欧氏距离获得数据的相似矩阵,在处理一些较复杂的数据时,欧氏距离由于不能反映全局一致性,因此无法有效地描述出数据点的实际分布。提出了一种基于秩约束密度敏感距离(Rank Constraints Density Sensitive Distance,RCDSD)的自适应聚类算法。该方法首先引入密度敏感距离的相似性度量得到相似矩阵,有效地扩大了不同类数据点之间的距离,缩小了同类数据点间的距离,从而解决了传统聚类算法使用欧氏距离作为相似性度量导致聚类结果出现偏差的弊端;其次,在相似矩阵的拉普拉斯矩阵上施加秩约束,使相似矩阵的连通区域数等于聚类数,直接将数据点划分到正确的类中,得到最终的聚类结果,而不需要执行k-means或其它离散化程序。在人工仿真数据集和真实数据集上进行了大量实验,结果表明,所提算法得到了准确的聚类结果,并提高了聚类性能。 任永功 刘洋 赵月关键词:相似矩阵 聚类 基于计算机视觉的未识别民族面部特征研究 被引量:1 2016年 基于计算机视觉通过特征点定位方法提取图像中的人脸特征点,利用其构建了眉间距、瞳孔间距、眼睛宽度等多项指标来刻画民族人脸特征,并分析了穿青人、南京人、蔡家人和革家人等未识别民族的特征,且与汉族、朝鲜族、藏族、蒙古族、壮族和维族等民族进行了相似性度量。实验表明未识别民族的面部特征分布存在一定规律,但受性别影响,不同民族面部之间的相似性也不尽相同。研究结果不仅证实了利用计算机视觉技术对多民族人脸特征进行分析的可行性,也为民族学人类学的相关研究提供了一种新途径。 李泽东 曹丹 陆敏 段晓东 王存睿关键词:计算机视觉 面部特征 一种新压缩顶点链码 2017年 链码是一种以较少的数据存储表示线条、曲线和区域边界的编码技术。为进一步提高链码的压缩效率,提出了一种新的压缩顶点链码:改进的正交3方向顶点链码(IO3DVCC)。IO3DVCC将顶点链码(VCC)的统计特征与正交3方向链码(3OT)的方向特征相结合,共设5个码值。码值1将VCC中的1、3组合和3、1组合归并表示,码值2与VCC的对应码值表达相同,码值3与3OT中的码值2表达相同,码值4和码值5分别对应2个连续的新链码码值1和8个连续的VCC码值2。新链码基于Huffman编码,为不定长编码。针对100幅图像的轮廓边界,统计并计算了IO3DVCC与改进的相对8方向Freeman链码(ERD8FCC)、基于算数编码的变长相对四方向Freeman链码(AVRF4)、基于算数编码的正交3方向链码(Arith_3OT)、压缩VCC(CVCC)和改进的CVCC(ICVCC)6种链码各码值出现的概率、平均码值表达能力、平均码长和链码效率。实验结果表明,IO3DVCC效率最高。针对随机选择的20幅轮廓边界图像,统计并计算了IO3DVCC、Arith_3OT和ICVCC3种链码表达的总码数、二进制总位数,以及相对于8方向Freeman链码的压缩比率。实验结果表明,IO3DVCC的压缩效果最好。 魏巍 段晓东 刘勇奎 郭晨关键词:链码 HUFFMAN编码 图像边界 基于环型网络模体应用马尔科夫聚类的图挖掘模型 被引量:4 2017年 针对图数据挖掘效率低、精度低等问题,提出基于环型网络模体应用马尔科夫聚类的图挖掘模型.首先,依据输入图的点集,采用Erd o″s-Rényi模型生成随机图,在输入图和随机图的子图挖掘过程中利用向量的加法性质判定环型子图,计算网络模体的统计特征,判断子图是否为网络模体.然后,求解图中边的绝对贡献值关联矩阵,通过动态阈值法求得阈值,二值化处理该矩阵.最后,对已稀疏化的图进行扩张和膨胀操作,使其达到收敛状态.实验表明,文中模型有效减少运行时间,在保证聚类质量同时提高图挖掘效率. 任永功 索全明 刘洋基于多图像组信息的人脸识别研究 2017年 提出利用多图像组信息构建二部学习框架进行人脸识别。首先,利用两种不同的多图像组信息源分别学习两个相应的度量空间模型;其次,将得到的模型合并为一个统一的判别距离度量空间;最后,对所构建的二部学习框架进行范化,使得框架中的多图像组信息能够用来进行子空间学习和距离度量学习。通过在多个标准通用数据集上得到实验结果验证了所提出方法的有效性。 逯波 段晓东 王存睿 李泽东关键词:人脸识别