王冬琦 作品数:10 被引量:39 H指数:3 供职机构: 东北大学软件学院 更多>> 发文基金: 辽宁省自然科学基金 辽宁省博士科研启动基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于社团密合度的复杂网络社团发现算法 被引量:10 2019年 传统的社团发现算法大多存在划分效果和复杂度相矛盾的问题,为了解决该问题,提出一种新的单社团结构评价标准——社团密合度(group density).在此基础上,设计了一种基于凝聚思想的社团发现算法,该算法通过不断融合小社团,使网络的社团结构向平均社团密合度最大的方向发展,并使用模块度检测算法的划分结果.通过与经典的GN,Fast Newman,LPA等算法对多个数据集进行实验对比,验证了本文算法在获得较好的划分效果的同时具有较低的时间复杂度. 陈东明 王云开 黄新宇 王冬琦关键词:复杂网络 社团结构 社团发现 模块度 创新学习的研究与探索(英文) 2016年 创新人才培养与创新学习、培养学生的创新思维、改革教学模式成为深化高等教育改革的主要方向之一。文章提出相应教学方法,最后给出评价方法,使用定量评价、CDIO、创新实践与实际相结合、翻转课堂教育和科学研究等方式,提升学生的创新能力。实践表明,新的改革探索可以得到较好的教学效果。 马毅 陈东明 王冬琦一种基于图折叠的网络嵌入方法 2019年 随着信息技术的广泛应用,信息网络正在变得无处不在,社交网络、引文网络、电信网络乃至生物网络等各类网络让信息网络研究受到了众多学科研究人员的关注。网络嵌入是一种保留网络拓扑信息和节点内容等其他附带信息的网络节点低维向量表示学习方法,在新的低维空间中网络分析挖掘任务可能更容易被解决,任务的运算复杂性也有可能降低。本文设计实现了一种基于完全子图折叠的网络嵌入方法,该方法把目标网络的k完全子图视为超节点,在以超节点为单位的新网络上使用任意网络嵌入算法学习超节点的向量表示,之后把超节点的向量表示作为对应k-完全子图中所有节点输入到任意网络嵌入学习算法的初始值,重新学习获得节点最终的向量表示。本文使用Deepwalk算法进行了实验,实验结果表明,本方法不但大幅提升了网络嵌入的速度,而且本方法学到的节点向量在一些下游应用中的表现也优于纯粹的Deepwalk算法。 冯晓硕 王冬琦关键词:网络嵌入 基于图像的数据增强方法发展现状综述 被引量:15 2021年 现阶段,基于深度学习的图像处理和识别技术已经发展的十分成熟,但在某些图像识别任务中由于深度学习技术的特点,一些深度神经网络模型层数较多导致的学习能力较强,将图像数据样本中的特征学习的过于充分,使得神经网络模型在训练数据上出现过拟合现象。同时,基于深度学习的图像处理算法训练的模型的好坏与数据集的质量、规模息息相关,但由于客观原因存在获得的图像数据集小、图像质量差,样本分布不均衡等现象。针对上述问题,研究人员提出通过使用图像数据增强技术实现对模型的输入数据的规模、质量和分布情况进行优化,将数据增强后的数据集用于深度学习模型将有效降低出现过拟合现象的概率。本文的主要工作是对现有的图像数据增强技术进行讨论,从传统图像处理方法和基于深度学习数据增强方法两方面进行梳理总结,其中传统图像处理方法有几何变换、颜色变换和像素变换;基于机器学习的图像数据增强方法有自动数据增强方法、基于生成对抗网络数据增强方法和基于自动编码器和生成对抗网络组合的数据增强方法。本文着重对图像融合、信息删除以及基于生成对抗网络的图像数据增强方法等技术进行介绍,并且对文中提出的数据增强方法的思想及其优缺点进行讨论,为研究人员在不同图像任务中利用对应的数据增强方法来优化数据集从而提高模型准确率提供研究思路。 冯晓硕 沈樾 王冬琦关键词:图像处理 基于MapReduce的分布式网络数据聚类算法 被引量:9 2013年 时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利用Map内合并技术对网络流量进行控制,在进行中间结果合并时仅对社团合并,而不考虑社团内部节点,以控制内存开销。使用模拟生成的数据在集群中进行实验,结果表明,当数据规模和集群规模增大时,该算法具有较好的加速比和扩展性。 陈东明 刘健 王冬琦 徐晓伟关键词:聚类算法 分布式聚类 社团结构 基于改进TADW的链路预测算法 2021年 针对经典的节点相似性链路预测算法只考虑网络拓扑结构或者节点属性信息的问题,使用词嵌入模型Word2vec学习得到节点文本属性信息的表示,进而改进TADW(text-associated deep walk)算法,弥补其语义信息表示能力的不足.基于改进的TADW图嵌入方法提出一种融合网络拓扑结构和节点属性信息的相似性指标,并基于此相似性指标提出链路预测算法.在三个真实数据集上的实验结果表明所提出算法可以提高预测精度,并具有更好的鲁棒性,同时使用图嵌入的方法有效解决了网络数据的稀疏性问题. 陈东明 孙政平 于开帅 王冬琦关键词:属性信息 链路预测 基于组合模型的车模识别算法研究 2021年 针对小比例车模识别中图像种类繁多、部分类间相似度较高、网络数据类别不均衡以及质量参差不一的问题,文章提出了一种组合模型。首先对网络采集的图像数据设计了一种基于深度学习的方法进行清洗,然后以破坏-重建学习(Destruction and Construction Learning)方法为基础结合文章提出改进的Class-Balanced Focal Loss权重调节方法构建细粒度识别模型,最后文章选取了3种评价指标对模型效果进行评价。实验结果表明,该组合模型相较于原方法能更加准确地对小比例车模进行识别,对于少数类具备更强的泛化能力。 张一博 茹禹然 赵文吕 王冬琦关键词:卷积神经网络 不平衡数据集 大流量分布式拒绝服务攻击的防御策略研究 被引量:1 2009年 大流量分布式拒绝服务攻击(High-rate Distributed Denial of Service Attack)是指导致网络流量激增,呈明显异常的"淹没受害者"式的DDoS,简称HDDoS。与其相对应的概念是低流量DDoS。通过建立、分析HDDoS的概念模型总结了其特点、分析了当前HDDoS防御策略的发展趋势。提出了一种基于离群数据挖掘算法的HDDoS防御策略ODM方法。实验证明,ODM方法解决了DDoS过滤中产生的间接伤害无法恢复的问题,是防御HDDoS的一种新思路。 王冬琦 郭剑峰 常桂然关键词:网络安全 分布式拒绝服务攻击 离群数据挖掘 基于二分网络社团划分的推荐算法 被引量:2 2018年 传统的基于用户的协同过滤(User-based CF)推荐算法的推荐效率随着数据的不断增加而降低.本文在User-based CF算法中引入二分网络社团发现理论,提出一种基于二分网络社团划分的推荐算法(RACD).首先通过用户与项目之间的关系建立用户-项目二分网络,然后通过RACD对该网络进行社团划分,得到用户的社团信息,最后通过同一社团中的其他用户对目标用户进行项目的推荐.在经典网络数据集上的实验结果表明,RACD能够有效提高推荐系统实时推荐效率. 陈东明 严燕斌 黄新宇 王冬琦关键词:社团划分 协同过滤 复杂网络 时态网络节点相似性度量及链路预测算法 被引量:2 2020年 详细分析和阐述了时态网络中的链路预测问题,将时态网络按时间顺序划分为具有相同时间间隔的多层网络快照序列.针对基于共同邻居的相似性指标对网络链路刻画粒度较粗糙的问题,提出了基于邻居节点聚类系数的相似性度量指标NCC和NCCP,并基于此提出时态网络链路预测算法.通过在真实数据集上的对比实验验证了利用邻居节点的聚类信息可以提高预测精度.利用真实邮件数据集验证了所提出的链路预测算法预测效果的优越性,并且实验结果证明越接近预测时间的网络结构对预测结果影响越大. 陈东明 袁泽枝 黄新宇 王冬琦关键词:链路预测 多层网络 聚类