您的位置: 专家智库 > >

陈兴国

作品数:55 被引量:85H指数:4
供职机构:南京邮电大学更多>>
发文基金:国家自然科学基金江苏省自然科学基金创新研究群体科学基金更多>>
相关领域:自动化与计算机技术文化科学经济管理理学更多>>

文献类型

  • 36篇专利
  • 17篇期刊文章
  • 1篇学位论文
  • 1篇科技成果

领域

  • 32篇自动化与计算...
  • 6篇文化科学
  • 2篇经济管理
  • 1篇电子电信
  • 1篇理学

主题

  • 6篇学习算法
  • 6篇用户
  • 6篇网络
  • 5篇智能体
  • 5篇强化学习算法
  • 4篇最小化
  • 4篇环境模型
  • 3篇神经网
  • 3篇神经网络
  • 3篇水质
  • 3篇自动化
  • 3篇自动化控制
  • 3篇协方差
  • 3篇近端
  • 3篇机器人
  • 3篇函数估计
  • 3篇核方法
  • 3篇感器
  • 3篇传感
  • 3篇传感器

机构

  • 50篇南京邮电大学
  • 13篇南京大学
  • 2篇江苏省地方税...
  • 1篇南京航空航天...
  • 1篇南京理工大学
  • 1篇杭州电子科技...
  • 1篇清华大学
  • 1篇计算机软件新...

作者

  • 55篇陈兴国
  • 7篇程春玲
  • 6篇高阳
  • 5篇黄海平
  • 5篇朱洁
  • 4篇戴华
  • 4篇王鹏
  • 4篇李扬
  • 4篇徐宁
  • 4篇李琦
  • 3篇杨光
  • 2篇刘威
  • 2篇余瀚
  • 2篇张鹏
  • 2篇王皓
  • 2篇高阳
  • 2篇谢毅
  • 2篇王家良
  • 2篇陈蕾
  • 2篇陈蕾

传媒

  • 2篇自动化学报
  • 2篇模式识别与人...
  • 2篇计算机科学与...
  • 1篇计算机光盘软...
  • 1篇电子学报
  • 1篇南京大学学报...
  • 1篇计算机学报
  • 1篇现代计算机
  • 1篇软件学报
  • 1篇计算机科学
  • 1篇现代计算机(...
  • 1篇软件导刊
  • 1篇计算机教育
  • 1篇科教导刊(电...

年份

  • 19篇2023
  • 4篇2022
  • 4篇2021
  • 3篇2020
  • 2篇2019
  • 7篇2018
  • 6篇2017
  • 2篇2016
  • 2篇2015
  • 3篇2014
  • 1篇2013
  • 2篇2008
55 条 记 录,以下是 1-10
排序方式:
一种形态滤波方法及装置
本发明公开了一种形态滤波方法,属于模式识别技术领域。本发明针对现有形态滤波算法结构固定、需预设结构元素和偏倚校正系数等不足,对其进行了改进,利用多层滤波形式,每层根据前后滤波的差值选取较优结构元素,并根据前后滤波信号的相...
程春玲王家良高阳陈兴国
文献传递
基于强化学习的多用户水产养殖自动调控系统及方法
本发明提出了一种基于强化学习的多用户水产养殖自动调控系统,主要由控制终端、数据终端和云平台三个模块,控制终端用于采集水体数据和大气环境数据,并将采集的数据传送至数据终端,同时能够操控自动控制模块调整水产环境;数据终端用于...
陈兴国陈康扬吴浩宇陈蕾
文献传递
社交网络中基于用户兴趣的登录认证方法
本发明公开了社交网络中基于用户兴趣的登录认证方法,首先选定具体的基于Web的社交网络应用场景,可以是电脑桌面终端也可以是智能移动终端,用户完成注册;将用户信息分为较稳定信息和不稳定信息两类,构建用户的信息模型。较稳定信息...
黄海平王鹏祁凌涛徐宁程春玲李琦陈兴国戴华
基于效用函数的期望最大搜索算法
2023年
强化学习已在各行业得到广泛应用,强化学习所需的大量探索在很多语境下均可能带来严重后果。为此,业界提出安全强化学习。从经济学中借鉴的效用函数是其中的一种常用技巧,但其在搜索算法中还未得到充分研究。当智能体在风险中立的语境下进行训练后,如何利用搜索算法将其迁移至风险敏感语境中仍是一个需要解决的问题。因此,提出向期望最大搜索算法中加入安全强化学习常用的效用函数技巧进行改进。以2048游戏为例,基于2022年最新的NTuple方法及在风险中立语境下所训练的权重,实验了不同的超参数。实验结果表明,将sigmoid函数作为效用函数应用于搜索算法中,可以显著提升算法性能。其中,在2层搜索中,改进后的算法相较于原始算法提升了14053.35分,在3层搜索中,提升了6522.9分。
魏语轩李昕闻陈兴国
关键词:效用函数
面向复杂交互场景的新型机器学习技术
高阳史颖欢霍静杨琬琪王皓陈兴国胡裕
机器学习是模式识别、机器视觉、数据挖掘等方向的支撑技术之一,被广泛应用到安防、医疗、大数据分析等领域。基于样本的独立同分布假设,监督学习技术通过学习已标记数据来训练模型。然而在复杂交互场景下,当处理动态、多源、弱标记等非...
关键词:
边缘计算中协作计算卸载与动态任务调度被引量:1
2023年
在边缘计算场景中,通过将部分待执行任务卸载到边缘服务器执行能够达到降低移动设备的负载、提升移动应用性能和减少设备开销的目的.对于时延敏感任务,只有在截止期限内完成才具有实际意义.但是边缘服务器的资源往往有限,当同时接收来自多个设备的数据传输及处理任务时,可能造成任务长时间的排队等待,导致部分任务因超时而执行失败,因此无法兼顾多个设备的性能目标.鉴于此,在计算卸载的基础上优化边缘服务器端的任务调度顺序.一方面,将时延感知的任务调度建模为一个长期优化问题,并使用基于组合多臂赌博机的在线学习方法动态调整服务器的调度顺序.另一方面,由于不同的任务执行顺序会改变任务卸载性能提升程度,因而影响任务卸载决策的有效性.为了增加卸载策略的鲁棒性,采用了带有扰动回报的深度Q学习方法决定任务执行位置.仿真算例证明了该策略可在平衡多个用户目标的同时减少系统的整体开销.
张斐斐葛季栋李忠金黄子峰张胜张胜陈兴国
关键词:任务调度
强化学习及其在电脑围棋中的应用被引量:32
2016年
强化学习是一类特殊的机器学习,通过与所在环境的自主交互来学习决策策略,使得策略收到的长期累积奖赏最大.最近,在围棋和电子游戏等领域,强化学习被成功用于取得人类水平的操作能力,受到了广泛关注.本文将对强化学习进行简要介绍,重点介绍基于函数近似的强化学习方法,以及在围棋等领域中的应用.
陈兴国俞扬
关键词:核方法神经网络
一种结合Tile Coding的平均奖赏强化学习算法
2008年
平均奖赏强化学习是强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法和函数估计结合来解决连续状态空间的问题,并根据状态域的改变,相应修改 R-learning 和 G-learning 中参数的更新条件.此外对结合函数估计的 G-learning 算法的性能表现及其对各种参数的敏感程度进行针对性研究.最后给出实验结果及分析.实验结果证明 R-learning 和 G-learning 在ε较小的情况下解容易发散,同时也说明特征抽取方法 Tile coding 的有效性,且可作为其它特征抽取方法的参考标准.
王巍巍陈兴国高阳
关键词:平均奖赏
基于值函数估计的强化学习算法研究
近年来,强化学习得到了机器学习研究人员的广泛关注。基于值表的强化学习算法在小规模状态空间的强化学习问题上,不仅得到了优异的实验效果验证,而且获得了完美的收敛性证明。 然而,在实际应用中,强化学习算法通常面临大规模或者连续...
陈兴国
关键词:函数估计核方法
文献传递
交互式大模型驱动的大数据技术实践课程教学探索
2023年
针对大数据技术实践课程中缺乏实际场景数据的现状,分析交互式大模型与大数据技术实践的关联性,提出在大数据技术实践课程中融合交互式大模型的教学框架和流程,以大数据技术实践课程为例介绍教学实践过程,最后说明教学实践结果。
杨尚东陈蕾陈兴国陈志
关键词:CDIO教学模式
共6页<123456>
聚类工具0