陈兴国
- 作品数:64 被引量:99H指数:5
- 供职机构:南京邮电大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金创新研究群体科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理理学更多>>
- 一种形态滤波方法及装置
- 本发明公开了一种形态滤波方法,属于模式识别技术领域。本发明针对现有形态滤波算法结构固定、需预设结构元素和偏倚校正系数等不足,对其进行了改进,利用多层滤波形式,每层根据前后滤波的差值选取较优结构元素,并根据前后滤波信号的相...
- 程春玲王家良高阳陈兴国
- 文献传递
- 基于强化学习的多用户水产养殖自动调控系统及方法
- 本发明提出了一种基于强化学习的多用户水产养殖自动调控系统,主要由控制终端、数据终端和云平台三个模块,控制终端用于采集水体数据和大气环境数据,并将采集的数据传送至数据终端,同时能够操控自动控制模块调整水产环境;数据终端用于...
- 陈兴国陈康扬吴浩宇陈蕾
- 文献传递
- 社交网络中基于用户兴趣的登录认证方法
- 本发明公开了社交网络中基于用户兴趣的登录认证方法,首先选定具体的基于Web的社交网络应用场景,可以是电脑桌面终端也可以是智能移动终端,用户完成注册;将用户信息分为较稳定信息和不稳定信息两类,构建用户的信息模型。较稳定信息...
- 黄海平王鹏祁凌涛徐宁程春玲李琦陈兴国戴华
- 基于效用函数的期望最大搜索算法
- 2023年
- 强化学习已在各行业得到广泛应用,强化学习所需的大量探索在很多语境下均可能带来严重后果。为此,业界提出安全强化学习。从经济学中借鉴的效用函数是其中的一种常用技巧,但其在搜索算法中还未得到充分研究。当智能体在风险中立的语境下进行训练后,如何利用搜索算法将其迁移至风险敏感语境中仍是一个需要解决的问题。因此,提出向期望最大搜索算法中加入安全强化学习常用的效用函数技巧进行改进。以2048游戏为例,基于2022年最新的NTuple方法及在风险中立语境下所训练的权重,实验了不同的超参数。实验结果表明,将sigmoid函数作为效用函数应用于搜索算法中,可以显著提升算法性能。其中,在2层搜索中,改进后的算法相较于原始算法提升了14053.35分,在3层搜索中,提升了6522.9分。
- 魏语轩李昕闻陈兴国
- 关键词:效用函数
- 面向复杂交互场景的新型机器学习技术
- 高阳史颖欢霍静杨琬琪王皓陈兴国胡裕
- 机器学习是模式识别、机器视觉、数据挖掘等方向的支撑技术之一,被广泛应用到安防、医疗、大数据分析等领域。基于样本的独立同分布假设,监督学习技术通过学习已标记数据来训练模型。然而在复杂交互场景下,当处理动态、多源、弱标记等非...
- 关键词:
- 边缘计算中协作计算卸载与动态任务调度被引量:6
- 2023年
- 在边缘计算场景中,通过将部分待执行任务卸载到边缘服务器执行能够达到降低移动设备的负载、提升移动应用性能和减少设备开销的目的.对于时延敏感任务,只有在截止期限内完成才具有实际意义.但是边缘服务器的资源往往有限,当同时接收来自多个设备的数据传输及处理任务时,可能造成任务长时间的排队等待,导致部分任务因超时而执行失败,因此无法兼顾多个设备的性能目标.鉴于此,在计算卸载的基础上优化边缘服务器端的任务调度顺序.一方面,将时延感知的任务调度建模为一个长期优化问题,并使用基于组合多臂赌博机的在线学习方法动态调整服务器的调度顺序.另一方面,由于不同的任务执行顺序会改变任务卸载性能提升程度,因而影响任务卸载决策的有效性.为了增加卸载策略的鲁棒性,采用了带有扰动回报的深度Q学习方法决定任务执行位置.仿真算例证明了该策略可在平衡多个用户目标的同时减少系统的整体开销.
- 张斐斐葛季栋李忠金黄子峰张胜张胜陈兴国
- 关键词:任务调度
- 强化学习及其在电脑围棋中的应用被引量:32
- 2016年
- 强化学习是一类特殊的机器学习,通过与所在环境的自主交互来学习决策策略,使得策略收到的长期累积奖赏最大.最近,在围棋和电子游戏等领域,强化学习被成功用于取得人类水平的操作能力,受到了广泛关注.本文将对强化学习进行简要介绍,重点介绍基于函数近似的强化学习方法,以及在围棋等领域中的应用.
- 陈兴国俞扬
- 关键词:核方法神经网络
- 一种基于NFC技术的卡牌游戏防作弊系统及方法
- 本发明提出了一种基于NFC技术的卡牌游戏防作弊系统,该系统包括带有NFC标签的卡牌系统、NFC读写器系统、服务器和游戏比赛系统,所述带有NFC标签的卡牌系统中每张卡牌存储的ID编码信息均不相同并且独一无二;所述NFC读写...
- 陈兴国陈琳吴多丰杨尚东余瀚
- 基于知识图谱的菌株培养基成分预测方法及系统
- 本发明提供了一种基于知识图谱的菌株培养基成分预测方法及系统,所述基于知识图谱的菌株培养基成分预测方法旨在通过知识图谱构建技术、知识图谱图数据库、知识图谱嵌入式算法,将菌株数据包括基因组数据、培养基及其成分数据、菌株代谢关...
- 陈兴国蒋新成
- 一种结合Tile Coding的平均奖赏强化学习算法
- 2008年
- 平均奖赏强化学习是强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法和函数估计结合来解决连续状态空间的问题,并根据状态域的改变,相应修改 R-learning 和 G-learning 中参数的更新条件.此外对结合函数估计的 G-learning 算法的性能表现及其对各种参数的敏感程度进行针对性研究.最后给出实验结果及分析.实验结果证明 R-learning 和 G-learning 在ε较小的情况下解容易发散,同时也说明特征抽取方法 Tile coding 的有效性,且可作为其它特征抽取方法的参考标准.
- 王巍巍陈兴国高阳
- 关键词:平均奖赏