万旺根 作品数:227 被引量:662 H指数:12 供职机构: 上海大学通信与信息工程学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 上海市教育委员会重点学科基金 更多>> 相关领域: 自动化与计算机技术 电子电信 天文地球 医药卫生 更多>>
三维场景动态模糊阴影算法实现 被引量:2 2007年 针对shadowmap算法,论述其基本原理,从数学角度解释自阴影以及锯齿现象出现的原因,利用z偏移和增加深度信息精度来解决自阴影现象,提出一种多次采样的算法来平滑阴影,消除锯齿影响,并基于DirectX3D实现,通过测试证明算法的可行性. 缪小亮 周政春 万旺根关键词:锯齿 融合多尺度梯度特征的人脸素描照片合成 2023年 人脸素描照片合成是异质图像变换重要分支,近年来受到广泛关注,在数字娱乐和执法领域都得到了广泛应用。近几年基于生成对抗网络的方法在图像跨域转换方面取得了较大的进步,但合成图像会产生噪声、伪影等问题。以U-Net网络为基础,提出了一种融合多尺度梯度特征的人脸素描照片合成方法,该方法结合了MSG-GAN的思想:允许判别器不仅使用生成器最终输出的梯度,而且还使用从上采样中间层输出的不同分辨率的梯度。同时在U-Net网络中加入了残差学习单元,来缓解深度神经网络训练过程中产生的梯度消失和梯度爆炸的问题。此外还加入了基于MRF-CNN的伪人脸特征生成器,采用块匹配的方法来生成伪人脸图像用于监督生成器的人脸生成。最后在CUFS和CUFSF数据集上的实验结果表明所提出方法的有效性。 江水涛 万旺根 张振 孙学涛 王旭智无线下载音乐播放器设计与实现 被引量:1 2006年 本文介绍了无线下载音乐播放器的设计和实现方法,包括系统的硬件设计和软件设计两个方面,重点阐述了无线通信协议部分的内容。文中给出的设计思想对于同类产品的开发具有借鉴意义。 瞿华山 万旺根 张俊杰关键词:控制器 无线 ACK ACE框架在网络游戏服务器中的设计与应用 被引量:3 2008年 由于操作系统及通信平台的多样性,通信软件开发者往往要面对诸多问题,而利用软件设计模式能够帮助开发者成功完成任务并开发出高性能的通信软件。介绍ACE框架在通信领域中的面向对象的设计模式以及使用ACE框架构建通信系统软件所带来的优势,并提出了一种网络服务器架构以及基于模块设计服务器系统软件的思想。最后结合具体应用,详细讲述如何利用ACE中的若干设计模式及组件框架进行网络服务器通信底层模块的设计和实现。 陶道 万旺根关键词:自适配通信环境 中间件 设计模式 基于体素模型与卷积神经网络的三维模型分类算法 被引量:1 2020年 针对传统三维模型分类算法时间复杂度较高、分类准确率较低等问题,提出一种基于体素模型与卷积神经网络的三维模型分类算法。将原始模型表示为八叉树结构的体素模型以优化模型的性状表达,使用设计的卷积神经网络对体素模型进行特征提取以及分类运算。实验结果表明,与其他三维模型分类算法相比,该分类算法的显存占用较小,同时具有较低的时间复杂度和较高的分类能力。 刘泽鑫 万旺根关键词:体素模型 八叉树结构 卷积神经网络 基于动态视觉注意的多语言视频描述算法 2021年 针对视频描述任务,提出一种基于动态视觉注意的多语言视频描述算法。基于基础编解码结构,提取视频片段的时空特征信息和语义属性信息,用以视频表达。在解码阶段,两层长短期记忆网络构成的解码框架分别处理时空和语义信息,并通过嵌入注意力模块和动态选择模块,使得整个模型在有能力关注最重要信息出现时刻的同时,还能动态选择当前时刻最佳信息用以生成描述词。基于整个网络实现,通过共享编解码器的方式,在公开大型视频描述数据集VATEX上实现多语言描述生成方法,并测试提出方法生成描述语句的准确度,与基准方法相比,取得较好效果。 曹磊 曹磊关键词:视频描述 语义属性 多语言 基于听觉模型的低比特率语音编码及其DSP实时实现 本文将二阶差分耳蜗模型与听觉神经处理模型相结合,提出了一种新的语音特征表示参数,并用矢量量化方法对其进行量化,从而得到一种2.4kbps的低比特率语音编解码算法,并用一片TMS320C5410DSP芯片所构成的系统对其进... 余小清 万旺根 马磊 王宁 Daniel P.K.Lun关键词:矢量量化 DSP 文献传递 行人再识别问题中背景抑制方法的研究 被引量:1 2019年 行人再识别是指,在不同时间空间下视角不重叠的摄像机视图中同一行人图像的匹配问题。行人再识别在视频监控方面具有重要的应用价值,是智能监控系统的重要基础。然而,由于摄像头性能不高、监控场景变化、行人的移动性等因素,在现阶段行人再识别存在图像分辨率低、光照背景变化、视角变化、姿态变化等诸多挑战。分析发现直接去除背景会在边界处引入新的梯度信息,从而使得行人再识别模型的性能变差。对此,提出了一种简易的、基于高斯加权的背景抑制方法,能有效抑制背景以提升行人再识别模型的性能。 姚品 万旺根关键词:视频监控 正弦激励下的非线性耳蜗模型:传输函数及频率响应 被引量:1 1992年 对正弦激励下的二维非线性耳蜗模型,该文采用空间离散法使其在坐标 x 方向(基底膜长度方向)离散化,并在时域上求出了基底膜在给定激励(镫骨运动速度)下,各点稳态振动速度的解析解.以基底膜稳态振动速度为输出、镫骨运动速度为输入,定义了非线性耳蜗模型的传输函数,并由此求出了耳蜗模型的频率响应。计算结果表明,耳蜗流体的粘滞性及非线性运动特性是影响实际耳蜗频率特性上升斜率的两个主要因素。 万旺根 樊昌信关键词:粘滞性 非线性 频率响应 有损网络中大规模三维数据实时传输方法 本发明为有损网络中大规模三维数据实时传输方法。本方法首先将三维压缩数据根据其数据特性分块,使得每一块数据可以独立传输和显示,然后客户端实时计算需要的三维数据分块并向服务器端发送请求,服务器根据请求和当时的网络条件,向客户... 余小清 石成林 张开翼 杨晓东 万旺根文献传递