童立靖
- 作品数:62 被引量:85H指数:4
- 供职机构:北方工业大学更多>>
- 发文基金:国家自然科学基金北京市大学生科学研究与创业行动计划北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术文化科学轻工技术与工程核科学技术更多>>
- 台式助视阅读器
- 本实用新型公开了图像处理与识别技术领域中的一种台式助视阅读器,用于改善扫描效果并方便视障人士阅读。台式助视阅读器包括辅助扫描架、摄像头和信息处理器;其中,摄像头通过USB电缆与信息处理器连接,辅助扫描架包括两个放置台,两...
- 曾凡锋王景中童立靖冯祎
- 文献传递
- 一种工程适用的快速灰度方法
- 本发明公开了属于图像处理领域的一种工程适用的快速灰度方法。本发明使用如下公式对标准灰度公式作近似计算:H=0.299R+0.587G+0.114B≈H<Sub>(R>>2)</Sub>+H<Sub>(R>>4)</Sub...
- 童立靖王景中肖珂鲁远耀曾凡峰冯祎
- 文献传递
- 一种空白纸张检测方法
- 本发明公开了图像识别技术领域中的一种空白纸张检测方法。本发明通过扫描图像的RGB值求得图像的灰度;通过扫描窗口内的像素点来判断图像是否是白纸。本发明能够快速精确识别出图像,为了盲人阅读器项目服务。
- 童立靖王景中肖珂曾凡峰鲁远耀冯祎
- 文献传递
- 一种基于DenseNet与WGAN-GP的运动迁移方法
- 2023年
- 针对目前人体骨骼模型运动迁移算法计算精确度不高,提出了一种基于DenseNet的骨骼卷积网络与WGAN-GP模型的运动迁移方法。通过对源与目标骨骼模型分别提取静态特征,并对源骨骼静态特征与源运动序列使用动态编码器提取源动态特征,从而能够对目标骨骼静态特征与源动态特征使用解码器生成目标运动序列,完成运动迁移。在网络模型训练时,同时引入了WGAN-GP网络模型机制对生成序列和源运动序列的动、静态特征误差进行约束。实验结果表明:该方法的运动迁移模型各关节点相对于单位身高的运动误差较小,能够生成较好保留源动态特征的目标运动序列。
- 童立靖曹健莉
- 基于视频数据与三维模型的虚拟场景生成被引量:2
- 2018年
- 该文为设计与实现一个基于视频数据与三维模型的虚拟场景生成系统。先构建一个基于OpenGL的三维模型开发平台,在此平台上完成三维模型的载入、几何变换、人机交互等功能。然后用摄像机采集某一特定场景的视频数据,并对视频数据进行视频解码,提取其各帧的图像数据。在开发平台上基于解析的图像数据完成三维场景的背景构建,同时构建三维人体的静态模型,通过程序对三维人体静态模型各部分进行空间几何变化,完成三维人体的运动模拟,并与背景图像进行合成,从而完成基于特定场景的人物运动的虚拟场景生成。
- 宋田茹童立靖李思哲高思琨
- 关键词:三维模型OPENGL视频解码
- 中英文混排扭曲文本图像快速校正方法被引量:1
- 2015年
- 针对OCR在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行,得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒;然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果,校正后图像OCR识别率有明显提高。
- 王景中孙婷童立靖
- 关键词:字符切分
- 三维书籍模型的单侧页面提取方法
- 2017年
- 针对目前点云分割方法较难分割三维书籍模型的情况,提出一种快速有效的单侧书籍页面的自动提取方法。对于获取的三维书籍模型,利用模型的点云深度信息,求出背景平面方程,去掉模型背景,保留书籍区域;通过分析书籍模型的形态特性,求出分割左右页面的空间平面,保留其中一侧页面;根据点云的密度分布去掉页面的书口区域点云,得到单侧页面的三维模型。实验结果表明,该方法能够快速稳定地提取出单侧页面,具有较高的准确性和速度性能。
- 童立靖李斌
- 关键词:点云分割最小二乘法
- 基于改进ICP算法的人体静态建模
- 2021年
- 利用Kinect设备进行人体点云数据采集时,点云数量大,误差较大,配准效率较低。因此本文提出了利用采样一致性与最小二乘法去噪减少了一些离群噪点,更有利于后期特征点的寻找与匹配。配准处理时针对人体建模中配准时寻找对应特征点耗时较长,精度不高的缺点,提出一种基于两片点云特征点曲率信息凹凸性作为特征点再利用改进后的ICP算法完成最优变换。实验表明,本文提出的算法,很好的提高配准的时间并提升了配准的精度。
- 刘伟伟童立靖
- 关键词:KINECT点云特征点提取
- 基于混合Transformer模型的三维视线估计
- 2024年
- 针对当前在无约束环境中,进行视线估计任务时准确度不高的问题,提出了一种基于混合Transformer模型的视线估计方法.首先,对MobileNet V3网络进行改进,增加了坐标注意力机制,提高MobileNet V3网络特征提取的有效性;再利用改进的MobileNet V3网络从人脸图像中提取视线估计特征;其次,对Transformer模型的前向反馈神经网络层进行改进,加入一个卷积核大小为3×3的深度卷积层,来提高全局特征整合能力;最后,将提取到的特征输入到改进后的Transformer模型进行整合处理,输出三维视线估计方向.在MPIIFaceGaze数据集上进行评估,该方法的视线估计角度平均误差为3.56°,表明该模型能够较为准确地进行三维视线估计.
- 童立靖王清河冯金芝
- 硕士研究生图形图像处理技术课程群建设与实践被引量:4
- 2016年
- 在计算机学科中,涉及图形图像处理技术的课程有很多,存在知识点重复设置、效率不高的现实问题。本文给出了图形图像处理技术课程群建设目的、知识点设置以及实验设置,对"图像处理技术""计算机图形学""增强现实技术"等课程内容进行了有效整合,节约了教学时数,将多余的学时分配到了实验环节中,新增加了5个综合设计性实验。将理论与实践紧密结合,使学生具备图形、图像、虚拟现实处理技术的基本技能,有效提升了学生图形图像处理技术的编程能力,以及分析和解决实际问题的能力。
- 张永梅童立靖王辉柏马礼何丽
- 关键词:课程群建设图像处理技术计算机图形学增强现实技术