您的位置: 专家智库 > >

凌震华

作品数:124 被引量:66H指数:5
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
相关领域:电子电信自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 79篇专利
  • 27篇期刊文章
  • 13篇会议论文
  • 3篇科技成果
  • 2篇学位论文

领域

  • 40篇电子电信
  • 26篇自动化与计算...
  • 5篇文化科学
  • 3篇语言文字
  • 1篇轻工技术与工...
  • 1篇艺术
  • 1篇理学

主题

  • 74篇语音
  • 51篇语音合成
  • 16篇信号
  • 16篇网络
  • 15篇语音信号
  • 15篇神经网
  • 15篇神经网络
  • 14篇音质
  • 12篇声学特征
  • 11篇语音合成系统
  • 10篇自适应
  • 10篇基频
  • 8篇隐马尔可夫模...
  • 8篇声学参数
  • 8篇自适
  • 8篇马尔可夫
  • 8篇马尔可夫模型
  • 7篇决策树
  • 7篇发音
  • 6篇语种

机构

  • 91篇中国科学技术...
  • 30篇安徽科大讯飞...
  • 3篇中国科技大学
  • 2篇科大讯飞股份...
  • 1篇中国电子科技...

作者

  • 124篇凌震华
  • 43篇戴礼荣
  • 32篇王仁华
  • 29篇胡郁
  • 22篇胡国平
  • 18篇刘庆峰
  • 14篇江源
  • 10篇孙见青
  • 8篇陈凌辉
  • 7篇何婷婷
  • 7篇张致江
  • 6篇王智国
  • 6篇张海俊
  • 5篇王玉平
  • 5篇汪锦想
  • 4篇吴晓如
  • 4篇姚文军
  • 3篇双志伟
  • 3篇李威
  • 3篇赵欢欢

传媒

  • 7篇模式识别与人...
  • 6篇数据采集与处...
  • 2篇中国科学技术...
  • 2篇清华大学学报...
  • 2篇小型微型计算...
  • 2篇第九届全国人...
  • 2篇第九届全国人...
  • 1篇新疆师范大学...
  • 1篇科学通报
  • 1篇声学学报
  • 1篇计算机应用研...
  • 1篇天津大学学报...
  • 1篇计算机仿真
  • 1篇中文信息学报
  • 1篇人工智能
  • 1篇第七届全国人...
  • 1篇中国中文信息...
  • 1篇第十三届全国...
  • 1篇第十四届全国...

年份

  • 7篇2024
  • 13篇2023
  • 12篇2022
  • 6篇2021
  • 4篇2020
  • 3篇2019
  • 2篇2018
  • 1篇2017
  • 4篇2016
  • 10篇2015
  • 6篇2014
  • 12篇2013
  • 5篇2012
  • 7篇2011
  • 7篇2010
  • 2篇2009
  • 6篇2008
  • 4篇2007
  • 4篇2006
  • 4篇2005
124 条 记 录,以下是 1-10
排序方式:
一种融合激励和颤音建模的端到端歌唱合成方法
2024年
近年来,歌唱合成技术快速发展,基于变分推理和流模型的端到端歌唱合成(VISinger)成为主流,但其在效果上和真人仍有一定差距,主要体现在合成歌声中的音高听感不连续、颤音合成不佳及发音不稳定等。为此,本文针对性地提出了一系列改进方法:针对基频稳定性问题,提出在解码器中增加激励模块,将基频信息以激励信号的形式显式提供给解码器;针对颤音合成不自然问题,增加颤音预测模块,通过流式模型和变分数据增强,显式对歌声中的颤音进行建模;进一步在先验网络中增加ReZero策略。实验结果显示,增加激励信号能提升合成基频的稳定性,颤音建模对颤音的恢复有显著提升作用,ReZero策略对训练速度和发音稳定性有一定提升。主观测听中,本文提出的模型在歌唱合成自然度上相比VISinger有显著优势,平均意见分(Mean opinion score,MOS)达到3.95,对比两阶段建模方法DiffSinger+HiFiGAN也有明显优势,证明了本文所提方法的有效性。
周骁胡亚军潘嘉胡国平凌震华
关键词:神经网络
基于短时谱一致性的神经网络声码器训练方法
本发明公开了一种基于短时谱一致性的神经网络声码器训练方法,包括:使用自然声学特征和自然对数幅度谱训练幅度谱预测器,使用自然对数幅度谱、自然基频和自然波形训练相位谱预测器;将训练后的幅度谱预测器和相位谱预测器进行连接,通过...
艾杨凌震华
文献传递
基于韵律发音解耦的元学习多语种语音合成模型及方法
本发明公开一种基于韵律发音解耦的元学习多语种语音合成模型及方法,属语音合成领域,该模型包括:由发音编码器、发音流参数生成器和发音解码器组成的发音流声学子模型;由韵律编码器、韵律流参数生成器和韵律解码器组成的韵律流声学子模...
彭宇坤凌震华
一种基于受限玻尔兹曼机的语音合成方法
本发明公开了一种基于受限玻尔兹曼机的语音合成方法。使用自适应加权谱内插STRAIGHT合成器提取的频谱包络取代高层频谱特征用于频谱建模;利用训练得到的Gaussian-HMM模型对训练数据库中的声学特征序列进行状态切分;...
凌震华陈凌辉戴礼荣
文献传递
构建个性化歌唱风格频谱合成模型的方法及装置
本发明公开了一种构建个性化歌唱风格频谱合成模型的方法及装置,该方法包括:训练源发音人朗读风格频谱合成模型和歌唱风格频谱合成模型;获取目标发音人朗读风格数据;根据所述源发音人朗读风格频谱合成模型及所述目标发音人朗读风格数据...
孙见青王影江源凌震华胡国平胡郁
一种四层负载均衡的数据处理方法及相关装置
本申请公开了一种四层负载均衡的数据处理方法及相关装置,可用于计算机技术领域。该方法中,首先,接收访问端发送的数据包,然后,基于数据包携带的信息从多个网卡接收队列中确定用于接收数据包的第一网卡接收队列;接着,通过第一网卡接...
张致江张浩凌震华
表格识别方法及装置、存储介质及电子设备
本发明提供了一种表格识别方法及装置、存储介质及电子设备,该方法包括:对待识别的表格图像进行表格元素检测,获得单元格图像和线条图像;对单元格图像进行处理,以获得表格区域;在线条图像中,确定表格区域对应的表格线条图像,并经细...
胡金水李立夫刘驰凌震华
基于话者无关模型的说话人转换方法
2013年
提出一种基于话者无关模型的说话人转换方法.考虑到音素信息共同存在于所有说话人的语音中,假设存在一个可以用高斯混合模型来描述的话者无关空间,且可用分段线性变换来描述该空间到各说话人相关空间之间的映射关系.在一个多说话人的数据库上,用话者自适应训练算法来训练模型,并在转换阶段使用源目标说话人空间到话者无关空间的变换关系来构造源与目标之间的特征变换关系,快速、灵活的构造说话人转换系统.通过主观测听实验来验证该算法相对于传统的基于话者相关模型方法的优点.
陈凌辉凌震华戴礼荣
关键词:说话人转换高斯混合模型
基于动态剪枝束宽预测的语音识别效率优化方法
本发明公开了一种基于动态剪枝束宽预测的语音识别效率优化方法,该方法针对传统语音解码剪枝算法中存在较多冗余路径,以及已有改进算法中剪枝有效性不足问题,提出基于声学特征进行动态剪枝束宽的预测思路,并根据实现复杂度的不同,提出...
刘俊华凌震华戴礼荣
文献传递
基于声学统计建模的语音合成技术研究被引量:9
2011年
该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括:融合发音动作参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,改善参数语音合成器在合成语音音质上的不足。以上技术创新使得语音合成系统在自然度、表现力、灵活性及多语种应用等方面的性能都有进一步的提升,并推动语音合成技术在呼叫中心信息服务、移动嵌入式设备人机语音交互、智能语音教学等领域的广泛引用。
胡郁凌震华王仁华戴礼荣
关键词:语音合成隐马尔可夫模型
共13页<12345678910>
聚类工具0