公共文化服务平台

2025年3月23日星期日

|

欢迎来到贵州省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

钱彦旻: 作品数：29 被引量：10H指数：1; 供职机构：上海交通大学更多>>; 发文基金：江苏省基础研究计划国家自然科学基金更多>>; 相关领域：自动化与计算机技术电子电信文化科学更多>>

合作作者

俞凯上海交通大学
韩冰上海交通大学
陈楠昕上海交通大学
黄文上海交通大学
陈博上海交通大学

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

28篇专利
1篇期刊文章

领域

5篇电子电信
5篇自动化与计算...
3篇文化科学

主题

19篇语音
6篇音频
5篇音素
5篇语音识别
5篇声学特征
5篇网络
4篇语言模型
4篇神经网
4篇神经网络
4篇声学模型
4篇欺骗检测
4篇解码
3篇说话人
3篇解码器
3篇后验概率
3篇泛化
3篇标签
2篇递归神经
2篇递归神经网络
2篇定制

机构

29篇上海交通大学
13篇苏州思必驰信...
1篇上海交通大学...
1篇上海交通大学...

作者

29篇钱彦旻
5篇俞凯
4篇韩冰
2篇陈楠昕
1篇陈博
1篇黄文

传媒

1篇计算机学报

年份

11篇2024
1篇2022
3篇2020
8篇2019
3篇2018
1篇2017
2篇2016

共 29 条记录，以下是 1-10

全选清除导出

排序方式：

一种基于自监督预训练模型的机器故障检测方法: 本发明公开了一种基于自监督预训练模型的机器故障检测方法，涉及机器学习领域。本发明通过状态增强来进行数据增强；引入大规模语音数据预训练的预训练模型来提升模型泛化性；transformer池化的融合策略来进行多声音片段融合故...; 钱彦旻韩冰

儿童语音识别模型的训练方法及系统: 本发明实施例提供一种儿童语音识别模型的训练方法。该方法包括：获取训练数据；通过基线声学模型训练得到无条件生成对抗网络；将随机噪声数据输入无条件生成对抗网络，得到噪声增强声学特征；将噪声增强声学特征输入至基线声学模型，得到...; 钱彦旻吴松泽俞凯盛佩瑶杨卓林李晨达

困难气道的检测方法及其电子设备和存储介质: 本发明实施例提供一种困难气道的检测方法。该方法包括：对用户的语音音频进行声学特征提取和语音活性检测；将提取的声学特征进行平均池化处理，得到第一嵌入向量；将活性检测后的发声帧输入至用于表征困难气道的说话人的深度说话人模型，...; 钱彦旻周之恺夏明姜虹曹爽; 文献传递

基于深度学习的说话人语音欺骗攻击检测方法及系统: 一种基于深度学习的说话人语音欺骗攻击检测方法及系统，通过构建音频训练集，初始化并采用训练集的多帧特征向量和单帧向量序列分别训练深度前馈神经网络和深度递归神经网络；在测试阶段，将待测音频的帧级别和序列级别特征向量分别导入经...; 钱彦旻陈楠昕俞凯

用于数据增强的语音加噪方法及系统: 本发明实施例提供一种用于数据增强的语音加噪方法。该方法包括：将无噪音频和带噪音频的说话人向量输入至条件变分自编码模型，对模型编码器输出的向量均值以及方差向量随机高斯分布采样，得到噪音隐向量；将噪音隐向量和无噪音频输入至模...; 俞凯钱彦旻吴章昊王帅; 文献传递

语音音色转换中的节奏控制方法、电子设备和存储介质: 本发明公开了一种语音音色转换中的节奏控制方法，包括，获取源语音的源语音语义向量和源语音梅尔谱；对源语音进行扰动后，获取源语音的源语音节奏向量；获取参考语音的参考语音语义向量、参考语音节奏向量和参考语音梅尔谱；掩盖部分语音...; 钱彦旻陈正阳

一种基于语音离散化和声码器的目标说话人抽取系统: 本发明公开了一种基于语音离散化和声码器的目标说话人抽取系统，涉及语音识别技术领域，包括预训练语音离散模块、离散标记预测模块和语音生成模块，其中，所述预训练语音离散模块用于将语音数据离散化为离散标记序列，所述离散标记预测模...; 钱彦旻余林峰张王优

欺骗录音检测神经网络模型的优化方法及系统: 本发明实施例提供一种欺骗录音检测神经网络模型的优化方法。该方法包括：基于特征提取器、欺骗检测器和领域预测器构建欺骗录音检测神经网络模型；将源域数据以及目标域数据输入至特征提取器；将特征提取器的输出分别输入至欺骗检测器和领...; 俞凯钱彦旻王鸿基丁翰林王帅; 文献传递

可定制语音唤醒方法及系统: 一种可定制语音唤醒方法及系统，通过使用基于长短时记忆网络和连接时序分类模型对语音信息的音素信息进行建模并对模型进行训练，采用训练后模型进行测试并在生成的Lattice网络结构上搜索与定制的唤醒词最相似的可能音素序列来作为...; 俞凯钱彦旻庄毅萌陈哲怀常烜恺; 文献传递

音频数据识别方法及系统: 本发明实施例提供一种音频数据识别方法。该方法包括：将待识别的音频数据按照时间戳的先后顺序划分成多个音频数据片段；基于待识别的音频数据的声学特征，确定每个音频数据片段中各帧音频数据帧的预测概率集合；根据各帧音频数据帧的预测...; 俞凯钱彦旻陈哲怀游永彬; 文献传递

全选清除导出

共3页<1 2 3>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有©2014－2015 Chongqing VIP Information., Ltd., 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张