您的位置: 专家智库 > >

周军

作品数:11 被引量:5H指数:1
供职机构:中国科学院声学研究所更多>>
发文基金:中国科学院战略性先导科技专项中国博士后科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 8篇专利
  • 3篇期刊文章

领域

  • 4篇自动化与计算...
  • 3篇电子电信

主题

  • 4篇语言处理
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇自然语言处理...
  • 4篇文本
  • 4篇处理技术
  • 3篇语音
  • 3篇向量
  • 2篇段落
  • 2篇对话文本
  • 2篇语句
  • 2篇语音识别
  • 2篇原始图像
  • 2篇实时图
  • 2篇实时图像
  • 2篇特征向量
  • 2篇图像
  • 2篇图像语义
  • 2篇排序
  • 2篇文本处理

机构

  • 11篇中国科学院
  • 3篇国家计算机网...
  • 2篇北京中科信利...
  • 1篇上海海事大学
  • 1篇中国科学院新...
  • 1篇中国科学院大...

作者

  • 11篇周军
  • 3篇张鹏远
  • 3篇颜永红
  • 3篇张震
  • 1篇韦向峰
  • 1篇周城光
  • 1篇王冰
  • 1篇吴桂平
  • 1篇侯晓琴
  • 1篇张艳

传媒

  • 2篇网络新媒体技...
  • 1篇微电子学与计...

年份

  • 2篇2024
  • 4篇2023
  • 3篇2021
  • 1篇2020
  • 1篇2017
11 条 记 录,以下是 1-10
排序方式:
文本处理模型训练方法、语音文本处理方法及装置
本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应...
周军张震李成章李鹏刘建石瑾刘睿霖颜永红
基于艺人画像的歌曲点播量预测被引量:4
2017年
用户画像可以用于用户相关事件的预测。在本文中,我们探索对用户画像的建模中结合外在因素的变化,对用户相关行为进行预测。在实验方面,我们以阿里音乐用户的历史播放数据为基础,结合外在主要相关事件,对艺人进行多维的画像,进而预测某个时间段内艺人的歌曲点播量,挖掘出即将成为潮流的艺人,从而实现对一个时间段内音乐流行趋势的准确把控。实验结果表明,与传统的机器学习方法和时序模型方法相比,我们的算法具有很高准确率,且具有简洁,泛化能力强的特点。
吴桂平侯晓琴王冰周军张艳颜永红
关键词:ARIMA时间序列
文本处理模型训练方法、语音文本处理方法及装置
本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置,涉及自然语言处理技术领域。该方法包括:从互联网爬取对话文本,得到正样本;对对话文本中的语句进行变换操作,得到负样本和负样本的第一标签信息;将正样本和负样本对应...
周军张震李成章李鹏刘建石瑾刘睿霖颜永红
文献传递
一种实时图像语义分割装置及分割方法
本发明提供一种实时图像语义分割装置及分割方法。在一个实施例中,将原始图像输入编码器,提取出至少两个大小不同的编码图像;将所述至少两个大小不同的编码图像输入第一解码器,提取出主特征图;将所述至少两个大小不同的编码图像输入第...
周军白兴张鹏远颜永红
文献传递
科普视频双语字幕生成系统的设计与实现被引量:1
2023年
利用云端语音识别引擎和机器翻译引擎,结合开源语音处理软件ffmpeg,设计并实现了一个科普视频汉英双语字幕生成的系统。将科普视频文件用开源软件提取音频内容,调用百度云端语音识别引擎(https://aip.baidubce.com/)联合汉语科普知识库,实现语音到汉语字幕及其时间线的转换;调用百度云端机器翻译引擎(http://api.fanyi.baidu.com/)联合汉英科普对译库,将汉语字幕翻译为英文字幕,并对应到汉语字幕的时间线上,最后生成科普视频的汉英双语云端语音识别字幕。本文利用真实科普视频评估了本文所提系统的处理能力,从汉语语音到英文字幕总正确(可懂)率为77.3%;进一步分析该字幕生成系统的人工用时,接近全人工处理的1/5,能够有效降低人工成本,提高科普视频汉英双语字幕的生成效率。
周城光周军韦向峰周文佳王荣泉
关键词:科普视频字幕语音识别机器翻译
基于FreeSWITCH的智能语音外呼系统的设计与优化
2024年
FreeSWITCH作为目前主流的电话软交换平台,是呼叫中心的重要组成部分,实现了网络客户端、模拟电话、手机之间的互相拨号通话。基于FreeSWITCH软交换平台,设计了外呼会话流程控制方案,主要实现语音识别、语音合成、自然语言处理之间的流程控制,支持语音智能打断播报、按键检测、通话状态检测、转人工等功能,涵盖了全面的人机对话交互流程事件应答;改进了Unimrcp自有的语音端点检测方法,提高了有效音检测的准确性;通过Unimrcp架构集成了语音识别和语音合成能力交互逻辑,提升用户体验;同时,针对FreeSWITCH智能外呼语音打断功能进行优化,有效的解决了网络异常情况下,外呼交互过程中出现中断的问题。
郝锐朋周军白兴肖素杰
关键词:语音端点检测语音识别
一种基于无监督学习的新闻实体分析方法及装置
本发明涉及一种基于无监督学习的新闻实体分析方法及装置。方法包括:对待处理的多条新闻数据中的每条新闻数据分别进行分词处理,将分词处理后的每条新闻中包含的多个实体进行标注以得到标注结果;基于所述标注结果构建分布式表示模型,得...
周军张震杨家豪沈亮张鹏远王立强颜永红
文献传递
一种实时图像语义分割装置及分割方法
本发明提供一种实时图像语义分割装置及分割方法。在一个实施例中,将原始图像输入编码器,提取出至少两个大小不同的编码图像;将所述至少两个大小不同的编码图像输入第一解码器,提取出主特征图;将所述至少两个大小不同的编码图像输入第...
周军白兴张鹏远颜永红
面向开放域问答的段落选择方法、装置、设备及存储介质
本申请提供了一种面向开放域问答的段落选择方法、装置、设备及存储介质,涉及自然语言处理技术领域。该方法包括:通过将海量文本进行筛选,确定目标文档。基于目标文档中的第一实体和问题文本中的第二实体构建实体树,从而可以基于实体树...
周军付瑞柳张鹏远颜永红
面向开放域问答的段落选择方法、装置、设备及存储介质
本申请提供了一种面向开放域问答的段落选择方法、装置、设备及存储介质,涉及自然语言处理技术领域。该方法包括:通过将海量文本进行筛选,确定目标文档。基于目标文档中的第一实体和问题文本中的第二实体构建实体树,从而可以基于实体树...
周军付瑞柳张鹏远颜永红
文献传递
共2页<12>
聚类工具0