云知声-上海师范大学自然人机交互联合实验室获 Blizzard Challenge 2020 国际语音合成大赛第一名-澳搏娱乐
信息无障碍通道
您的位置:首页>>澳搏彩票app下载

云知声-上海师范大学自然人机交互联合实验室获 Blizzard Challenge 2020 国际语音合成大赛第一名

发布时间:2020-08-17  来源:澳搏娱乐    背景: 无障碍通道

  Blizzard Challenge 2020 国际语音合成大赛刚刚落下帷幕。由云知声-上海师范大学自然人机交互联合实验室申报的系统在强敌环伺的赛场中突出重围,首次参赛即斩获中文普通话、上海话多项关键指标第一,再一次印证了云知声语音合成技术在业界的领先水准。

http://mmbiz.qpic.cn/mmbiz_png/VBzE1eua4pWfF0PmhTChurwtTF9eVzHmntJFGvQowAib4a1micdQv1uXD4yqKLmwNLcDuY1maOicWrqqiaGGlmzC9g/0?wx_fmt=png

  Blizzard Challenge 国际语音合成大赛是由美国卡耐基-梅隆大学和日本名古屋工业大学联合发起的公开的语音合成技术评测平台,是语音合成领域最具权威性的技术评测比赛。比赛旨在构建一个公开、统一的语音合成技术评测平台,加强世界各地语音合成研究机构之间的技术交流与沟通,共同推动语音技术的快速发展。

  其作为国际上规模最大、影响力最大的语音合成大赛,至今已成功举办过 15 届,每年都吸引众多国际一流的科研单位和企业参赛。以往参赛队伍包括 CMU(美国卡耐基-梅隆大学)、Cambridge University(英国剑桥大学)、University of Edinburge(英国爱丁堡大学)、Nitech (日本名古屋工业大学)、科大讯飞、中科院自动化所等国内外语音合成领域的顶尖高手。

  多指标领跑,强劲的综合实力

  语音作为人工智能技术发展的三大方向之一,在应用落地过程中,受外部环境影响极大,因此对语音系统模型、引擎等要求极为严苛。从语音合成需求的角度来看,自然度、相似度和可懂度是实际应用中最为核心的三大核心指标。

  Blizzard Challenge 2020 分两个任务:

  1)中文普通话合成(Hub task),以高表现力的声音作为合成样本,充分考察参赛者对复杂多变的韵律节奏的把控能力,旨在输出高真实感的合成语音,另外这次比赛还考察参赛者对段落韵律的把控能力;

  2)上海话合成(Spoke task),提供的声音数据较少,充分考察参赛者在小样本上的学习能力。

  本次比赛中,联合实验室团队凭借在合成领域的深厚积累,中文普通话合成自然度 MOS 达到 4.2,段落合成所有指标(Overrall impression\pleasantness\speech pauses\stress\intonation\emotion\listening effort)位列第一,并且通过迁移学习,从零开始快速构建了上海话合成系统,合成自然度 MOS 达到4.0,双双领跑;与此同时,普通话相似度、上海话可懂度两项指标亦领跑榜单,充分体现了团队合成技术的综合实力。

注:A 为真人声,B-Q 为参赛队伍,云知声-上海师范大学联合实验室队伍代码为 I

  注:自然度主要评价合成语音是否像真人说话一样自然流畅,相似度主要评价合成语音与目标说话人在音色和韵律上的相似程度,自然度和相似度是合成系统的最重要的两个评测指标,分数越高,说明效果越好。一般大学生发音自然度为 4.0 分。由于上海话原始数据质量较低,团队为了获得更好的听感,对原始语音进行了升采样率的处理,所以相似度方向会有损伤。

  本次大赛上,团队采用业界主流的端到端合成技术,并针对端到端合成系统普遍存在的稳定性和效率问题进行了较多优化,在解决稳定性的同时,可以实现高效率的合成。目前,该项技术已经在云知声家居、金融、儿童机器人等业务领域合作伙伴的产品中广泛使用,并取得良好反响。

  另外,本次比赛涉及大规模高复杂度的模型训练,在这过程充分体现了云知声计算资源优势。实际上,从 2012 年开始,云知声便开始搭建自身的 DeepFlow 集群,该异构化硬件服务器集群可向上提供密集的计算和存储能力,保证云知声研发团队充足算力的支持。目前该集群规模为 1000GPU 以上,计算能力达 1 亿亿次/秒,在以美国的 IBM Summit 超算平台、我国的神威太湖之光超算平台为代表的全球超算平台算力排名中位列前 20 位。

  在 DeepFlow 集群的支撑下,云知声建设完成了 Atlas 分布式机器学习并行计算平台,可内部协同共享 AI 底层研发技术成果,迁移复用至各领域应用,最终完成 ASR、TTS、NLU 等顶层 AI 技术的输出与应用。

  参赛只是一场自我测试,技术研究的终点一定是应用。未来,云知声将以此实验室研究成果为支撑,生成有温度的声音,帮助客户打造完美的人际交互体验。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:澳搏娱乐

本文评论
百度智慧医疗合作伙伴计划发布,共同构建AI+医疗繁荣生态
百度正在加速采用领先的AI技术帮助医疗行业实现智能化升级。8月15日,百度智慧医疗合作伙伴沙龙在青...
日期: 08-17
CITE 2020,TCL智慧柔风空调打破传统固有认知,展现智慧科技魅力
8月14日,国内首屈一指的电子信息产业展会——第八届中国电子信息博览会(即CITE2020)在深...
日期: 08-17
亚信科技喜获2020年国际智能运维(AIOps)挑战赛全国亚军
2020年8月15日,由中国计算机学会主办,清华大学、中国移动、中山大学承办的第三届国际智能运维(AIO...
日期: 08-17
最快的AI遇上婉约的江南会擦出什么火花?华为2020全球智博会全回顾!
8月14日-16日,第三届全球人工智能产品应用博览会(AIExpo2020)在苏州国际博览中心举行。本届智博会...
日期: 08-17
面对美国制裁,中国企业要敢于斗争
从中兴到华为,从Tiktok到微信,美国特朗普政府对中国企业采取的是一种赶尽杀绝的手段。这种极端敌...
日期: 08-17
有线耳机?realme Buds 经典版将于 8 月 18 日在印度发布
8月17日消息 上个月,realme 印度公司 CEO 透露,该公司计划 8 月份在市场上推出新的耳机。据外媒 G...
日期: 08-17
PS5绝配!索尼自曝:新一代PS VR正在开发中
尽管索尼已经公布两款PS5主机(数字和光驱版)以及一大波配件(DualSense手柄、摄像头、头戴耳机等),...
日期: 08-17
三星计划将部分智能手机生产线转移到印度,五年创造价值超 400 亿美元
8月17日消息 据外媒 ET Telecom 今日报道,知情人士透露称,三星计划将其智能手机生产线的关键部分...
日期: 08-17
无人配送机器人市场规模可替代人工成本 即将迎来普及时代
近日,36氪创投研究院发布《2020年无人配送领域研究报告》,其中称,疫情之下,无人配送承载着众人...
日期: 08-17
Mate 50有戏 华为确认:正打造同时支持全屏指纹和屏下摄像头技术的手机
  据外媒报道,华为技术人员在于AA的交流中确认,...
日期: 08-17
性能暴涨3倍!IBM Power10处理器宣布:首次7nm、至少30核心
上代产品诞生了长达三年之后,蓝色巨人IBM今天正式宣布了新一代的Power10,专为满足企业级混合云计...
日期: 08-17
传闻华为Mate 40系列将使用全新液体相机技术
华为 Mate 40 系列将是今年值得期待的旗舰机型,近日一位爆料者透露,即将推出的 Mate 40 将采用华...
日期: 08-17
联想拯救者 R7000P 高配版来了,8 月 25 日开售
8 月 17 日消息 刚刚,联想拯救者发布预告,新品 “115W”游戏本将于 8 月 25 日开售。很...
日期: 08-17
一加手机图库新增支持编辑 4K/60FPS 视频
8月17日消息 OnePlus一加图库App已经进行了更新,版本号升级到了3.12.28版本,本次更新引入了两个重...
日期: 08-17
【旅游企业必看】360旅游行业助力计划来了!
内容提要:
  旅游行业复苏进行时,360智慧商业祭出助力双响炮,发起360奇游计划与原产地计...
日期: 08-17
热烈庆祝炬芯科技股份有限公司成立
炬芯科技官方消息宣布,于2020 年 8 月,炬芯(珠海)科技有限公司正式更名为:炬芯科技股份有限公司...
日期: 08-17
骁龙730G迎来升级版:将于9月推出 不支持5G
近年来,高通在中高端手机芯片中一直处于主导地位。但随着联发科推出的几款畅销5G芯片,其市场份额...
日期: 08-17
融合互联 数智建造——用友建筑助力建企数智化成功
8月15日,由用友举办的2020商业创新大会·东部峰会在苏州太湖国际会议中心隆重召开。来自建筑...
日期: 08-17
云知声-上海师范大学自然人机交互联合实验室获 Blizzard Challenge 2020 国际语音合成大赛第一名
Blizzard Challenge 2020 国际语音合成大赛刚刚落下帷幕。由云知声-上海师范大学自然人机交互联合实...
日期: 08-17
中国广电与高通成功完成全球首次 700MHz 频段 5G 数据呼叫
今天,中国广播电视网络有限公司(简称中国广电)与高通宣布,双方成功完成全球首次 700MHz(n28 频段)...
日期: 08-17
  专栏介绍
爱萌妮儿 的专栏
爱萌妮儿发表的文章
积分:
自我介绍 :