博鱼体育

博鱼体育常识网。有趣实用的生活常识!

最新更新文章排行

博鱼体育

当前位置: 首页 > 科技

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语

时间:2023-01-20人气: 作者: 小编

  声音里的生意,近几年可谓风生水起。如果说短视频的生意,是以各大企业的资本博弈为故事,那声音的生意则凭借技术变革发生巨大且剧烈的变化。上世纪90年代IBM开发出名声大噪的Via Voice中文连续语音识别产品,释放了解放双手的信号;紧接着2008年,谷歌把语音识别和搜索相结合,具有里程碑的意义。接下来的十年,基于互联网的思维转变,各种形式的音频迎来了井喷,音频直播、在线课程、付费知识,音频承载了一个个成功的商业故事。

  12月29日上午,观看央视直播新闻的观众们意外发现,有一个和直播主持人极其相似的声音通过语音连线传过来。

  “王言你好,我是主持人王小言。今天我会在中国声谷,向大家展示这里的新变化,也欢迎大家来这里参观学习,我会一直在中国声谷等着你们。”“王小言”用家乡四川话向人们问好,还用印地语道了早安。主持人王言坦承,这让他十分惊喜,“就像找到了自己失散多年的亲弟弟。”

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语(图1)

  这个被王言称为“胞弟”的声音,来自于合肥的中国声谷科大讯飞演示厅内的一台机器。这就是科大讯飞推出的全新个性化智能语音合成黑科技——声音复刻。在节目开始前,讯飞就对王言的声音样本进行了采集。使用讯飞留声LITE小程序朗读10段线分钟,就可以通过最新个性化语音合成技术实现声音复刻,“王小言”就此诞生。不仅如此,声音复刻技术还可以基于收集来的声音语料“说出”粤语、四川线余种方言和英、日、韩、法等近30种外国语言。

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语(图2)

  除产品外,央视新闻的新年特别报道专题《中国永远在这儿》还将镜头聚焦到了中国声谷龙头企业科大讯飞企业本身。长达三分半钟的演示,讲述了其最新人工智能语音技术的进展以及未来可能为百姓生活带来的变化,还在直播现场展示讯飞留声、讯飞开放平台等一项项创新硕果。

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语(图3)

  早在2013年,高德导航就与科大讯飞合作,将声音个性化合成的技术应用到车载明星全程导航语音包上,志玲姐姐、郭德纲、周星驰、易烊千玺、高晓松等大众所熟知的明星大咖的声音一路陪伴大家。

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语(图4)

  2018年初,科大讯飞声音复刻技术已经在央视纪录片《创新中国》中使用。全片采用人工智能配音,真实还原已故配音大师李易老师的声音。这是个性化人工智能语音合成技术在影视配音领域的首次应用。

  紧接着,人们熟知的南方日报集团虚拟主播、二次元中的荷兹楚楚妲己、娱乐营销层面的抖音明星语音红包等,均是各大集团与科大讯飞进行紧密合作,将声音复刻技术进行场景化应用。

  说到底,声音在技术层面的发展始终不是风口。这背后需要投入大量人力物力进行研发,付出极大的耐心。据讯飞留声的团队透露,在声音复刻技术面世前,他们已经已持续耕耘18年。显然,这不是资本追捧的故事。

  当然,和所有尖端技术遭遇的一样,“声音复刻”背后,也有试图赶超者。然而后来者的体验效果却差强人意——技术的壁垒,让声音复刻的体验天差地别。

  科大讯飞专注智能语音与人工智能领域多年,获得国际语音合成比赛13连冠,在相似度、自然度、错误率、段落总体感觉等指标上均名列前茅。语音合成系统也是业界目前自然度指标唯一达到真人说话水平的系统。

  使用过讯飞留声LITE小程序的人们知道,只需录制 10 句线 分钟左右的时间,小程序就可以深度模拟出用户的完整音库,从而能将任意文本转换为用户的声音,且做到音色高保真还原,朗读的语气、语调、博鱼体育官网情感也堪比真人。

  尽管还没有做推广,但根据阿拉丁的统计数据,小程序正式发布不到一周,就迅速冲到「成长最快小程序」周榜13名。目前用户累计访问次数超过17万,新用户增长率达568%。

  作为全球首款面向广泛用户的个性化语音合成应用,讯飞留声Lite将语音合成技术打造炒年糕真正“平民化”的个人音库定制产品。配合微信生态,实现了声音“即做即用,用完即走”。开发团队表示,上线「讯飞留声Lite」的初衷就是想做一个帮助用户打造自己的专属音库和个人声音品牌的智能语音平台。

  声音复刻技术应用的场景,多以温暖起始。科大讯飞围绕“声音复刻”技术所打磨的数款产品都体现了这一点。

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语(图5)

  以讯飞阅读为代表,这里不仅每本书都能听,还可以使用声音复刻功能获取自己或者亲友的声音库,用自己、朋友或家人的声音听每一本书;讯飞有声作为一款文字转语音的朗读神器,更着眼于新闻资讯,让你即使埋头工作忙碌不暇的时候,也能用自己的声音给父母读读新闻和公众号。

“声音复刻”来了5 分钟就复制央视主播声音还能说 15 种方言 30 种外语(图6)

  基于父母声音对孩子的重要陪伴意义,讯飞还把目光聚焦于亲子场景——儿童伴读产品呀呀伴读可以复刻父母声音,即便父母因忙于出差等无法陪伴在侧,也能用孩子熟悉的声音为孩子“讲故事”,给孩子的幼年生活提供更多陪伴,快乐成长。

  当亲人故去后,留下复刻的声音也能慰藉你的内心;你的宝宝在成长过程中的每一次声音变化都能被复刻和保存,让他们长大后不忘童真。

  未来,声音复刻技术的应用场景还可以更多。为用户打造的个人专属音库,可以应用到车载导航、有声阅读、游戏娱乐、智能家居、早教玩具等与生活息息相关的领域。巨大的想象空间仍待开拓。

  目前,声音复刻虽已引发了主流人群的关注,但鉴于声音对C端的生意处于起步阶段,可见引导并培育这个市场,也是讯飞作为行业领头者在推动AI语音产业快速发展的重要职责之一。若想真正点燃市场,丰富场景化应用是讯飞需要不断撕开的口子。

标签: