<

“倾听”1分钟就能开口模仿人类“讲话”

来源:科技日报2019-12-06
不过,若是你不介意的话,用手摸摸它,也许会好的快些……”!--作者有话说--151看书网

  科技日报电(记者 聂翠蓉)据《科学美国人》杂志网站报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类“讲话”,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

  让声音听起来更自然,是计算机程序在将文字转换成语音过程中面临的核心挑战,即使目前最好的语音助手,如苹果公司的Siri和亚马逊公司的Alexa,一发声给人的第一感觉仍然是,“哇!这是计算机。”背后原因在于这些语音助手系统的工作原理:根据预录的声音文档整理出词汇,再通过另一个新的音频文档将这些词汇拼凑在一起发声。

  而琴鸟公司的AI使用了一种全新的语音合成系统,能在“倾听”过程中“掌握”每个人说话时字母、音位和单词的发音特点,通过推理并模仿这个人声音中的情感和语调,“说”出全新的语句。

  新系统使用模仿人脑思维的算法创建出一种人工神经网络,能利用深度学习技术将所听到的转换成语音,并仅靠任何人1分钟讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

  开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大·布瑞比森表示,在学会并模仿了几个人的声音后,再模仿任何一个新对象的语音就会变得更快,因此新语音系统不需太多信息,1分钟足以捕获某个人声音的核心特点。

  但美国卡内基梅隆大学语言技术研究所教授迪莫·鲍曼表示,琴鸟的语音系统和真正的人声之间还有差距。“我仔细听过琴鸟系统的发声,其带有背景噪音,以及微弱的机器人特征。而且,它还不能模仿人们在讲话中的呼吸和唇部运动,因此仍然能听出其计算机语音特征。”鲍曼说。他认为,语音系统真正令人信服地复制人声,还需再等几年。

  总编辑圈点

  人类的嗓音最美妙,天籁之音怎能被机器模仿出来?一呼一吸间的抑扬顿挫,一颦一笑间的情感起伏,才是人之为人的精华所在。虽然机器模仿人声还差强人意,但仍大有用武之地——高德地图林志玲版,不就是机器通过学习特殊语料后,模仿独特人声在给司机指路嘛。但需知,语音合成只是人工智能的一个基础层次,要想达到以假乱真甚至人机交互,估计还得一二十年。

>
相关新闻
精品栏目

在重庆遇见更好的自己

指尖上的精雕生活

智博会上“触碰”未来

景美人少的原生态避暑地

热门推荐

体操房里的夏天

吴奇隆变身"男月嫂"

新闻 |  问政 |  资讯 |  百事通

华龙网 www.cqnews.net 触屏版 | 电脑版

Copyright ?2000-2015 CQNEWS Corporation,
All Rights Reserved.
首页 | 新闻 原创 视听 | 问政 评论 图库 | 区县 娱乐 财经 | 旅游 亲子 直播 | 文艺 教育 安监 | 房产 健康 汽车 | 取证 宅购 地图 | 麻哥辣妹 3c家居
  • 站内
站内
分享
新浪微博
腾讯微博
微信
QQ空间
QQ好友
手机阅读分享话题

“倾听”1分钟就能开口模仿人类“讲话”

2019-12-06 06:30:27 来源: 0 条评论
【摘要】 据《科学美国人》杂志网站报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类“讲话”,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

  科技日报电(记者 聂翠蓉)据《科学美国人》杂志网站报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类“讲话”,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

  让声音听起来更自然,是计算机程序在将文字转换成语音过程中面临的核心挑战,即使目前最好的语音助手,如苹果公司的Siri和亚马逊公司的Alexa,一发声给人的第一感觉仍然是,“哇!这是计算机。”背后原因在于这些语音助手系统的工作原理:根据预录的声音文档整理出词汇,再通过另一个新的音频文档将这些词汇拼凑在一起发声。

  而琴鸟公司的AI使用了一种全新的语音合成系统,能在“倾听”过程中“掌握”每个人说话时字母、音位和单词的发音特点,通过推理并模仿这个人声音中的情感和语调,“说”出全新的语句。

  新系统使用模仿人脑思维的算法创建出一种人工神经网络,能利用深度学习技术将所听到的转换成语音,并仅靠任何人1分钟讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

  开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大·布瑞比森表示,在学会并模仿了几个人的声音后,再模仿任何一个新对象的语音就会变得更快,因此新语音系统不需太多信息,1分钟足以捕获某个人声音的核心特点。

  但美国卡内基梅隆大学语言技术研究所教授迪莫·鲍曼表示,琴鸟的语音系统和真正的人声之间还有差距。“我仔细听过琴鸟系统的发声,其带有背景噪音,以及微弱的机器人特征。而且,它还不能模仿人们在讲话中的呼吸和唇部运动,因此仍然能听出其计算机语音特征。”鲍曼说。他认为,语音系统真正令人信服地复制人声,还需再等几年。

  总编辑圈点

  人类的嗓音最美妙,天籁之音怎能被机器模仿出来?一呼一吸间的抑扬顿挫,一颦一笑间的情感起伏,才是人之为人的精华所在。虽然机器模仿人声还差强人意,但仍大有用武之地——高德地图林志玲版,不就是机器通过学习特殊语料后,模仿独特人声在给司机指路嘛。但需知,语音合成只是人工智能的一个基础层次,要想达到以假乱真甚至人机交互,估计还得一二十年。

看天下
[责任编辑: 徐力超 ]
发言请遵守新闻跟帖服务协议
精彩视频
  • photo

    秋收之喜
    精品栏目
    新闻排行
    健康映像·名医在线 更多>>
    版权声明:
    联系方式:重庆华龙网集团有限公司 咨询电话:60367951
    ①重庆日报报业集团授权华龙网,在互联网上使用、发布、交流集团14报1刊的新闻信息。未经本网授权,不得转载、摘编或利用其它方式使用重庆日报报业集团任何作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:华龙网”或“来源:华龙网-重庆XX”。违反上述声明者,本网将追究其相关法律责任。
    ② 凡本网注明“来源:华龙网”的作品,系由本网自行采编,版权属华龙网。未经本网授权,不得转载、摘编或利用其它方式使用。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:华龙网”。违反上述声明者,本网将追究其相关法律责任。
    ③ 华龙网及其新重庆客户端标明非华龙网的确定来源或未标注华龙网LOGO、名称、水印的文字、图片、音频、视频等稿件均为非原创作品。如转载涉及版权等问题,请及时与华龙网联系,联系邮箱:cqnewszbs@163.com。
    附:重庆日报报业集团14报1刊:重庆日报 重庆晚报 重庆晨报 重庆商报 时代信报 新女报 健康人报 重庆法制报 三峡都市报 巴渝都市报 武陵都市报 渝州服务导报 人居周报 都市热报 今日重庆

    Sitemap

    未央 张家堡街道学习传达区委书记汪文展重要指示 |習近平「4?19講話」蘊含國家網路治理的「五觀」 | |
    青海省文化和新闻出版厅“放管服”改革工作成效明显 | 《炉石传说》标准模式走势分析:盗贼崛起 萨满称王 | 自治区党委常委会召开会议 彭清华主持会议并讲话
    时装周最火妖孽模特 雌雄难辨勾引你的荷尔蒙 |qvod播放器下载(快播3.5不升级版)V5.20.238 不升级版 | 承德旅游学院组织师生走进消防大队参观学习 |
    义务扫厕十载:记江西樟树市淦阳街道老党员黄有仔 | 中国城市旅游网 | 注意!有人冒充暖心公司人员骗取材料费安装费
    《狂野西部:枪手》免安装简体中文绿色版[修正版] |走近低调的“单车猎人”:让共享单车回归共享 |共享租车品牌“凹凸租车”宣布获近4亿人民币C轮融资 |
    英雄联盟官方助手(lol官方助手) V2.2.4.3991官方版 | 时装周最火妖孽模特 雌雄难辨勾引你的荷尔蒙 | qvod播放器下载(快播3.5不升级版)V5.20.238 不升级版
    2017年3月份各镇办事处信息发布排名(前3名) 银监会10天发7文 5类人的“钱袋子”要受影响 文化部办公厅关于印发《2017年全国美术馆馆藏精品... 女高中生突然想休学 原是经前期烦躁障碍惹祸 第二代东风-21D换12马赫弹头 将成美航母噩梦
    武警新疆边防总队机动支队赴陌生地域进行实战化拉练 陈新有:"中国制造2025"与"军民深度融合"相得益彰 去年令人印象深刻的独立游戏 不只3A大作才好玩 红酒染唇液试色 兰欧媞红酒染唇液全系列试色
    电脑洗车机价格| 少年包青天2演员表| 3d木门价格| 彤庭所分帛| 弃后 乖乖陪朕玩| 福星高照猪八戒演员表| 维他奶价格| 和牌香烟价格| 夜光杯价格| 别克轿车价格| 奥马冰箱价格| 球墨铸铁井盖价格| da师演员表|
    混水阀价格| 速度与激情2演员表| 锋刃演员表| 绿源电动车价格表| 生铁价格走势| 泸州老窖价格| 鸡血藤价格| 邹城521团购网| 铝锭价格走势| 华润油漆价格| coach包价格| 黑道帝皇| 卓依婷死亡真相照片|
    关闭
    >>