2026-04-28

AI voice is easier to understand than human voice in noisy environments

AI语音在嘈杂环境比真人语音更易懂

美国物理联合会"/> stdaily
Document Text 1,036 characters
科技日报记者 刘霞<br> 英国伦敦大学学院与罗汉普顿大学两位研究人员,对比了真人语音与人工智能(AI)生成的克隆语音的易懂程度。结果出人意料:在嘈杂环境中,克隆语音比真人语音更清晰易辨。相关论文发表于新一期《美国声学学会杂志》。<br> 从Siri、Alexa等数字助手,到自动电话推销员和语音答录机,合成语音已悄然融入人们的生活。而生成式AI的进步,更催生了新一代合成语音——克隆语音。与传统合成语音不同,克隆语音无需配音演员在录音棚里耗费数小时,只需短短10秒的真人录音,便可复刻出几乎以假乱真的声音。<br> 研究人员分析了上百项声学指标。他们原以为,克隆语音不过是真人语音的拙劣模仿,常人难以听懂。然而实验结果令他们震惊:克隆语音的易懂度竟比真人语音高出20%。<br> 研究人员先让志愿者评价真人语音与克隆语音的清晰度,发现克隆语音更胜一筹。随后,他们又用老年志愿者(考察听力衰退的影响)、美国志愿者(考察口音差异)以及模拟人工耳蜗的滤波器(考察极端听力环境)反复验证。在每一种情况下,克隆语音的可理解性都超过人类语音。<br> 研究人员还计划与文本转语音系统的专家合作,优化现有的开源克隆系统,以进一步研究为何克隆语音比真人语音更易懂这一现象。5088802026-04-28 01:35:00:0刘霞AI语音在嘈杂环境比真人语音更易懂1324滚动滚动<br> https://www.stdaily.com/web/gdxw/pic/2026-04/27/508880_29303a98-5e15-47fb-bcd6-22fa4a1c4209.jpg<br> https://www.stdaily.com/web/gdxw/pic/2026-04/27/508880_29303a98-5e15-47fb-bcd6-22fa4a1c4209.jpg<br> https://www.stdaily.com/web/gdxw/pic/2026-04/27/508880_29303a98-5e15-47fb-bcd6-22fa4a1c4209.jpg<br> https://www.stdaily.com/web/gdxw/pic/2026-04/27/508880_29303a98-5e15-47fb-bcd6-22fa4a1c4209.jpghttps://www.stdaily.com/web/gdxw/2026-04/27/content_508880.htmlnull科技日报101/enpproperty-->
Metadata
Publisher 美国物理联合会"/>
Site stdaily
Date 2026-04-28
CMS Category 媒体报道