“亲口说话”不是梦!首款听障人士声音复原工具免费开放

2023-07-21 14:22:00 来源:光明网

近日,网易集团、网易公益联合浙江省残疾人福利基金会发起“人生第一句”声音复原公益计划,利用网易互娱AI Lab的iSpeech技术打造首个AI复原听障人士原声的工具——听障人士仅需上传5分钟没有完整语义的发声片段,之后在产品中输入想要表达的文字,就可以用原本的声音说出来。目前该产品已向全国听障人士免费开放,帮助他们无障碍、有情感地与外界交流,用自己的声音说出“人生第一句”。

据介绍,作为亚运圆梦计划之一,“人生第一句”公益计划在杭州2022年第4届亚洲残疾人运动会组委会、中国残疾人事业新闻宣传促进会、浙江省残疾人联合会的指导下发起,基于致敬亚运、助力亚残运、助力残障人士社会融合的大背景,通过AI技术帮助听障人士实现“亲口说话”的人生梦想,号召更多人“益”起来关注残障人士,关注无障碍环境建设。

“亲口说话”不是梦!首款听障人士声音复原工具免费开放

首个AI声音复原工具,免费开放给全国听障人士

不久前,浙江省残疾人福利基金会面向浙江特殊教育职业学院的学生和音书APP(拥有百万听障用户)的部分用户开展调研,调研结果显示,仅有十分之一的受访对象能够通过简单的口语与身边的人进行交流,他们中的大多数人经历过太多想说但说不出的自卑与懊恼,最大的梦想便是能说出“人生第一句”。

是否能运用最新的人工智能技术帮助听障人士向他人传递自己的真实想法和真诚态度?网易互娱AI Lab的技术团队展开了研究。研究发现,目前市场上绝大多数语音克隆产品需要输入完整讲话采集数据,对于无法正常发出语义的听障人士来说并不适用,而且面向听障人士的交流工具,大多也只有文字转语音功能,他们无法用自有的音色表达。

因此,网易互娱AI Lab研发团队利用iSpeech技术,基于海量数据的预训练模型,加上听障人士极少量的纯语音数据快速微调算法模型,在快速克隆新的说话人音色的同时保留基础模型的内容发音能力,研发首个听障人士声音复原工具,实现只需输入文字就可实时用原声流畅表达,让听障人士能圆梦“人生第一句”。

目前该声音复原工具已经在音书App上线,供听障人群免费使用,并且在浙江省杭州市马塍路残疾人融合就业街区试点应用,帮助听障咖啡师、面包师等更好地工作。据了解,残疾人融合就业街区也是杭州亚残运会期间对外展示的窗口,有了科技的助力,无声小店的工作人员从被助者变为助人者,便捷流畅地与各方来客交流,为他们提供更好的服务,向世界展示中国残疾人群体的新风貌。

近七成听障人士表示希望使用,人生第一句话是说“谢谢”

在调研中,有超过67%的受访对象表示“愿意使用音色复原技术”,超过一半的受访对象表示“愿意将音色复原技术推荐给身边有需要的人”,也有部分受访对象表示除了手机 APP 软件以外,希望音色复原技术应用于在公交、出租、饭店、超市、银行等公共场所。

99年的小陈是一位先天听障的甜品师。也许是因为她的世界格外安静,工作时总是非常专注,做的奶冻和牛角包总是被一抢而空。但小陈心里一直有个愿望,希望能跟顾客“亲口”交流。此前遇到过商品原材料等问题,有些顾客没耐心文字解释,她只能干着急,而且她也想向老顾客们“亲口”说句感谢。自从试用了产品后,她觉得顾客多了一些耐心,交流起来变得平等同步了,她也更有底气,更自信,更愿意主动交流。

跟小陈一样,沈师傅也是残疾人融合就业街区的一位理发师,他做理发师10多年了,最擅长快剪男头。因为家庭条件不好,从小没有钱去训练读、听能力,所以在工作中,他只能用文字、简单手势来跟客人沟通发型要求。他的顾客中老年人偏多,文字交流更加费劲。试用产品后,他能非常顺畅、快速地了解客户需求,平时生活中上医院、上超市、上高铁都方便多了。

“亲口说话”不是梦!首款听障人士声音复原工具免费开放

除了工作以外,人生重要时刻无法亲口表达也是听障人士很大的遗憾。顾老师是一位曾经参与世界巡演的舞蹈家,一岁时的一次发烧打针让她的世界永远失去了声音。她说,自己的童年是在四处求医中度过的,不管药有多苦、针有多疼她都坚持治疗,但每次都是开开心心去,失望而归。后来妈妈就把她送进聋儿康复中心进行语言康复训练,“当我说话的时候别人会用异样的眼光看我,我觉得很自卑。”

在老师的鼓励下,她开始学画画、书法、舞蹈,后来成为一名残疾人艺术团的舞蹈演员,参加过浙江赛区环球小姐比赛,也拍摄过残奥会献礼影片。但每当这些重要时刻,她都很遗憾无法表达激动与感谢。如今,她能用自己的音色“说话”了,“想说又说不出的时候太多了!现在最想对陪在我身边鼓励我的人说感谢!也想对女儿说对不起,她学说话的时候不能陪她、教她。”

浙江省残疾人福利基金会理事长赵小飞表示,浙江省共有持证残疾人133.7万人,其中听力残疾20.8万人、言语残疾1.7万人,希望通过这一AI技术帮助他们用自己的音色向他人传递内心真实想法,进而推动解决该群体在和健听人沟通交流过程中存在的障碍问题,改变他们的生活、学习和工作环境状况及相应的能力水平,使他们真正能够平等参与社会生活,实现人生价值。

大模型只能对话、写诗、作画?网易AI技术加速落地普惠

实际上,一直以来网易持续利用游戏技术助力打造无障碍社会。此次运用的iSpeech技术原本是由网易互娱AI Lab针对游戏场景推出的AI创作工具,已落地服务于以《大话西游》《一梦江湖》《荒野行动》为代表的10余项游戏项目产品之中,相关技术成果斩获了多项国际顶会论文和技术专利,并在此前应用于游戏中,进行交互界面的朗读播报,辅助视觉障碍人士玩游戏。

随着AI浪潮的兴起,网易除了加快人工智能技术在产业的落地应用外,也致力于让每个普通人都能够享受到新技术发展的红利,实现技术的普惠。例如,在乡村振兴方面,网易利用人工智能等技术,打造线上线下结合的智慧文旅元宇宙,为22个县域新增游客300万;在工业生产方面,网易伏羲将人工智能、游戏化交互、游戏仿真等能力迁移到工程机械领域,推出国内首台无人装载机器人和挖掘机器人,参与到矿山、铁路等一线场景的建设。

据悉,接下来,网易不仅将会和浙江省残疾人福利基金会一起把这项技术提供给更多有需要的人,还会不断探索游戏技术外溢价值,赋予游戏更多的社会价值和可能。(战钊)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。