全球数百万人为语言障碍所扰,未来AI听懂你想说什么

iotadmin4周前人工智能(AI)56

Google投入各种AI应用,透过科技让世界更加无障碍,特别针对语言障碍者开发出AI语音识别。

 

人工智能(AI)能有各种不同的应用,其中如何改善人类的生活就是一个很重要的思考方向。

 

Google AI负责人杰夫?迪恩(Jeff Dean)举例,像是印度科技学院的学生,开发一款名为Air Recognizer的App,作为侦测空气污染的工具;只要用手机拍摄一张照片,AI模型就可以透过照片判断空气中的分子量,来告诉使用者此刻的空气污染状态为何、是否适合外出。

 

「这只是开源软件库TensorFlow应用的一个小案例,AI还有很多潜能,」迪恩这样说。在2018年第一届Google AI Impact Challenge竞赛的前20名得奖主中,也有许多开发者把应用主轴摆在无障碍应用方向上。

 

AI帮失聪者听见世界,70种语言听障人士受惠

 

听力受损的人们难以与世界沟通,Google AI产品经理Sagar Savla提出数据指出,「现今全球有超过4.66亿人耳聋或有听力障碍,占全球总人口的15%;而且预计听力障碍人士将会在2055年成长至9亿人口。」

 

「像是我的祖父母晚年失聪,我们沟通就很困难,我发现他们的生活渐渐与世界隔离,我想这是很常见的情况,」Savla这样分享,老年失聪在全世界非常常见,不仅造成生活不便,对于心情的影响也非常大。

 

为了帮助听力障碍人士了解其他人的口说语言,今年2月Google推出一款「即时转录」(Live Transcribe) 应用程序,目前有70种语言版本,透过将现实世界中的语音转录为屏幕文字,帮助聋人和听障人士与他人沟通。

Google建立特殊AI模型,让语言识别更加无碍

 

Google AI产品经理Julie Cattiau则说明,目前全球有数百万人被「语言障碍」所困扰,他们在发音上可能与一般人不同,造成这样语言障碍的原因,有中风、肌萎缩性脊髓侧索硬化症 (ALS)、帕金森氏症等神经系统疾病。但目前的AI语言识别模型,大多无法符合这些人的需求。

 

「对于障碍人士来说,因为他们发音上有很大的困难,因此他们不能使用Google Home等语音识别技术,」Cattiau表示,今年Google启动Project Euphonia计划,建立语言障碍者的语言识别AI模型。透过这个模型,可以让语言障碍者也可以使用声控设备;另外,也可以让机器将语言转为文字,让语言障碍者透过文字与更多人对话。同时,Google也针对手势、眨眼等其沟通方式建立电脑视觉模型,让语言障碍者能够更独立。

相关文章

办公也开始变得智能化了

传统的办公模式,早已发生改变,现在来看具体体现在三个维度,一是由封闭式的办公空间向开放式的...

任天堂:要追上云端串流游戏技术

近年云端串流游戏逐渐成为游戏界的新宠儿,继 Sony、Microsoft 和 Google 等厂商都陆续公布相关计划,任天堂方面亦表示注意到这个潮流,认为公司需要追上技术发展。 任天堂在其周...

“理论型” 美食鉴赏家,AI 为你挑选披萨

麻省理工学院的一组研究人员最近开发了一个人工智能模型,它可以获取指令列表并生成一个成品。未...

人工智能打造福尔摩斯之眼

近年来,随着“平安城市”视频监控的大规模建设,摄像头布满各个城市的大街小巷。存储技术的不断更新,也为大量案件积存了海量视频信息,这给公安破案带来极大的便利。视频侦查技术也逐渐成为侦查破案的主流。但问题...

云时代:解析数据中心建设所面临的几大难题

有关数据中心的建设问题,不同行业所面临建设问题也是参差不齐,对于传统制造业而言盲目的讨论大数据应用似乎有些空中楼阁,依靠实际经验来发言似乎更有说服力。 按照原有的组织和业务结构,应用系统是省...

未来算法是不是人工智能的核心驱动力呢?

2020年是不寻常的一年,全球的健康、贸易、经济、文化、政治和科技领域,无不发生着深刻的变...