【网易智能讯9月24日音讯】坐落英国剑桥的声纹辨认技能供货商Audio Analytic公司,正致力于将以人工智能(AI)为中心的声响辨认技能应用于消费设备中。就像语音辨认能够辨认说出的句子相同,这家公司的声响辨认技能也能够分辨出狗的叫声和婴儿的哭声。
Audio Analytic首席执行官克里斯·米切尔(Chris Mitchell)表明:“这相当于一种言语模型,但它只适用于声响。”
Audio Analytic公司的声响辨认AI体系AuditoryNET具有极端广泛的用处。该公司正与德国耳机制造商Bragi协作,出产具有AI支撑功用的耳机,它可经过辨认救护车的警报器,并提示用户其挨近的方向,来优先考虑用户的安全。
米切尔说,这个主意是为了维护用户免受“各种风险状况的损伤,由于人们正让自己在城市里彻底失聪”。
Audio Analytic公司还将AuditoryNET嵌入到智能家居设备中,如Hive Home Hub 360,它能够检测烟雾和一氧化碳探测器、吠叫的狗或窗户被打破的声响。AuditoryNET不需求互联网衔接就能运转,这对重视隐私的人来说是个好音讯。
为了练习AuditoryNET的算法,Audio Analytic公司运用了国际上最大音频数据搜集渠道Alexandria供给的数据。米切尔说:“咱们最近做的工作是制作出咱们整个声响国际的地图。”
图2:Audio Analytic公司的声响地图包含600万份音频文件,包含六种类型的餐厅窗户玻璃碎裂的声响。
Audio Analytic公司现已创建了一个包含600多万个音频文件的声响地图。它看起来就像是个彩虹蜂巢:在视觉上代表着类似的声响集合在一起的五颜六色块,或称为“色彩岛屿”。
米切尔表明,经过调整音量,他们的技能能够辨认出有细微差别的声响。比方来自餐厅玻璃的破碎声就有6种,其间由玻璃制成的层压板的碎裂声与其他声响天壤之别。
Alexandria的音频样本数据池有必要从头开始构建。电影中常见的声响是没有用的,由于它们并不实在。米切尔说:“假如你去看最新的《复仇者联盟》电影,我敢肯定绿巨人会把什么东西掉在车上。”
他说:“那个轿车警报器宣布的声响并不是实在的轿车警报器。”这种声响将练习AI面临虚伪的实际,通常是灾难性的,比方需求检测是否有人闯入轿车。因而,该公司建立了自己的实验室来捕捉原始声响,并派出团队在各种环境中录制其他声响。
他们乃至依托志愿者网络进入声响实验室,或许运用录音机捕捉实在国际中的各种声响。
Audio Analytic公司的未来方案仍然处于保密之中,但它的方针十分明确,即持续开发辨认家庭表里声响的技能,包含那些听起来像警报器的鸟鸣。(选自:WIRED 作者:Will Bedingfield 编译:网易智能 参加:小小)
本文来历:网易智能 责任编辑:顾雨芯_NBJS8596