音乐雷达类产品,都“意不在音乐”。Shazam 从音乐识别扩展到图像识别,瞄准多屏互动和O2O,切入到整个企业营销市场。
而另一个产品 SoundHound,看起来没有 Shazam 这么多动静,直到今天——今天他们上线了新产品 Hound 的安卓内测版。
说出来吓死你,Hound 已经秘密研发了 9 年。创始人和 CEO Keyvan Mohajer 形容他们过去低调的经历为“硅谷隐藏得最深的秘密”。音乐识别从来只是他们的第一步,他们一直以来都在埋头研究技术:语音识别和自然语言处理。现在时候到了,他们推出了 Hound,要让它来解决人类对语音助手更大的需求。
换句话说,Hound 就是在做一个 Siri 这样的语音助手。市面上有这么多款语音助手了,Hound 的区别在哪里?其实没有什么差异,Hound 要做到的区别只有一个字:更好。
官方称目前 Hound 比较强的地方包括导航,本地搜索,天气、股票、时区、地理等信息,酒店信息、航班信息,新闻,图片和视频搜索,货币换算等。
在 Mohajer 向外媒展示 Hound 的时候,我们能看到 Hound 在一些方面表现很强大:
能理解复杂的长句。Mohajer 向 TC 展示的时候说了一个很复杂的长句:When is the sun going to rise two days before Christmas of 2021 in Tokyo, Japan?
可以理解对不同主体的连续疑问,比如问“日本有多少人口啊”,然后再问一句“中国呢?”。也能对一个主体的不同事情联系发问,比如问完“中国有多少人口啊”之后,直接再问“所以按每平方公里来算是多少”。
另一个特点是延迟低。在发文之后,Hound 不会隔太久就能给出回答。Mohajer 解释道,这是因为 SoundHound 把语音识别和自然语言处理结合在一个引擎里,而不是把它们当成两个分别的任务区处理。
此外,Hound 在一些服务上接入了第三方应用的服务。比方在处理酒店预订时,Hound 和 Expedia 合作,用户实际上是在后者的库里搜寻信息以及预订服务。但是与第三方合作的时候,貌似延迟会严重一些,大概 3-4 秒左右。
除了直接面向用户的 Hound App,这款产品还上线了一个开放平台。开发者可以轻松地为自己的 App 里添加一个语音交互。Mohajer 提到,Hound 地最终目标,不只是和 Siri 这样的语音助手或者 Google 这样的搜索引擎去竞争,而是希望将整个移动互联网的交互趋势从“触摸和点击”转移到“语音”。
但是一个创业公司来做这件事情的确困难。技术只是一方面,长久以来用户已经形成的使用习惯是另一个门槛。如果说服用户下载 Hound 并探索 Hound 的种种功能,这并不容易。
这也是他们要做开放平台的原因,让各种各样不同的 App 去帮 Hound 推起语音交互这个潮流,比他们自己推面向用户的 App 容易一些。
题图来自 Re/code
[参考来源:TC、Re/code ]
原创文章,作者:thethief