听神经|做一款「读」懂世界的 AR 眼镜( 三 )


「做成普通眼镜那样」
对这群工程师和产品经理来说 , 去做调研的每一天都很感动 。
「有人跟我说 , 他出生到现在三十多年间试过大量不同的方法 , 从药物医疗到助听辅具 , 但他觉得『也就那样儿』……他们中的不少人已经『心灰意冷』了 。 即便有手语、辅具、翻译软件等工具的存在 , 他们仍然感知不到外界更丰富的声音 , 比如外面的风声 , 现在聊天室里轻微的人声 。 」
近年出现的「隐藏字幕」(CC 字幕)鲜有人知:除了展示台词 , 字幕还会解释、提示画面中所发生的事情 , 包括一些细微的环境音 。 比如动画短片《Blush》——在这部导演向其亡妻献礼的默剧中 , 讲述了一名园艺宇航家意外坠毁在一颗荒凉的矮行星上 。 宇航员的飞行器撞到行星发出的巨响 , 风声吹拂行星地表植物的细响 , 字幕都将其描述出来 。
假如在未来 , 眼镜的感知能力和 AI 算力达到了更高的水平 , 也能把听障原本感知不到的丰富声音用「字幕」显示出来 。 有听障用户对亮亮视野表达了愿望:「司机按车喇叭 , 狗冲着我叫 , 能不能也让眼镜告诉我?」
「让眼镜里的芯片去充分理解语义 , 对人的言语进行智能整理 , 最终给听障用户呈现最精简的版本 。 以及 , 做到识别不同说话者的声纹 。 」这些将是亮亮视野后续进一步的目标 。

听神经|做一款「读」懂世界的 AR 眼镜
文章图片

亮亮视野的工作人员在进行用户调研|亮亮视野
公司 CEO 兼董事长吴斐说 , 「语音转文字 AR 眼镜并非新鲜事物 , 与众不同之处在于对用户场景的理解更加深刻 。 」
人们需要更多「不新鲜」的科技 , 需要更多对用户需求有深度挖掘的科技 。 我们已经能够找到一些例子——
比如专门为听障用户设计的手机翻译 app「迷你语音」 。 相比市面上的同类产品 , 它在技术上并不突出 , 但在用户界面的设计上下足了功夫 。 它可以将说话者的人声转换成文字 , 听障用户通过打字来回复对方 。 与此同时 , 用户输入的文本的字号被放大数倍并且旋转 180 度面向对方 , 以便对方更好地阅读 。 另外 , 迷你语音还支持了 iOS 15 的画中画特性 , 可以将语音识别的界面缩小 , 并且在使用其他 app 时继续转录 。
里索科技则研发了一款叫「无声救星」的助听智能手环 。 手环配备了无线声音接收器 , 当手环接收到用户的自定关键词 , 比如他们的名字 , 就会震动 , 提醒用户:身边有人正在说话 , 请留意内容 。 有时 , 听障者说话较为大声 , 容易尴尬场面 , 当手环检测到声量过大时 , 便会震动提示控制声量 。

听神经|做一款「读」懂世界的 AR 眼镜
文章图片

Digital Nature Group 推出了翻译字幕面板 See-Through Captions , 本质上是一个透明的投影仪 , 可将音频转换为字幕并在其双向屏幕上显示对话 。 产品有两种款式 , 固定式的和可移动的 , 可以在不同的场合使用 。
这些都是对特殊人群的诉求做了深度挖掘的产品 。
亮亮视野的工作人员提前给眼镜设置了「唤醒词」 , 她设置的是我的名字 。 biu , 她叫我的名字 , 镜片发出了蓝色的闪烁 。 他们说 , 未来会将助听眼镜做成普通眼镜的模样 , 要做到与普通眼镜没有区别 , 「这本身就是一个人文关怀设计」 。