​谷歌为Chrome中的实时字幕奠定基础

2021-05-13 11:29:23 来源: INeng财经

Google语音小组现在正在努力工作,基于Chromium Gerrit代码存储库中发现的最新提交内容,将实时字幕从移动设备迁移到Chrome 。提交本身指向语音设备API(SODA)服务的创建。

现在,这并没有明确建议传入“实时字幕”功能,但是与提交相关联的注释会起作用。评论说,Live Captions只是源自该服务实施的一项功能。但是,围绕SODA服务的其他提交以及与此相关的错误报告中也引用了实时字幕。

​谷歌为Chrome中的实时字幕奠定基础

添加SODA的含义是,它将用于构建在移动设备上发现的实时字幕。至少有一条评论更直接地表示在浏览器中将其称为“实时字幕”,以便与移动设备保持平价。但是,在这种情况下,团队将为Chromebook以及运行Mac,Linux或Windows的计算机启用该功能。

Google小组希望SODA将来也可以用于其他语音和语音识别功能。但这还没有详细说明这些功能可能是什么。

此功能到底是什么?

​谷歌为Chrome中的实时字幕奠定基础

实时字幕已得到了很好的报道,但目前仅在少数移动设备上才能使用。它主要出现在Pixel品牌的手机上。在三星的Unpacked 2020活动中,它仅是开箱即用的一种非像素小工具。那就是三星Galaxy S20系列。

综上所述,Live Captions确实可以实现其品牌含义。它将隐藏式字幕几乎应用于所有视频或音频内容。这些是通过设备上的三种独立算法派生的。该算法即使在嘈杂的环境中,甚至在语音不清楚的情况下也可以实现更准确的语音识别。字幕与标准字幕一样,几乎实时显示。但即使在字幕通常不可用的应用中,也可以应用它们。

所有这些的好处是,实时字幕有效地充当了系统级字幕系统。这与作为应用程序级别的实现相反。

新的SODA服务为在Chrome渲染器过程中启动这些类型的体验奠定了关键的框架。因此,它将成为Chrome本身的一部分,并且可以在Android生态系统之外运行。

​谷歌为Chrome中的实时字幕奠定基础

未设置Chrome Live字幕的时间轴

Chromium Gerrit中的提交和相关注释表明,该公司认真考虑将类似Live Captions的功能引入Chrome。但这并不一定很快就会到来。实际上,Chromium Bugs条目将沙盒SODA功能置于优先级3。这是可以分配的最不紧急的优先级。

更具说服力的是,似乎没有任何实验性方法可在任何Chrome通道中打开该功能。

这并不一定意味着没有进行这项工作,但是对于Google而言,迅速完成工作绝对不重要。该功能背后的团队已将其状态标记为“已开始”并打开。因此,尽管它不会在不久的将来到来,但距离也不应该太遥远。在接下来的几个更新中,可能会向Chrome的测试渠道发布某种形式的内容。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。