4月6日,Meta发布了一个“Segment Anything”AI模型,可以检测图片和视频中的对象,即使它们不属于训练集。您可以通过单击项目或使用自由格式的文本提示来选择项目。如外媒所报道的那样,您可以输入“猫”这个词,然后观看 AI 突出显示给定照片中的所有猫科动物。
该模型还可以与其他模型协同工作。它可以帮助使用单个图像重建 3D 对象,或者从混合现实耳机的视图中绘制。实际上,Segment Anything 可以限制对额外 AI 培训的需求。
人工智能模型和数据集都可以使用非商业许可下载。也就是说,创作者不能将其用于产品。这主要用于研究和扩大对技术的访问。目前,Meta 使用某种类似的技术来管理被禁内容、推荐帖子和标记照片。
开发人员承认现有模型存在缺陷。它可能会遗漏更精细的细节,并且在检测边界方面不如某些模型准确。虽然 Segment Anything 可以实时处理提示,但当涉及到要求苛刻的图像处理时,它就会陷入困境。Meta 说,一些更专业的 AI 工具可能会在各自领域胜过该模型。
你不会在机器人或其他设备中看到这种人工智能,在这些设备中,快速、准确的物体检测至关重要。然而,在完全依赖训练数据不切实际的情况下,这样的模型可能仍然有用。社交网络可以使用该技术来跟上快速增长的内容量。如果不出意外,这表明 Meta 想要推广计算机视觉。
Meta 对分享 AI 的突破并不陌生,比如不成文语言的翻译器。话虽如此,该公司面临着压力,需要证明它在该类别中与谷歌和微软等科技巨头一样强大。它已经在为其社交应用程序规划生成人工智能“角色”,而像 Segment Anything 这样的发明表明它有一些自己的优势。