Alexa请求的亚马逊员工可以访问用户的家庭住址

2020-03-25 10:23:00 来源: INeng财经

近期涉及Alexa请求的亚马逊员工可以访问用户的家庭住址内容备受瞩目,很多读者对此也很有兴趣,现在给大家罗列关于Alexa请求的亚马逊员工可以访问用户的家庭住址最新消息。

彭博社最近报道说,亚马逊有一个项目,其中有一些员工在与用户互动时收听Alexa演讲者录制的某些录音,但是现在看来这些人也可以访问客户的家庭住址。

彭博社今天上午发布的一份新报告援引了亚马逊Alexa数据服务团队的五名匿名员工的证实,他们可以通过在地图软件(例如Google Maps)中键入他们的经度和纬度信息来轻松找到客户的家庭住址。

尽管没有迹象表明有权访问数据的亚马逊员工试图追踪单个用户,但Alexa团队的两名成员对彭博社表示担忧,因为亚马逊授予了不必要的广泛访问客户数据的权限,从而可以轻松识别设备的所有者。

好吧,这当然听起来并不乐观。

一些负责分析Alexa客户记录的工作人员使用Amazon工具,该工具在与捕获记录的设备有关的数据旁边显示音频剪辑。该软件存储的许多信息,包括设备ID和客户标识号,都无法轻松地链接回用户。

那是应该的。

但是,亚马逊还收集位置数据,以便Alexa可以更准确地回答请求,例如,建议当地一家餐馆或给出俄勒冈州附近阿什兰市(而不是遥远的密歇根州阿什兰市)的天气。

Alexa整理用户的位置数据以改善其服务没有任何问题,除非不是因为它的某些员工首先就可以看到它。

在彭博社看到的演示中,一名亚马逊团队成员将用户的坐标(以经度和纬度存储在系统中)粘贴到Google地图中。在不到一分钟的时间内,该员工已从一个人的Alexa命令的记录跳到看上去是他们的房屋和相应地址的图像。

好吧,那当然令人不安,但是任何人都可以在Google Maps中查找某人的位置,只要他们具有经度和纬度就可以了。令人不安的是,某些Amazon员工可以使用用户坐标。

他们使用的另一个内部工具可以存储更多的个人数据。

员工说,在打入客户ID号后,这些称为注释器和验证器的工人可以看到客户在安装设备时输入到Alexa应用程序中的家庭住址和工作地址以及电话号码。如果用户选择与Alexa分享他们的联系人,则他们的姓名,电话号码和电子邮件地址也会显示在仪表板上。

是的,但是为什么要在仪表板上显示所有这些信息?

该数据位于系统中,因此,如果客户说“向Laura发送消息”,人工审核者可以确保转录者正确输入了姓名,以便该软件学习将请求与联系人列表中的Laura配对。

该报告尚不清楚有多少员工和承包商可以使用这些功能。两名亚马逊员工表示,他们相信Alexa数据服务小组中的绝大多数工人大约在一年前就能使用该软件。

iPhone上的Amazon Alexa应用

另一名员工说,“直到最近”,系统显示完整的电话号码,有些数字被遮盖。“直到最近”,这是彭博社报道后的意思,对吗?

两名员工说,在彭博社4月10日的报告之后,亚马逊进一步限制了数据访问。这些人说,一些转录,注释和验证音频记录的数据助理到达工作,发现他们不再有权使用以前在工作中使用的软件工具。

截至发稿时,他们的访问权限尚未恢复。

令人担忧的是,原始报告中有一份声明归因于亚马逊发言人,该声明否认正在收听Alexa录音的人们可以访问其他信息。

员工没有直接访问可以识别此人或帐户身份的信息,而该信息是此工作流程的一部分。所有信息都经过高度机密性处理,我们使用多因素身份验证来限制访问,服务加密和对我们控制环境的审核以保护它。

但是,在回应该故事的新声明中,亚马逊改变了立场,现在呼吁对内部工具的访问“受到严格控制”:

内部工具的访问受到高度控制,并且仅授予需要这些工具以通过处理非常小的交互样本来培训和改善服务的有限数量的员工。

我们的政策严格禁止员工出于任何其他原因访问或使用客户数据,并且我们对系统滥用采取零容忍政策。我们会定期审核员工对内部工具的访问权限,并在任何可能的地方限制访问权限。

在我们得出任何不成熟的结论之前,有必要重复一遍,这不是一个秘密项目–亚马逊没有掩盖这样的事实,即它让人们在客户对话中倾听。像苹果和其他科技公司一样,亚马逊在其服务器上保留一段匿名的录音片段,以帮助改善其语音识别和人工智能。

该公司在一系列常见问题中表示:“我们使用您对Alexa的请求来训练我们的语音识别和自然语言理解系统。”

在技​​术世界中,生活在一个现实中的事实是,必须使用真实的记录定期地训练能够帮助机器理解语音背后含义的人工智能系统,这是提高准确性的唯一可靠方法。

正如亚马逊发言人向彭博社解释的那样:

我们仅注释一小部分Alexa语音记录,以改善客户体验。这些信息有助于我们训练我们的语音识别和自然语言理解系统,以便Alexa可以更好地理解您的请求并确保该服务对每个人都有效。

苹果公司做着完全相同的事情-Siri的人工助手会听一些剪辑,并绑定到随机标识符,并在服务器上存储六个月。

之后,随机标识符将被完全删除,但数据将保留更长的时间以改善Siri的语音识别能力。是的,Google还要求审阅者听取助手的一些摘录,以帮助培训和改善服务。Google的录音中没有任何可识别个人身份的信息,并且音频本身也失真了。

正如密歇根大学教授弗洛里安·绍布(Florian Schaub)研究与智能扬声器有关的隐私问题时所说的那样:

您不一定会想到另一个人正在聆听您在房屋亲密关系中告诉智能扬声器的内容。我认为我们已经被假设为这些机器只是在进行魔术机器学习。

但事实是仍然涉及手动处理。

是否涉及隐私问题取决于亚马逊和其他公司对手动注释的信息类型有多谨慎,以及如何将这些信息呈现给某人。

对于上下文,这是原始故事的节选:

一些Alexa审阅者的任务是转录用户的命令,将记录与Alexa的自动抄本进行比较,例如,或注释用户与机器之间的交互。这个人问了什么?Alexa提供了有效的回应吗?

其他人则注意到说话者会讲的所有内容,包括背景对话,即使孩子说话时也是如此。有时,听众会听到用户在讨论私人详细信息,例如姓名或银行详细信息。在这种情况下,他们应该在表示“关键数据”的对话框上打勾。然后,他们继续下一个音频文件。

根据亚马逊的网站,除非Echo检测到唤醒词或通过按下按钮激活,否则不会存储任何音频。但有时Alexa似乎完全没有任何提示就开始录制,并且音频文件开始时发出刺耳的电视声或难以理解的声音。不论激活是否错误,都需要审稿人抄录。一位知情人士说,当Alexa没有收到唤醒命令或意外触发时,审计员每人每天记录多达100张录音。

彭博社的原始报告声称,从事该项目的“成千上万的员工”有时还必须审查可能令人非常痛苦的剪辑,甚至是一些可能构成的剪辑。在一个举报的案件中,两名亚马逊员工听到了他们认为的性侵犯,但雇主指示他们不要举报该事件,因为“这不是亚马逊的工作。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。