在收集了有关自闭症的DNA数据15年后,“自闭症说话者”组织已收集了大约12,000名受自闭症影响的人的大量数据。现在,它正在将大约100TB的数据上传到Google Cloud Platform,该数据首次可以在一个地方存储,并且可以被世界各地的研究人员更轻松地访问。
该数据传送到谷歌云平台已于6月10日宣布由罗伯特环,自闭症的首席科学官说,世界上最大的自闭症科学和宣传组织,在一个客户后,在谷歌云平台博客。
该小组的AUT10K程序与多伦多大学病童医院应用基因组学中心合作对DNA数据进行了测序,已经完成了约1,000例病例的测序,另有2,000例其他样品即将完成。
他解释说,大量的数据和持续的研究是迁移到Google Cloud平台的主要原因。“从一开始,我们就意识到AUT10K收集的数据量将带来许多挑战。我们需要找到一种存储和分析海量数据集的方法,同时允许全世界的自闭症研究人员远程访问这一空前的资源。
他写道,这就是选择Google平台的原因。“一开始,我们通过在全球范围内运送硬盘来共享基因组信息。以传统方式下载一个人的整个基因组可能要花费数小时-相当于下载一百部故事片。而到AUT10K达到其10,000的里程碑时基因组,我们知道我们将拥有PB级的数据库。”
Ring表示,使用Google Cloud Platform,Autism Speaks的研究人员可以存储数据并实现全球研究人员之间的实时协作访问。“我们是在上传100个TB的数据,谷歌云存储的过程,并从那里,我们可以将其导入到谷歌基因组学。谷歌基因组科学家们可以访问通过基因组API的数据,探索它以交互方式使用谷歌的BigQuery,并使用Google Compute Engine执行自定义分析。”
他写道,数据传输和中央存储的主要好处是效率。“研究人员将花费更少的时间来移动数据,而将更多的时间用于分析数据和与同事合作。我们希望这将使我们能够比以往更快地进行发现和推动创新。”
根据Ring的研究,在美国,约有68个儿童中有1个属于自闭症。“由于遗传和环境因素的共同作用,自闭症在不同程度上表现为社交沟通和互动的不足,以及行为,兴趣或活动的重复模式的存在。许多自闭症患者也面临着一生的孤独症。相关的医疗状况(例如焦虑,睡眠问题,癫痫发作和/或胃肠道症状),往往会导致不良的后果。”
他写道,自闭症研究人员使用Google Cloud Platform可以极大地改善小组的研究和知识。“总的来说,我们拥有加速突破的能力,能够以前所未有的方式推进诊断和治疗,从而了解孤独症的病因和亚型。”
Google与医疗保健的联系很深。2014年3月,Google 参加了全球基因组与健康联盟,从而扩展了其在全球医学界的参与,这是努力扩大和推进可使人类更健康的基因组学研究的一部分。迄今为止,来自全球21个国家/地区的146个组织是该组织的成员。
为了将创新引入基因组联盟,Google提议使用简单的基于Web的API大规模导入,处理,存储和搜索基因组数据,以及一系列正在进行的开源根据早期的eWEEK报告,围绕通用API构建的示例项目。
2013年9月,Google成立了一家名为Calico 的新医疗保健公司,以寻找改善健康状况并延长人类寿命的方法。根据Google的说法,这家初创公司专注于健康和福祉,尤其是对衰老及其相关疾病的挑战。
Calico并不是Google进行的第一项与医疗保健相关的推动。根据早期的eWEEK报告,谷歌于2008年发起了“ 谷歌健康计划”,该计划旨在帮助患者通过Google及其合作伙伴托管的安全门户,从任何计算设备通过任何计算设备访问他们的个人健康记录。Google Health 已于2013年1月关闭。