今天,很高兴为大家分享来自DeepTech深科技的扎克伯格夫妇署名文章:帮助学界在本世纪末治愈、预防或管理所有疾病,如果您对扎克伯格夫妇署名文章:帮助学界在本世纪末治愈、预防或管理所有疾病感兴趣,请往下看。
来源:DeepTech深科技
作为最小的活体单元,细胞是理解疾病的关键,但关于它们的很多信息仍然未知。例如,我们不知道数十亿个生物分子,如 DNA、蛋白质和脂质是如何聚集在一起成为一个细胞的。
我们也不知道我们体内多种类型的细胞是如何相互作用的。对细胞、组织和器官如何患病,以及它们需要什么才能保持健康我们的了解依然非常有限。
人工智能可以帮助我们回答这些问题,并将这些知识用于改善全球的健康和福祉,前提是研究人员能够获得、并能很好地利用这种强大的新技术。
想象一下,如果我们有一种方法,可以用人工智能模型来表示每种细胞状态和细胞类型。“虚拟细胞”就可以模拟我们身体中任何类型细胞的外观和已知特征,比如检测视网膜中光线的视杆和视锥细胞,以及维持心脏跳动的心肌细胞。
科学家可以使用这样的模拟来预测细胞对特定条件和刺激的反应:比如了解免疫细胞对于感染的反应,了解孩子出生时患有罕见疾病时在细胞水平上会发生什么,甚至患者的身体对新药的反应。这样的话,科学发现、患者诊断和治疗决策都将变得更快、更安全、更高效。
在陈-扎克伯格倡议(CZI,Chan Zuckerberg Initiative)中,我们正在帮助生成科学数据,通过建立计算基础设施力图实现上述目标,并为科学家提供所需的工具,利用人工智能的新进展来帮助终结疾病。
图 | 从左到右:马克·扎克伯格(Mark Zuckerberg)、普莉希拉·陈(Priscilla Chan)(来源:视频截图)
数据
人工智能的进步,外加上大量的科学数据,已经预测了几乎所有已知蛋白质的结构。DeepMind 根据 50 年来精心收集的数据训练了 AlphaFold,在短短五年之内他们解开了蛋白质结构之谜。
ESM,是由 Meta 开发的另一个人工智能系统,它是一个蛋白质语言模型,其训练数据不是单词,而是 6000 多万个蛋白质序列。它的应用场景非常广泛,比如预测蛋白质结构和单个序列突变的影响。
虚拟细胞建模系统也需要大量的数据。自 2016 年以来,CZI 倡议一直支持全球研究人员生成和注释有关细胞及其成分的数据,构建工具来集成这些大型数据集,并使研究人员能够学习和借鉴这些数据集。
据了解,一个全球性质的研究人员联盟正在构建人体中每种细胞类型的参考图谱,而我们的旧金山生物中心正在创建全微生物细胞图谱。这些数据集共同形成了开源的人类细胞图谱的初稿,该图谱将绘制从发育阶段到成年阶段的人体细胞类型。
我们的 SF Biohub 和陈-扎克伯格成像研究所正在合作开发 OpenCell,它可以绘制我们细胞中不同蛋白质的位置。
科研人员还在使用 Geneformer 和 scGPT 等机器学习模型来探索有关基因和细胞的大量数据,其中包括来自 CELLxGENE 的数据。CELLxGENE,是 CZI 科技团队为加快单细胞研究而创建的开源软件平台。
同样,通过冷冻电子断层扫描的新原型数据门户,我们的成像研究所和科学技术团队正在聘请机器学习专家开发显微镜数据的自动注释。这将把曾经需要几年或几个月的数据处理时间缩短到几周。
我们正在使数据尽可能地具有代表性,以确保科学突破惠及所有人。这包括将儿科数据纳入人类细胞图谱,填补我们对儿童疾病细胞机制的认识空白。
通过我们的 Ancestry Networks 拨款,我们还支持研究人员根据黑人、拉丁裔、东南亚人和土著人的组织样本,以及其他种族、族裔和祖先背景研究不足的人,生成其细胞的参考数据。
科研人员已经利用这些精心准备的数据集做出了发现。一项研究发现,与囊性纤维化有关的断裂基因,能由科学家此前从未见过的一种细胞表达。而另一项研究则确定了最容易感染新冠病毒 SARS-CoV-2 的呼吸细胞。
其他人正在利用这些数据寻找剪接基因的新选择,这或许可以纠正特定细胞中的致病突变。
这些发现是开发疾病治疗方法的第一步,我们相信人工智能可以显著加快学界的发现速度。
计算
为了创建一个虚拟细胞,我们正在构建一个拥有 1000 多个 H100 GPU 的高性能计算集群,这将使我们能够开发新的人工智能模型,使用各种关于细胞和生物分子的大型数据集进行训练。
我们希望随着时间的推移,这将使科学家能够模拟健康和患病状态下的每种细胞类型,并对这些模拟进行查询,以了解难以捉摸的生物现象可能会如何发生,包括细胞是如何形成的、它们是如何在全身相互作用的、以及致病变化究竟是如何影响它们的。
我们的计算集群不会像私营部门用于商业产品的计算集群那么大,但一旦建成并运行,它将成为世界上最大的非营利科学研究人工智能集群之一。
这将是学术团队的重要资源,他们希望能以新的方式使用数据集,但由于访问最新人工智能技术的高昂成本而受到阻碍。而与我们其他工具一样的是,这些数字细胞模型及其相关数据和应用程序将向世界各地的研究人员开放。
人
生成这些数据集,构建这个计算集群,并将人工智能用于生物学,这是一种跨学科协作的努力。
我们的 Biohub Network 汇集了来自不同学科和机构的专家,以应对一些在传统学术环境中无法解决的棘手挑战和风险。
通过 CELLxGENE 等项目,世界各地的研究人员帮助建立了一个单细胞数据语料库,这证明了开放科学的共享资源,可以在更多合作者贡献资源和脑力的情况下有效地发展。
当 CZI 于 2016 年首次启动我们的科学研究时,我们设定了一个大目标:帮助科学界在本世纪末治愈、预防或管理所有疾病。
我们相信,如果领先的科学家和技术人员共同努力,充分利用人工智能创造的机会,这一目标是可能的,并且将取得重大进展。我们可以从解开我们细胞的奥秘开始,这将有助于终结我们所知的许多疾病。
作者简介①:普莉希拉·陈(Priscilla Chan)是陈-扎克伯格倡议的联合创始人和联合首席执行官。普莉希拉作为一名儿科医生和教师,与美国加州湾区社区的患者和学生合作,努力让学习更加个性化,找到管理和治愈疾病的新途径,并为更多人扩大机会。早年间普莉希拉在美国哈佛大学获得生物学学士学位,后在美国加州大学旧金山分校(UCSF)获得医学博士学位。
作者简介②:马克·扎克伯格(Mark Zuckerberg)是陈-扎克伯格倡议的联合创始人和联合首席执行官。作为 Meta 的创始人、董事长和 CEO,扎克伯格致力于增强人们的能力和建立社区,并在 CZI 的工作中积累了丰富的技术经验。在 2004 年搬到加州的帕洛阿尔托之前,扎克伯格曾在哈佛大学学习计算机科学。
支持:Ren
好了,关于扎克伯格夫妇署名文章:帮助学界在本世纪末治愈、预防或管理所有疾病就讲到这。
版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。