淖涝网 > 社会 > 正文

​AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解

2024-06-04 00:47 来源:网络 点击:

AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解

【新智元导读】AlphaFold3 的横空出世再次震撼了整个学术界,然而谷歌 DeepMind 的「不开源」引起学界不满,AlphaFold 服务器遭到黑客攻击,开源项目也开始发力。

不久前,AlphaFold3 横空出世,直接登上了 Nature 头版。

新的架构、前所未有的预测精度和准确率,再次震撼了整个学术界。

然而,与 AlphaFold2 不同,这个新一代的超强模型却没有开源。

取而代之的是,谷歌 DeepMind 推出了一个免费研究平台「AlphaFold Server」,供全球科学家使用。

服务地址:https://gdm-alphafold.corp.google.com/welcome

网站操作简单,只需点击几下,就可以利用 AlphaFold3 在 10 分钟内得到预测结果。

但是服务有每日的次数限制,且只能用于非商业研究。同时,相比于开源的 AlphaFold2 来说,这种使用方式缺失了很多自由度,让一些研究人员觉得差点意思。

——这么做其实无可厚非,毕竟 DeepMind 也是要盈利的,它的子公司 Isomorphic Labs 已经开始用 AlphaFold3 来开发药物了。

谷歌 DeepMind 希望能在促进科学进步,以及保护自身商业利益上找到平衡。

科学家们感到失望

正所谓,由俭入奢易,由奢入俭难。

谷歌的 AlphaFold3 在 5 月 9 号登上 Nature 头版,而仅仅两天之后的 5 月 11 日,加州大学旧金山分校(University of California,San Francisco)的计算结构生物学家 Stephanie Wankowicz,和其他九位科学家共同撰写了一封致 Nature 的公开信:

公开信地址:https://zenodo.org/records/11206103

信中指出:谷歌 DeepMind 的这种做法不符合科学进步的原则,科学进步依赖于社区评估、使用和建立现有工作的能力。

此后,有 600 多名研究人员签署了这封公开信。

公开信的合著者、计算结构生物学家 Roland Dunbrack,曾对 AlphaFold3 的论文进行了同行评审,他对 DeepMind 没有发布代码感到失望。

「我想要可下载的代码,如果我们可以自由使用 AlphaFold3,新的研究成果就会诞生。」

其他科学家怎么说:

AlphaFold 是一项千载难逢的突破,对生物科学产生了巨大影响。我认为它的作者最终会获得诺贝尔奖,因为他们解决了一个 70 多年来一直无法破解的巨大问题。我基本上每天都在工作中使用它,指导药物发现和实验上有用的 HBV 聚合酶的工程设计。 最新版本的 AlphaFold3 比以前更强大。它已经在我的实验室中揭示了 HBV RNA 最初如何与聚合酶结合的结构。不幸的是,他们更改了此版本的使用许可,限制了其用于药物发现。

绕过 DeepMind,自己破解

在遭到公开信打脸的两天后,5 月 13 日,DeepMind 改头换面,宣布将在六个月内,开放 AlphaFold3 的代码和模型权重供学术使用。

并且,AlphaFold3 服务的每日使用次数限制也上调为 20 次。

但科学家们似乎不太买账,毕竟有了商业竞争的考量,谁知道你拿出来的是不是阉割版,而且还要等上半年之久。

对于这个未来的版本,科学家们尤其质疑其预测蛋白质结构与潜在药物分子或配体的能力。

Dunbrack 表示,「我不认为他们会给我们做任何配体的能力,而 AlQuraishi 团队正在开发的 OpenFold3 模型就不会做这种阉割,也不会对商业用途有任何限制。」

Mohammed AlQuraishi 是哥伦比亚大学的计算生物学家,他的「OpenFold」团队已经开始编写 AlphaFold3 的开源版本,他们希望今年完成。

AlQuraishi 团队此前开发了大名鼎鼎的 OpenFold,作为 AlphaFold2 的开源重新实现,它的效率要高得多,并且得到的结果也差不多。

「如果这种对我们进行药物发现和关系到人类健康的重要能力封闭在少数人手里,那将是糟糕的。」

科学家们追求 AlphaFold3 的开源版本还有其他原因,其一就是能够重新训练模型,以更好地模拟蛋白质和潜在药物之间的相互作用。

AlQuraishi 团队的 OpenFold 就使用了与 DeepMind 相同的公开数据集进行训练。

而对于许多制药公司来说,他们可以利用自己的专有数据重新训练,以提高模型的性能。

虽然但是,「Talk is cheap. Show me the code」。GitHub 上的「开源 AlphaFold3」早已经开搞了!

项目地址:https://github.com/lucidrains/alphafold3-pytorch

这是由旧金山的独立软件工程师 Phil Wang 发起的众包工作。

大家有兴趣还可以看看仓库中的其他项目,这位大佬已经开发了几十个 AI 模型的开源版本,包括著名的 Dall-E 2。

此外,西雅图华盛顿大学的计算生物物理学家 David Baker,也带领团队开发了名为 RoseTTAFold-All-Atom 的开源蛋白质和化学预测模型,尽管暂时还打不过 AlphaFold3。

AlphaFold3 服务器被黑

尽管 Wang 表示自己的三人团队能在一个月内完成描述 AlphaFold3 模型的代码。

但最耗时也是最贵的步骤显然是模型的训练(AlQuraishi:「代码是 5% 的努力」)。

MIT 的进化生物学家 Sergey Ovchinnikov 估计,像 DeepMind 那样训练 AlphaFold3 可能需要花费超过 100 万美元的云计算资源,尽管有可能在不影响性能的情况下偷工减料以降低成本。

AlphaFold3 的完全开源版本,将使研究人员能够更好地了解模型的工作原理并扩展其功能。

——在等待的日子里,已经有一些科学家在尝试攻击 AlphaFold3 服务器来获取一些信息。

Ovchinnikov 说,「网上已经有一些黑客攻击,为了获得嵌入细胞膜的蛋白质(与脂肪分子相互作用)的更准确的模型。另一次服务器黑客攻击揭示了一种蛋白质采用的另一种形状。」

AlQuraishi 希望,开发 AlphaFold3 开源版本的推动力将成为一个「警示故事」,提醒学者们依赖 DeepMind 等科技公司开发和分发 AlphaFold 等工具的危险。

「他们这样做很好,但我们不应该依赖它,我们需要建立一个公共部门和自己的基础设施。」

网友怎么说?

有网友认为,安全问题是谷歌 DeepMind 选择不开源的一个重要考量,也许 AlphaFold3 能帮助制造针对特定人群的生物武器。

我认为令人担忧的是,有人可以用它制造超级朊病毒,或者设计一种非常有效的毒素(使用模型药物发现部分的能力)

对此,有网友表示反对:「担心我们可以制造出一种将接管一切的超级微生物,这是狂妄自大。」

我在科学中学到的一件事是,我们太傲慢了,认为我们可以设计一种超级疾病。现实情况是,微生物世界已经充满敌意,几乎每一种致命的生物都已经进化了。你定制设计的任何东西都可能在离开实验室的那一刻就死了。或者更有可能的是,被干掉并被吃掉。

也有网友似乎玩起了「绝命毒师」:

我一直认为,如果人工智能最终能以某种方式,一步一步地指导你如何只用家居用品来制作这样的东西,那将是疯狂的。 想象一下,让一个人工智能帮你制作氯胺酮,它告诉你去买一大袋盐、果冻、3 个钛螺丝、一杯橙汁、一些石膏 ...... 然后给你一个非常非常长的步骤,把它们变成氯胺酮。过程可能非常乏味,并且需要做很多工作 ...... 但是,如果这在技术上是可行的呢?

——据说,有机化学是史上单人战斗力的巅峰,有了知识的力量,沃尔玛在你眼中就是武器库。

不过,人类对知识和未知的渴望是挡不住的,我们拭目以待即可。