伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用
2025-10-29 18:30:59阅读量:14 字体:大 中 小
中国存储网消息,近日,伯克利实验室与 Meta 合作发布了开放分子 25 (OMol25) 和通用原子模型 (UMA) 供公众使用。Open Molecules 是超过 1 亿个 3D 分子快照的集合,其特性是使用密度泛函理论 (DFT) 计算的。DFT 是一种非常强大(且计算成本高昂)的工具,用于模拟原子相互作用的精确细节,使科学家能够预测每个原子上的力和系统的能量,这反过来又决定了决定更大规模特性的分子运动和化学反应,例如电解质在电池中的反应或药物如何与受体结合以预防疾病。

OMol25 使用高性能量子化学程序包 ORCA(版本 6.0.1)构建,包含大型原子系统的模拟,到目前为止,没有大量计算资源的化学家无法获得这些模拟。以前的分子数据集要小得多,模拟只包括 20 到 30 个原子(每次计算)和有限的元素。OMol25 需要 60 亿个核心小时的计算时间来创建 10 倍大的数据集,包括许多不同元素之间的复杂交互。Meta 的基础 AI 研究 (FAIR) 团队利用公司庞大的全球计算资源网络来运行数百万次 DFT 模拟,利用世界上一部分人睡着而不浏览 Instagram 和 Facebook 时的空闲带宽。
此外,Meta 还分享了其通用原子模型 (UMA),这是一种基于机器学习数据的工具,用于模拟原子在各种材料和分子中的相互作用。与 Microsoft 的 Aurora 天气模型一样,UMA 也基于现有数据进行训练,这些数据包含超过 300 亿个原子,这些数据是 Meta 在过去五年中发布的所有数据集中包含的,包括那些同时具有分子和材料的数据集。
UMA 为研究人员提供了一个基础化学模型,该模型提供了更准确的预测并更好地了解了分子行为。它还可以作为下游用例和微调应用程序以及开发自己的模型的多功能基础。
美德纽带
使用传统 HPC 结果训练机器学习模型的一个示例,或者以 UMA 为例,机器学习原子间电位 (MLIP) 在数值 DFT 数据上进行训练,可以提供相同口径的预测,但比传统数值方法快 10000 倍。在标准计算系统上运行时,模拟大型原子系统的能力总是遥不可及的。MLIP 充当数值 DFT 的替代项,需要与传统 DFT 计算相同的输入:原子位置、原子序数以及自旋和电荷信息(可选)。
MLIP 方法的有用性取决于它可用于训练的数据的数量、质量和广度。OMol25 拥有 1 亿个 3D 分子快照,是用于训练的化学多样性最强的分子数据集,因此增强了 MLIP 模型。如发现的良性循环中所述,现有的传统 HPC(数值)数据用于训练 AI 模型,然后产生更多的“DFT”结果(使用快速 MLIP 模型),这些结果可能会反馈到循环中,以产生更大、更多样化的结果集。
OMol25 和 UMA 相结合,有可能使用基于数据的 AI 模型而不是直接计算来解锁分子和材料研究的新功能。Meta 将此视为开放科学发布的下一步,以加速原子级材料设计。他们还与劳伦斯利弗莫尔国家实验室 (Lawrence Livermore National Laboratory) 等合作伙伴合作,将这些数据集和模型扩展到聚合物等新类别的分子。
“我认为这将彻底改变人们进行化学原子模拟的方式,能够自信地说这真是太酷了,”项目联合负责人、伯克利实验室的化学家和研究科学家塞缪尔·布劳 (Samuel Blau) 说。他在团队中的同事来自六所大学、两家公司和两个国家实验室。
“我们非常高兴能与社区合作构建这个数据集,看看它将带我们去哪里创建新的 AI 模型,”Meta 基础 AI 研究 (FAIR) 实验室的研究总监 Larry Zitnick 说。
OMol25 和 UMA 代表了 AI 在发现的良性循环中加速的另一个例子。基于数据的科学和工程基础模型的持续开发将继续加速发现过程。论文和数据可在此处获得:
下载 OMol25 数据集和模型 阅读 OMol25 论文 下载 UMA 模型 阅读 UMA 论文免责声明:
本文《伯克利实验室与 Meta 合作发布了开放分子 25 和通用原子模型 (UMA) 供公众使用》版权归原作者所有,内容不代表本站立场!
如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系本站,我们会及时删除处理。
推荐阅读

SOL币总量争议再起:500亿还是5亿?分片技术如何支撑未来价值?
数字认知网报道:QlG数字认知网 - 区块链数字货币实时行情平台在加密货币领域,SOL币一直备受关注。近期,关于SOL币总量的争议再次引发了市场的广泛讨论,与此同时,其采用的分片技术能否支撑未来价值也...
阅读: 30

SOL币烧毁机制曝光:流通量年内或跌破3亿?
数字认知网报道:9xd数字认知网 - 区块链数字货币实时行情平台在加密货币市场风云变幻的当下,SOL币的烧毁机制曝光宛如一颗巨石投入平静的湖面,激起了层层涟漪。这一消息迅速在币圈引起了广泛的关注和讨论...
阅读: 56

艾达币硬分叉引发市场震荡:ADA价格突破0.94美元后鲸鱼抛售1.8亿枚,未来还能涨到6美元?
数字认知网报道:mSG数字认知网 - 区块链数字货币实时行情平台在加密货币的世界里,艾达币(ADA)的一举一动都备受关注。近期,艾达币的硬分叉事件引发了市场的剧烈震荡。硬分叉作为区块链技术中的一个重要...
阅读: 16

卡尔达诺十年蓝图曝光:ADA币能否复制2021年涨幅?分析师预测2025年目标价6美元
数字认知网报道:Eqz数字认知网 - 区块链数字货币实时行情平台卡尔达诺十年蓝图曝光:ADA币能否复制2021年涨幅?分析师预测2025年目标价6美元在加密货币的世界里,卡尔达诺(Cardano)一直...
阅读: 37

XGame强强联合ADA币:区块链游戏生态爆发能否推动价格突破1美元?
数字认知网报道:7w2数字认知网 - 区块链数字货币实时行情平台XGame强强联合ADA币:区块链游戏生态爆发能否推动价格突破1美元?在当今数字化时代,区块链技术正以前所未有的速度改变着各个行业,游戏...
阅读: 53

莱特币MimbleWimble协议落地:2026年267美元预测能否兑现?
数字认知网报道:Vqq数字认知网 - 区块链数字货币实时行情平台莱特币MimbleWimble协议落地:2026年267美元预测能否兑现?莱特币(Litecoin)作为加密货币领域的重要一员,自诞生以...
阅读: 32

莱特币机构抢筹暗流:从孙宇晨合作到美罗百货支付落地
数字认知网报道:LLa数字认知网 - 区块链数字货币实时行情平台在加密货币的风云变幻市场中,莱特币近期成为了备受瞩目的焦点。机构投资者们对莱特币的抢筹暗流涌动,引发了市场的广泛关注和热烈讨论。这种现象...
阅读: 45

莱特币VS瑞波币终极对决:SEC监管风暴中的支付赛道洗牌
数字认知网报道:R20数字认知网 - 区块链数字货币实时行情平台莱特币VS瑞波币终极对决:SEC监管风暴中的支付赛道洗牌在当今数字化浪潮中,加密货币作为一种新兴的支付手段正逐渐改变着传统金融格局。支付...
阅读: 51

知名NFT项目无聊猿公司Yuga Labs宣布:美国SEC调查结案 NFT不是证券
ewX数字认知网 - 区块链数字货币实时行情平台数字认知网(65901.com)讯:知名NFT项目「无聊猿(Bored Ape Yacht Club,BAYC)」背后的公司Yuga Labs宣布,美国...
阅读: 40

Doodles宣布将在Solana上发行Meme币DOOD!NFT周交易量飙至1600万美元
eHR数字认知网 - 区块链数字货币实时行情平台数字认知网(65901.com):Doodles新团队宣布会在Solana上发行$DOOD Meme币后,Doodles NFT的周交易量飙升到1,60...
阅读: 19
猜你喜欢

Strategy公司比特币引擎增速放缓,分析师称其仍具备长期潜力
2025-11-04

11月加密货币股票焦点:CRCL、BMNR与HOOD的上涨潜力分析
2025-11-04
墨西哥央行确认全面资产支持,应对用户提款激增
2025-11-04

比特币价格预测:2025年底能否突破15万美元大关?
2025-11-04
近年来对XRP持有者最重要的日期:11月13日或成历史性时刻
2025-11-04

美联储降息对BTC/USD价格的影响及数据缺口的市场分析
2025-11-04
清崎再发“大规模崩盘”警告:建议投资者转向比特币和以太坊
2025-11-04

比特币期货市场:多空失衡下的战略机遇与风险应对
2025-11-04
