CuspAI利用生成式AI搜索全材料空间以加速发现

基本信息

来源: Latent Space (blog)
发布时间: 2026-02-25T17:36:18+00:00
链接: https://www.latent.space/p/cuspai

摘要/简介

编者注：CuspAI 在 9 月完成了一轮 1 亿美元的 A 轮融资，传闻其估值已达独角兽级别。他们拥有从 Geoff Hinton 到 Yann LeCun 的全明星顾问团队，以及一众深耕领域的专家。

导语

在材料科学领域，传统的试错法正面临瓶颈，而生成式 AI 为探索无限可能的材料空间提供了全新路径。本文聚焦 CuspAI 及其首席科学家 Max Welling 的研究，解析他们如何利用 AI 搜索与生成技术，加速新型功能材料的发现与验证。通过阅读本文，读者将了解这一前沿领域的核心技术逻辑，以及 AI 如何推动能源与材料产业的实质性变革。

摘要

内容摘要：

CuspAI：搜寻所有可能材料的空间

背景概况： CuspAI 是一家备受瞩目的初创公司，由著名科学家 Max Welling 教授参与创立。该公司于今年 9 月完成了 1 亿美元（$100m）的 A 轮融资，据传闻其估值已达到 独角兽 级别（即超过 10 亿美元）。

核心团队与顾问： CuspAI 拥有行业顶尖的团队和顾问阵容。其全明星顾问团队包括了深度学习领域的泰斗级人物 Geoff Hinton（图灵奖得主）和 Yann LeCun（图灵奖得主、Meta 首席 AI 科学家），公司内部也聚集了一批深耕该领域的深度专家。

核心使命： 公司的核心目标是利用人工智能技术，在“所有可能材料的空间”中进行搜索，旨在发现和设计具有特定属性的新材料。

中心观点

文章核心观点为：CuspAI 通过结合生成式 AI 与几何深度学习，正在将材料科学从传统的“试错法”转变为基于检索的逆向设计模式，试图在巨大的化学空间中高效搜索并筛选出符合特定性能（如碳捕获）的新型材料。

支撑理由与边界条件分析

1. 技术范式的转移：从“物理模拟”到“生成式搜索”

支撑理由： 传统的材料发现（如 DFT 密度泛函理论计算）计算成本极高，且只能逐个验证。CuspAI 采用 Max Welling 提出的“生成式模型”思路，类似于 Diffusion Model，直接在潜在空间中生成晶体结构。这不仅是加速，更是一种**Top-down（自顶向下）**的设计逻辑。
反例/边界条件： 生成模型存在严重的“幻觉”问题。AI 生成的晶体结构可能在数学上优美，但在热力学上是不稳定的，或者根本无法合成。
事实陈述： Max Welling 是图神经网络（GNN）和变分自编码器（VAE）领域的权威专家。

2. 能源背景下的“碳捕获”切入点

支撑理由： 选择碳捕获作为首个落地场景极具商业与战略眼光。这是一个巨大的物理化学空间问题，且直接关联碳排放权交易市场，容易获得政策与资本支持（如 $100m 融资）。
反例/边界条件： 工业级的碳捕获材料（如胺溶液）极其廉价且成熟。AI 发现的新材料，如果合成成本过高或耐久性不足，很难撼动现有的化工体系。
作者观点： 文章暗示 CuspAI 的技术是“搜索引擎”而非单纯的“实验室”，这强调了其筛选和匹配属性。

3. 全明星团队与资本背书的“双刃剑”

支撑理由： Geoff Hinton 和 Yann LeCun 的加入，不仅提供了算法层面的指导（尤其是 GNN 和 Energy-based Models），更提供了巨大的信誉背书，解决了初创公司难以获取顶级数据的信任壁垒。
反例/边界条件： 学术界的泰斗并不总是等同于商业成功的保证。材料科学的落地瓶颈往往不在算法，而在湿实验验证和工程化放大。
你的推断： CuspAI 的估值中，很大一部分包含了对“AI for Science”通用平台能力的溢价，而不仅仅是针对某一种材料的预期。

维度深入评价

1. 内容深度：高屋建瓴但细节隐晦 文章准确捕捉到了 GNN 在处理非欧几里得数据（如分子结构）上的优势。Max Welling 提出的“搜索空间”概念，本质上是用概率分布替代穷举。然而，文章作为访谈或综述，略过了最关键的技术难点：数据的匮乏与标签的噪声。材料科学的高质量实验数据远少于图像数据，如何利用自监督学习或预训练大模型来解决这一问题，是深度的缺失点。

2. 实用价值：战略参考大于战术指导 对于行业从业者，这篇文章揭示了未来的研发流程：数据驱动将成为主流。但对于具体的算法工程师，文章缺乏具体的架构细节（如是使用 Graph Transformer 还是 MPNN），实用价值主要体现在启发思路，而非代码复现。

3. 创新性：几何深度学习的商业化落地 将 Diffusion Model 应用于 3D 晶体生成是目前的前沿领域。CuspAI 的创新点在于将“生成”与“性质预测”解耦，构建了一个闭环的“设计-合成-验证”系统。这比单纯的性质预测公司（如 Citrine）更进一步。

4. 行业影响：倒逼传统化工转型 如果 CuspAI 成功，它将重构材料供应链的周期。传统的材料研发周期是 10-20 年，AI 有望将其缩短至 1-2 年。这种“搜索”模式可能会催生材料领域的“AlphaFold 时刻”，迫使巴斯夫、陶氏等传统化工巨头加速并购或自建 AI 团队。

5. 争议点与不同观点

合成可行性： 计算机生成的数百万种结构中，绝大多数可能无法在实验室合成。批评者认为，AI 只是在做“数学游戏”，忽略了合成路径的复杂性。
算力悖论： 训练和推理大型 GNN 模型本身消耗巨大的能源。为了开发“碳捕获”材料而消耗大量电力，其净碳收益是否为正，是一个值得商榷的 ESG 争议点。

实际应用建议

不要迷信算法，关注数据闭环： 企业在引入此类技术时，应重点考察其是否具备自动化实验室闭环能力，即 AI 设计 -> 机器人合成 -> 实验数据反馈 -> 模型迭代。
关注知识产权（IP）策略： AI 生成的材料专利归属尚有法律灰色地带。建议在利用此类工具时，明确生成结果的专利保护范围。
跨学科人才储备： 传统的材料学家需要懂一点 PyTorch，传统的算法工程师需要懂一点化学键。单一背景的团队无法驾驭此类项目。

可验证的检查方式

指标：关注“合成成功率”
- 观察窗口： 未来 12-18 个月内，CuspAI 是否在顶刊（如 Nature Materials）或工业界合作伙伴（如西门子能源）的试点项目中，公布了实际合成并验证的材料比例。如果成功率低于 1%，

技术分析

技术分析：生成式 AI 在材料科学中的应用范式

1. 核心技术逻辑

从筛选到生成的范式转变 传统材料研发主要依赖于高通量筛选，即在有限的已知数据库中进行搜索。CuspAI 的技术路径在于利用生成式模型，将研发模式转变为“逆设计”。即不再是通过性质推导材料，而是基于目标性质直接生成符合物理规律的材料结构。

生成即搜索 Max Welling 提出的核心概念是将生成过程视为一种在化学空间中的高效搜索。通过深度学习模型学习原子间的相互作用和分布规律，AI 能够在庞大的化学空间中定位具有特定属性（如特定的吸附能、带隙）的区域，从而提出候选结构。

2. 关键技术架构

基础模型与算法

几何深度学习：利用图神经网络（GNN）处理非欧几里得数据，将晶体结构表示为图（原子为节点，化学键为边），以捕捉原子间的拓扑关系。
扩散模型：借鉴计算机视觉中的生成原理，通过逐步去噪的过程构建出稳定的三维晶体结构。
等变性：确保模型对旋转、平移等空间变换保持不变，这是处理三维物理数据的关键技术要求，保证了生成结构符合物理对称性。

物理约束与优化

能量函数嵌入：在生成过程中引入物理先验知识（如力场或薛定谔方程的近似解），通过损失函数约束，确保生成的材料在热力学上是局部或全局稳定的。
条件生成：将目标属性（如 CO2 吸附率）作为条件向量输入模型，引导生成过程向满足特定指标的方向收敛。

3. 技术实现流程

主动学习闭环 技术实现通常包含一个迭代的闭环系统：

生成：模型提出一批候选晶体结构。
筛选与验证：使用低成本算法或高精度计算（如 DFT）评估候选材料的稳定性和目标属性。
反馈：将验证结果（特别是高性能或失败案例）反馈给模型。
微调：利用新数据更新模型参数，提高后续生成的准确性。

数据策略 针对材料科学数据稀缺的问题，该技术路径强调利用无监督学习从大量未标记的结构中学习表征，并结合少量标记数据进行微调。

4. 应用场景与局限

主要应用领域

碳捕获材料：设计金属有机框架或多孔碳材料，优化其对二氧化碳的选择性和吸附容量。
能源存储：寻找具有高离子电导率的固态电解质材料。
电子材料：筛选具有特定光电性能的半导体材料。

当前技术局限

可合成性验证：计算上稳定的结构在实验条件下可能难以合成，涉及复杂的动力学路径问题。
计算精度与成本的平衡：高精度的第一性原理计算耗时昂贵，而低精度计算可能导致筛选结果不可靠。

5. 行业技术影响

该技术路线标志着材料科学从“实验驱动”向“数据驱动”和“AI 驱动”的实质性演进。它通过算法大幅缩小了需要实验验证的化学空间范围，提升了特定功能材料（尤其是针对碳中和需求）的研发效率。

最佳实践

最佳实践指南

实践 1：利用生成式 AI 拓展材料搜索空间

说明: 传统材料科学依赖于对现有数据库的挖掘，这限制了发现新材料的可能性。Max Welling 提倡使用生成式模型（如扩散模型）来探索“所有可能材料的宇宙”，而不仅仅是已知材料。这种方法可以生成自然界中尚未被发现或合成的全新候选结构。

实施步骤:

收集大规模的无机或有机晶体结构数据作为训练集。
训练基于扩散模型或流匹配的生成模型，学习材料结构的潜在分布。
从模型中采样，生成具有特定属性约束的新型材料结构。

注意事项: 确保生成的结构在化学上是合理且稳定的，需要结合能量模型进行过滤。

实践 2：整合几何深度学习技术

说明: 材料通常表示为图或点云结构，而非传统的图像网格。应用几何深度学习技术，特别是图神经网络和等变神经网络，能够更准确地捕捉原子间的对称性和相互作用关系，从而提高预测精度。

实施步骤:

将材料数据转换为图结构，其中原子为节点，键为边。
采用等变 GNN 架构（如 E(3) Equivariant GNN）进行处理，确保模型对旋转、平移和置换具有不变性。
训练模型预测材料的形成能、带隙等关键物理性质。

注意事项: 在处理大规模体系时，需注意 GNN 的计算效率，可能需要采用子图采样或分层聚类技术。

实践 3：构建闭环的“实验室即工厂”系统

说明: 为了加速材料验证，应建立自动化闭环系统。AI 模型提出候选材料，自动化合成平台（机器人）进行制备，并通过自动化表征设备反馈实验数据。这些新数据反过来用于微调 AI 模型，实现自我迭代优化。

实施步骤:

搭建或接入自动化合成机器人工作站。
建立数据自动管道，将实验结果实时回传至训练数据库。
实施主动学习策略，由模型决定下一个最有价值的实验对象。

注意事项: 实验数据的噪声处理和标准化是闭环成功的关键，必须确保数据质量。

实践 4：采用多目标优化与筛选策略

说明: 在寻找特定应用（如碳捕获）的材料时，往往需要同时满足多个条件（如吸附能、稳定性、成本）。单纯依赖单一指标预测是不够的，需要开发多目标优化框架来平衡相互冲突的属性。

实施步骤:

定义关键性能指标及其权重。
使用帕累托前沿分析方法筛选候选材料。
结合贝叶斯优化在巨大的搜索空间中快速定位最优解。

注意事项: 避免对训练数据分布外的样本进行过度外推，需设置置信度阈值。

实践 5：利用云原生与高性能计算加速训练

说明: 搜索所有可能的材料空间需要海量的算力。利用云原生架构和分布式训练技术，可以显著缩短模型迭代周期。CuspAI 的方法强调了可扩展的基础设施在处理大规模原子模拟中的重要性。

实施步骤:

将训练和推理工作负载容器化，并部署在云集群上。
利用混合精度训练和分布式数据并行技术加速模型收敛。
建立模型注册中心，管理不同版本的实验模型。

注意事项: 需仔细监控云资源成本，对于非关键任务可以使用抢占式实例。

实践 6：关注可持续性与特定功能导向

说明: 材料搜索不应盲目进行，而应致力于解决全球性挑战，如气候变化。Welling 的团队特别关注通过计算设计新材料用于碳捕获，这体现了“功能优先”的研究导向。

实施步骤:

针对特定环境问题（如 CO2 捕获、氢气存储）定义目标函数。
在训练数据中增加与环境适应性相关的标签。
优先筛选合成路径绿色、低能耗的材料候选者。

注意事项: 确保材料的最终合成过程是可行的，避免设计出理论上完美但无法制造的材料。

学习要点

生成式AI模型能够通过在化学空间中进行高效采样，显著加速新型候选材料的发现过程，突破传统试错法的局限。
利用生成对抗网络和扩散模型等先进架构，可以针对特定物理属性（如吸附能力、稳定性）直接“逆向设计”出所需的材料结构。
将AI模型与自动化实验室及机器人技术相结合，实现了从材料设计、合成到测试的全闭环自动化验证。
引入物理约束和科学先验知识到机器学习模型中，能够确保预测结果符合物理定律，从而提高模拟的准确性和可靠性。
采用主动学习策略可以大幅降低计算成本，智能地选择最有潜力的候选材料进行高精度模拟或实验。
该技术在应对气候变化方面具有巨大潜力，特别是通过筛选新型材料来高效捕获空气中的二氧化碳。

引用

文章/节目: https://www.latent.space/p/cuspai
RSS 源: https://www.latent.space/feed

注：文中事实性信息以以上引用为准；观点与推断为 AI Stack 的分析。

站内链接

分类：大模型 / 产品与创业
标签：生成式AI / CuspAI / 材料科学 / Geoff Hinton / Yann LeCun / Max Welling / AI for Science / 独角兽
场景： AI/ML项目

CuspAI 探索全材料空间：Hinton 与 LeCun 顾问
CuspAI利用生成式AI搜索全空间材料
CuspAI 探索全材料空间：Max Welling 谈生成式 AI 加速材料发现
Nature视角：CuspAI利用AI搜索材料并获1亿美元融资
CuspAI利用生成式AI搜索全材料空间以加速发现 本文由 AI Stack 自动生成，包含深度分析与方法论思考。

AI Stack

CuspAI利用生成式AI搜索全材料空间以加速发现