OpenAI Blog2025年12月16日

OpenAI 发布 FrontierScience：评估 AI 在物理、化学和生物领域的科研推理能力

OpenAI 推出了名为 FrontierScience 的基准测试，旨在评估 AI 在物理、化学和生物学等科学领域的推理能力。该工具将衡量 AI 在迈向真实科学研究过程中的进展。

发生了什么

OpenAI 发布了 FrontierScience 基准测试，专门用于测试人工智能在核心科学学科（物理、化学、生物）中的逻辑推理和研究能力。

为什么重要

这标志着 AI 评估从通用的语言理解转向了更具挑战性的专业科学领域，有助于衡量 AI 辅助人类进行科学发现的潜力。

相关背景

随着大语言模型的发展，研究人员越来越关注其在专业领域的应用。此前，AI 在处理复杂科学逻辑方面仍面临挑战，需要专门的基准来量化其进步。

OpenAIFrontierScience科学研究AI基准测试人工智能

阅读原文 ↗