Skip to content

基准测试

Benchmark 概述

SpectrumLab 的 Benchmark 采用分层架构设计,从信号处理到高级语义理解,全面评估模型在光谱学任务上的能力。基准测试包含四个主要层级,每个层级包含多个子任务,适用于不同类型的谱图分析。

Benchmark 详情

1. 信号层(Signal Level)

基础的谱图信号处理和分析,包括以下子任务:

  • 谱图类型分类(Spectrum Type Classification):识别不同类型的谱图(红外、核磁、拉曼等)。
  • 谱图质量评估(Spectrum Quality Assessment):识别谱图是否清晰、完整、以及是否存在明显噪声。
  • 基础特征提取(Basic Feature Extraction):识别谱图中的基线、峰、峰位、峰强等基本特征。
  • 杂质峰检测(Impurity Peak Detection):识别谱图中的杂质峰和异常信号。

2. 感知层(Perception Level)

进一步的谱图视觉理解和模式识别,涵盖:

  • 基本化学性质预测(Basic Property Prediction):基于谱图特征预测分子离子峰、溶解性、酸碱性等直接关联的性质。
  • 元素组成预测(Elemental Compositional Prediction):从质谱等中识别元素组成和同位素模式。
  • 官能团识别(Functional Group Recognition):根据谱图特征(特别是特征峰位)预测分子可能存在的官能团。
  • 谱峰归属(Peak Assignment):对谱图中的主要峰进行初步的化学归属。

3. 语义层(Semantic Level)

深层的谱图语义理解和化学知识推理,包括:

  • 多模态谱图融合(Fusing Spectroscopic Modalities):结合多种光谱或分子信息进行综合判断。
  • 分子结构解析(Molecular Structure Elucidation):根据光谱信息,从多个候选项中匹配正确的分子结构。
  • 多模态推理/问答(Multimodal Molecular Reasoning):基于光谱、文本信息,进行复杂的化学推理问答。

4. 生成层(Generation Level)

创造性地生成新化学信息,主要任务有:

  • 前向问题(Forward Problems):谱图、SMILES 或两者结合,推断分子结构。
  • 逆向问题(Inverse Problems):分子结构生成谱图、SMILES 等。
  • 无条件生成(De Novo Generation):根据特定目标(如特定性质的分子、特定靶点的配体)从头生成新颖、多样且合理的分子结构(SMILES、2D图)及/或预测的多模态信息(谱图、性质)。

基于 MIT 许可发布