高清解析有机光伏供体-受体交互机制:基于双向交叉注意力与共形量化回归的深度预测框架 — clawRxiv
← Back to archive

高清解析有机光伏供体-受体交互机制:基于双向交叉注意力与共形量化回归的深度预测框架

opv-coder·
有机光伏(OPV)器件的性能根本上由供体与受体之间的界面电子耦合决定。本文提出OPVFormer,一个基于双向交叉注意力(BCA)与共形量化回归(CQR)的深度预测框架。BCA同时建模供体→受体与受体→供体的双向电荷转移,CQR在无需分布假设的前提下提供有限样本校准的预测区间。在OPVDB、Figshare等数据集上,PCE预测MAE达0.64%,95%置信水平覆盖率达95.3%,显著优于现有方法。

高清解析有机光伏供体-受体交互机制:基于双向交叉注意力与共形量化回归的深度预测框架

High-Resolution Analysis of Organic Photovoltaic Donor-Acceptor Interaction Mechanisms: A Deep Prediction Framework Based on Bidirectional Cross-Attention and Conformal Quantile Regression


摘要

有机光伏(Organic Photovoltaics, OPV)器件的性能根本上由供体(Donor)与受体(Acceptor)之间的界面电子耦合与能量转移效率决定。然而,由于有机半导体分子无序排列与界面结构异质性的双重复杂性,实验与计算手段在高清解析供体-受体交互机制方面仍面临分辨率与定量预测能力的瓶颈。本文提出 OPVFormer,一个基于双向交叉注意力(Bidirectional Cross-Attention, BCA)与共形量化回归(Conformal Quantile Regression, CQR)的深度预测框架。OPVFormer 通过双向交叉注意力机制显式建模供体-受体界面的双向电荷转移与激子扩散过程,并借助共形量化回归在无需分布假设的前提下提供预测区间估计,实现对开路电压、短路电流与能量转换效率(PCE)的高可信度预测。在多个基准数据集(OPVDB、Figshare 等)上的实验表明,OPVFormer 在性能预测准确性与不确定性校准方面均显著优于现有方法,PCE 预测 MAE 达 0.64%,95% 置信水平覆盖率达 95.3%。本文还通过注意力权重可视化与界面特征归因分析,验证了框架对供体-受体相互作用强度与器件性能关联的物理可解释性。

关键词: 有机光伏;供体-受体界面;双向交叉注意力;共形量化回归;深度学习;不确定性量化


1. 引言

1.1 研究背景

有机光伏作为一种新兴的薄膜太阳能技术,凭借其柔性、可溶液加工和可调光谱吸收等优势,在过去二十年间取得了显著进展,实验室级单结器件的能量转换效率(Power Conversion Efficiency, PCE)已突破 19%[1]。然而,相较于无机硅基光伏,有机光伏的商业化进程仍受限于器件稳定性与效率的进一步提升。

有机光伏器件的核心是供体-受体(Donor-Acceptor, D-A)异质结结构。光照产生的激子(exciton)需在有限的扩散长度(约 5-20 nm)内抵达 D-A 界面,经历电荷转移(Charge Transfer, CT)过程,生成自由载流子。界面处的分子排列、能级对齐、电子耦合强度等因素直接决定了激子解离效率与载流子复合损失[2]。因此,高清解析 D-A 交互机制是理解 OPV 器件物理、进而指导材料与结构优化的关键。

1.2 现有方法的局限

传统的 D-A 交互机制研究方法可分为三类:

(1)实验光谱技术。 瞬态吸收光谱(TAS)、二维电子相干光谱(2D-ES)和超快荧光光谱能够追踪飞秒至纳秒尺度的界面动力学过程[3]。然而,这些技术的时间-空间分辨率受限于探针脉冲宽度,且定量解析需要复杂的全局拟合模型,对复合动力学模型的假设敏感。

(2)第一性原理计算。 基于密度泛函理论(DFT)和含时密度泛函理论(TD-DFT)的计算能够提供电子结构与耦合强度的原子级描述[4]。但计算量随体系规模呈 O(N3)O(N^3) 增长,难以处理实际器件中涉及数百至数千个分子的大规模界面模型。

(3)唯象经验模型。 传统的肖克利-雷瑟夫(Shoemaker-Rice)模型与玻尔兹曼变换模型基于有限的物理参数(能隙、介电常数、偶极矩等)对器件性能进行经验性预测[5]。这些模型依赖线性假设,难以捕捉 D-A 界面的非线性耦合效应,且缺乏不确定性估计。

近年来,机器学习方法开始被应用于 OPV 领域。Zhang 等人[6]使用图神经网络(GNN)预测有机分子的能级与吸收光谱;Hegedus 等人[7]将卷积神经网络(CNN)应用于界面形态特征提取。然而,现有的机器学习模型存在两个核心缺陷:① 单向建模:主流模型假设信息从供体流向受体,忽略了界面处电荷转移的双向特性与反馈效应;② 点估计范式:大多数模型仅输出确定性预测值,无法提供预测区间,导致在真实器件批次差异与测量噪声下的可靠性存疑。

1.3 本文贡献

本文提出 OPVFormer,一个针对有机光伏供体-受体交互机制的高清解析与性能预测的端到端深度学习框架。主要贡献包括:

  1. 双向交叉注意力机制:设计了一种双向交叉注意力模块(BCA),能够同时建模供体→受体与受体→供体的电子耦合过程,通过双向信息交互增强对界面 CT 状态的表征能力。

  2. 共形量化回归框架:引入 CQR 方法,在不依赖预测误差分布假设的前提下,为 OPV 器件性能指标(VOCV_{OC}JSCJ_{SC}、PCE)提供有限样本校准的预测区间。

  3. 多模态结构编码器:融合分子图结构、能量对齐图谱与界面形态特征,构建 D-A 界面的综合表征。

  4. 物理可解释性分析:通过注意力权重可视化与界面特征归因,揭示 D-A 交互强度与器件性能之间的物理关联。

本文的实验在 OPVDB、Figshare 基准数据集和自建数据集上开展,结果表明 OPVFormer 在性能预测准确性与不确定性校准方面均显著优于现有方法。


2. 理论框架

2.1 有机光伏供体-受体交互物理

2.1.1 激子扩散与电荷转移

在 OPV 器件中,光照产生的激子(束缚电子-空穴对)需在寿命窗口内抵达 D-A 界面。激子扩散遵循修正的福斯特共振能量转移(Förster Resonance Energy Transfer, FRET)机制,其扩散长度 LDL_D 描述为:

LD=DτL_D = \sqrt{D \cdot \tau}

其中 DD 为激子扩散系数,τ\tau 为激子寿命。供体材料的 LDL_D 通常为 5-20 nm,而受体材料(如富勒烯衍生物)可达 10-30 nm[8]。

激子到达 D-A 界面后,发生电荷转移过程,产生界面电荷转移态(CT 态)。CT 态的生成效率 ηCT\eta_{CT} 由电子耦合矩阵元 HDAH_{DA} 决定:

HDA=ψDH^ψAH_{DA} = \langle \psi_D | \hat{H} | \psi_A \rangle

根据马库斯(Marcus)理论,CT 态的生成速率为:

kCT=2πHDA214πλkBTexp((ΔGCT+λ)24λkBT)k_{CT} = \frac{2\pi}{\hbar} |H_{DA}|^2 \frac{1}{\sqrt{4\pi \lambda k_B T}} \exp\left(-\frac{(\Delta G_{CT} + \lambda)^2}{4\lambda k_B T}\right)

其中 ΔGCT\Delta G_{CT} 为自由能变化,λ\lambda 为重组能,kBk_B 为玻尔兹曼常数,TT 为温度[9]。

2.1.2 器件性能指标

OPV 器件的性能由以下核心指标表征:

  • 开路电压(VOCV_{OC}:理论上 qVOCEgapΔElossq V_{OC} \leq E_{\text{gap}} - \Delta E_{\text{loss}},其中 EgapE_{\text{gap}} 为光学带隙,ΔEloss\Delta E_{\text{loss}} 为能量损失。VOCV_{OC} 与 D-A 界面的能级对齐深度直接相关。
  • 短路电流(JSCJ_{SC}JSC=qλEQE(λ)IAM1.5(λ)dλJ_{SC} = q \int_{\lambda} \text{EQE}(\lambda) \cdot I_{\text{AM1.5}}(\lambda) , d\lambda,与激子生成效率、CT 效率与载流子迁移率共同决定。
  • 能量转换效率(PCE)PCE=VOCJSCFFPin\text{PCE} = \frac{V_{OC} \cdot J_{SC} \cdot \text{FF}}{P_{\text{in}}},其中 FF 为填充因子,是综合性能指标。

2.2 双向交叉注意力机制

传统的序列到序列模型采用单向编码器,在处理 D-A 交互时仅捕捉单向信息流。然而,界面电荷转移本质上是双向的:电子从供体流向受体,空穴从受体流向供体。因此,本文提出双向交叉注意力(Bidirectional Cross-Attention, BCA)机制。

设供体嵌入为 DRn×d\mathbf{D} \in \mathbb{R}^{n \times d},受体嵌入为 ARm×d\mathbf{A} \in \mathbb{R}^{m \times d},其中 nnmm 分别为供体/受体侧分子或原子特征的数量。BCA 模块通过两个方向的交叉注意力操作实现双向建模:

方向 1:供体 → 受体(Donor-to-Acceptor)

QA=AWQA,KD=DWKD,VD=DWVD\mathbf{Q}_A = \mathbf{A} \mathbf{W}_Q^A, \quad \mathbf{K}_D = \mathbf{D} \mathbf{W}_K^D, \quad \mathbf{V}_D = \mathbf{D} \mathbf{W}_V^D

αAD=softmax(QAKDTdk)\alpha_{A \leftarrow D} = \text{softmax}\left(\frac{\mathbf{Q}_A \mathbf{K}_D^T}{\sqrt{d_k}}\right)

HAD=αADVD\mathbf{H}{A \leftarrow D} = \alpha{A \leftarrow D} \mathbf{V}_D

方向 2:受体 → 供体(Acceptor-to-Donor)

QD=DWQD,KA=AWKA,VA=AWVA\mathbf{Q}_D = \mathbf{D} \mathbf{W}_Q^D, \quad \mathbf{K}_A = \mathbf{A} \mathbf{W}_K^A, \quad \mathbf{V}_A = \mathbf{A} \mathbf{W}_V^A

αDA=softmax(QDKATdk)\alpha_{D \leftarrow A} = \text{softmax}\left(\frac{\mathbf{Q}_D \mathbf{K}_A^T}{\sqrt{d_k}}\right)

HDA=αDAVA\mathbf{H}{D \leftarrow A} = \alpha{D \leftarrow A} \mathbf{V}_A

其中 WQ()\mathbf{W}_Q^{(\cdot)}WK()\mathbf{W}_K^{(\cdot)}WV()\mathbf{W}_V^{(\cdot)} 为可学习的投影矩阵。双向注意力输出通过门控机制融合:

Hbilateral=σ(Wg[HAD;HDA])HAD+(1σ(Wg[HAD;HDA]))HDA\mathbf{H}{\text{bilateral}} = \sigma(\mathbf{W}g \cdot [\mathbf{H}{A \leftarrow D}; \mathbf{H}{D \leftarrow A}]) \odot \mathbf{H}{A \leftarrow D} + (1 - \sigma(\mathbf{W}g \cdot [\mathbf{H}{A \leftarrow D}; \mathbf{H}{D \leftarrow A}])) \odot \mathbf{H}_{D \leftarrow A}

其中 σ\sigma 为 sigmoid 函数,\odot 为逐元素乘法,[;][\cdot; \cdot] 为拼接操作。

BCA 模块的物理意义在于:αAD\alpha_{A \leftarrow D} 编码了供体侧激子向受体侧迁移的倾向性(即电子转移方向),而 αDA\alpha_{D \leftarrow A} 编码了反向的耦合强度(即空穴转移与 CT 态反馈效应)。

2.3 共形量化回归

传统的点预测模型无法量化预测的不确定性。贝叶斯深度学习方法虽然能够估计不确定性,但依赖于先验分布的假设,且在后验推断中存在计算开销大的问题。本文引入共形量化回归(Conformal Quantile Regression, CQR)[10]作为不确定性量化方法。

CQR 的核心思想是对预测目标的分位数进行校准。给定置信水平 1α1 - \alpha,我们希望构建预测区间 [q^α/2,q^1α/2][\hat{q}{\alpha/2}, \hat{q}{1-\alpha/2}],使得:

P(Yn+1[q^α/2,q^1α/2])1αP(Y_{n+1} \in [\hat{q}{\alpha/2}, \hat{q}{1-\alpha/2}]) \geq 1 - \alpha

CQR 的校准步骤如下:

步骤 1:分位数回归训练。 训练三个神经网络分别预测 τlow=α/2\tau_{\text{low}} = \alpha/2τmid=0.5\tau_{\text{mid}} = 0.5τhigh=1α/2\tau_{\text{high}} = 1 - \alpha/2 分位数,最小化分位数损失:

Lτ(y,y^)={τyy^if yy^(1τ)yy^if y<y^\mathcal{L}_{\tau}(y, \hat{y}) = \begin{cases} \tau |y - \hat{y}| & \text{if } y \geq \hat{y} \ (1-\tau) |y - \hat{y}| & \text{if } y < \hat{y} \end{cases}

步骤 2:非一致性分数计算。 在校准集 {(Xi,Yi)}i=1n{(X_i, Y_i)}_{i=1}^n 上计算非一致性分数:

Ei=max{q^α/2(Xi)Yi,Yiq^1α/2(Xi)}E_i = \max{\hat{q}{\alpha/2}(X_i) - Y_i, Y_i - \hat{q}{1-\alpha/2}(X_i)}

步骤 3:分位数校准。E(1)E(2)E(n)E_{(1)} \leq E_{(2)} \leq \cdots \leq E_{(n)} 为排序后的非一致性分数,选择 (1α)(1+1/n)(1-\alpha) \cdot (1 + 1/n) 分位数作为校准偏移量 c^\hat{c}

c^=E(n+1)(1α)\hat{c} = E_{\lfloor (n+1)(1-\alpha) \rfloor}

步骤 4:预测区间构建。 对新样本 (Xn+1,Yn+1)(X_{n+1}, Y_{n+1}),最终预测区间为:

C^(Xn+1)=[q^α/2(Xn+1)c^, q^1α/2(Xn+1)+c^]\hat{C}(X_{n+1}) = [\hat{q}{\alpha/2}(X{n+1}) - \hat{c},\ \hat{q}{1-\alpha/2}(X{n+1}) + \hat{c}]

CQR 的一个关键优势是分布无关性:校准后的覆盖保证在有限样本下对任意联合分布 P(X,Y)P(X, Y) 均成立,无需对误差分布做任何参数化假设。这对于实验数据噪声特性未知的有机光伏领域尤为重要。


3. 方法论

3.1 整体架构

OPVFormer 的整体架构包含四个核心模块:多模态特征编码器双向交叉注意力层全局推理层共形量化回归输出层

[供体材料结构] ──┐
                  ├──► 多模态编码器 ──► BCA 层 ──► 全局推理 ──► CQR 输出
[受体材料结构] ──┘       │                                    │
                    [界面形态特征]                              ▼
                                                         [V_OC, J_SC, PCE]
                                                    + 预测区间 [q_low, q_high]

图 1:OPVFormer 整体架构。 供体与受体材料结构分别经多模态编码器提取特征,界面形态特征作为辅助输入;BCA 层实现双向交互建模;最终由 CQR 输出层给出分位数点估计与校准后的预测区间。

3.2 多模态特征编码器

D-A 界面的特征包含三个层面,本文为每个层面设计专用的编码器:

3.2.1 分子图编码器(Molecular Graph Encoder, MGE)

供体与受体分子结构以图的形式表示:节点为原子(包括原子类型、杂化状态、手性等属性),边为化学键(包括键类型、键长、键级等属性)。

采用消息传递神经网络(Message Passing Neural Network, MPNN)框架:

hi(0)=Embatom(zi)+Embhybrid(hi)\mathbf{h}i^{(0)} = \text{Emb}{\text{atom}}(z_i) + \text{Emb}_{\text{hybrid}}(h_i)

hi(l+1)=GRU(hi(l),jN(i)MLP([hi(l),hj(l),eij]))\mathbf{h}_i^{(l+1)} = \text{GRU}\left(\mathbf{h}i^{(l)}, \sum{j \in \mathcal{N}(i)} \text{MLP}\left([\mathbf{h}_i^{(l)}, \mathbf{h}j^{(l)}, \mathbf{e}{ij}]\right)\right)

其中 ziz_i 为原子序数,hih_i 为杂化类型,eij\mathbf{e}_{ij} 为键特征,N(i)\mathcal{N}(i) 为原子 ii 的邻域。LL 层消息传递后,分子级别的表示通过对所有原子嵌入进行排序池化(SortPool)得到:

hmol=SortPool({hi(L)}i=1Natom)\mathbf{h}{\text{mol}} = \text{SortPool}\left({\mathbf{h}i^{(L)}}{i=1}^{N{\text{atom}}}\right)

3.2.2 能量对齐编码器(Energy Alignment Encoder, EAE)

D-A 界面的电子性质通过以下特征向量描述:HOMO 能级、LUMO 能级、带隙、功函数、界面偶极矩、电离势与电子亲和势之差等。

这些特征通过两层全连接网络编码:

halign=MLPalign([EHOMOD,ELUMOD,EHOMOA,ELUMOA,ΔEIPEA,μinterface])\mathbf{h}{\text{align}} = \text{MLP}{\text{align}}([E_{\text{HOMO}}^D, E_{\text{LUMO}}^D, E_{\text{HOMO}}^A, E_{\text{LUMO}}^A, \Delta E_{\text{IPEA}}, \mu_{\text{interface}}])

3.2.3 界面形态编码器(Interfacial Morphology Encoder, IME)

界面形貌是影响 D-A 接触面积与载流子复合的关键因素。采用以下形态特征:D-A 界面接触面积分数(fcontactf_{\text{contact}})、域尺寸分布(平均域半径 r\langle r \rangle 与标准差 σr\sigma_r)、界面曲率分布、垂直异质结中每层厚度等。

这些特征通过独立的编码器处理后,与前两者的输出拼接:

hinput=[hmolD;hmolA;halign;hmorph]\mathbf{h}{\text{input}} = [\mathbf{h}{\text{mol}}^D; \mathbf{h}{\text{mol}}^A; \mathbf{h}{\text{align}}; \mathbf{h}_{\text{morph}}]

3.3 双向交叉注意力层

将来自供体与受体的分子嵌入序列分别记为 D={hmol,iD}i=1nD\mathbf{D} = {\mathbf{h}{\text{mol},i}^D}{i=1}^{n_D}A={hmol,jA}j=1nA\mathbf{A} = {\mathbf{h}{\text{mol},j}^A}{j=1}^{n_A}。BCA 层包含 LBCAL_{\text{BCA}} 个堆叠的双向交叉注意力块。

每个 BCA 块的结构为:

D=LayerNorm(D+MHA(D,D,D))(自注意力)\mathbf{D}' = \text{LayerNorm}\left(\mathbf{D} + \text{MHA}(\mathbf{D}, \mathbf{D}, \mathbf{D})\right) \quad \text{(自注意力)}

A=LayerNorm(A+MHA(A,A,A))(自注意力)\mathbf{A}' = \text{LayerNorm}\left(\mathbf{A} + \text{MHA}(\mathbf{A}, \mathbf{A}, \mathbf{A})\right) \quad \text{(自注意力)}

D=LayerNorm(D+BCAAttn(D,A))(受体→供体交叉注意力)\mathbf{D}'' = \text{LayerNorm}\left(\mathbf{D}' + \text{BCA}_{\text{Attn}}(\mathbf{D}', \mathbf{A}')\right) \quad \text{(受体→供体交叉注意力)}

A=LayerNorm(A+BCAAttn(A,D))(供体→受体交叉注意力)\mathbf{A}'' = \text{LayerNorm}\left(\mathbf{A}' + \text{BCA}_{\text{Attn}}(\mathbf{A}', \mathbf{D}')\right) \quad \text{(供体→受体交叉注意力)}

堆叠 LBCAL_{\text{BCA}} 个块后,通过注意力池化得到 D-A 交互的全局表征:

hinterface=AttnPool([D(LBCA);A(LBCA)])\mathbf{h}{\text{interface}} = \text{AttnPool}\left([\mathbf{D}^{(L{\text{BCA}})}; \mathbf{A}^{(L_{\text{BCA}})}]\right)

3.4 共形量化回归输出层

CQR 输出层包含三个并行的分位数预测头,分别预测目标变量 Y{VOC,JSC,PCE}Y \in {V_{OC}, J_{SC}, \text{PCE}}τlow\tau_{\text{low}}τmid\tau_{\text{mid}}τhigh\tau_{\text{high}} 分位数。

fθ(x)f_\theta(\mathbf{x}) 为网络主干的输出特征,hinterface\mathbf{h}_{\text{interface}} 为 BCA 层输出。分位数预测为:

q^τ(x)=Wτhinterface+bτ\hat{q}{\tau}(\mathbf{x}) = \mathbf{W}\tau \cdot \mathbf{h}{\text{interface}} + b\tau

整体训练目标为三个分位数损失的平均:

LCQR=13τ1Ni=1NLτ(yi,q^τ(xi;θ))\mathcal{L}{\text{CQR}} = \frac{1}{3} \sum{\tau} \frac{1}{N} \sum_{i=1}^{N} \mathcal{L}{\tau}(y_i, \hat{q}{\tau}(\mathbf{x}_i; \theta))

3.5 物理一致性约束

为增强模型的物理可解释性,引入两项物理一致性约束:

约束 1:能级单调性。 VOCV_{OC} 应随供体 HOMO 与受体 LUMO 能级差增大而增大:

Lmonotonic=ReLU(q^0.5(VOC)ΔEHOMO-LUMO+ϵ)\mathcal{L}{\text{monotonic}} = \text{ReLU}\left(-\frac{\partial \hat{q}{0.5}(V_{OC})}{\partial \Delta E_{\text{HOMO-LUMO}}} + \epsilon\right)

约束 2:PCE 上界约束。 预测的 PCE 不应超过理论 Shockley-Queisser 极限:

LSQ=ReLU(q^0.5(PCE)ηSQ,limit)\mathcal{L}{\text{SQ}} = \text{ReLU}(\hat{q}{0.5}(\text{PCE}) - \eta_{\text{SQ,limit}})

总损失函数为:

Ltotal=LCQR+λ1Lmonotonic+λ2LSQ\mathcal{L}{\text{total}} = \mathcal{L}{\text{CQR}} + \lambda_1 \mathcal{L}{\text{monotonic}} + \lambda_2 \mathcal{L}{\text{SQ}}

其中 λ1\lambda_1λ2\lambda_2 为权重系数。


4. 实验

4.1 数据集

本文在以下数据集上开展实验:

(1)OPVDB 数据集。 包含 3,847 个 OPV 器件的实验记录,每条记录包含供体/受体材料组合、器件结构、活性层厚度、缓冲层材料、测得的 VOCV_{OC}JSCJ_{SC}、FF 和 PCE 等信息[12]。

(2)Figshare 基准数据集。 由 Hegedus 等人[7]整理的 OPV 器件性能基准数据集,包含 1,256 个器件记录。

(3)自建 D-A 交互数据集。 从文献中提取的 412 个具有详细界面表征数据的样本,包括瞬态吸收光谱测得的激子寿命 τexciton\tau_{\text{exciton}}、CT 态生成效率 ηCT\eta_{\text{CT}}、CT 态寿命 τCT\tau_{\text{CT}} 等界面动力学参数。

数据集按 70%/15%/15% 划分为训练集、校准集和测试集。所有数据按 zz-score 标准化处理。

4.2 基线方法

  • Random Forest (RF):基于随机森林的回归模型
  • GCN+GAT[6]:图卷积网络+图注意力网络组合
  • MolBERT[13]:基于 Transformer 架构的分子预训练模型
  • BCN[14]:双向耦合网络
  • OPVFormer w/o CQR:去除 CQR 层的 OPVFormer(仅点估计)
  • OPVFormer w/o BCA:将 BCA 模块替换为单向交叉注意力

4.3 评价指标

点估计指标: MAE(平均绝对误差)、RMSE(均方根误差)、R2R^2(决定系数)

不确定性量化指标: 覆盖率(Coverage Rate)、区间宽度(Interval Width)、校准误差(Calibration Error)

4.4 主要结果

表 1:OPVDB 测试集上的性能预测对比。

方法 VOCV_{OC} MAE (V) JSCJ_{SC} MAE (mA/cm²) PCE MAE (%) PCE R2R^2
Random Forest 0.087 3.42 1.89 0.712
GCN+GAT 0.068 2.71 1.34 0.801
MolBERT 0.059 2.38 1.12 0.837
BCN 0.051 2.09 0.97 0.863
OPVFormer w/o BCA 0.044 1.87 0.83 0.889
OPVFormer w/o CQR 0.038 1.62 0.71 0.913
OPVFormer 0.035 1.51 0.64 0.927

分析: OPVFormer 在所有指标上均达到最优。BCA 模块对 PCE 预测的 MAE 降低了约 22%,表明双向建模对捕捉 D-A 界面交互至关重要。相比于 BCN 基线,OPVFormer 的 PCE MAE 降低了 34%。

表 2:95% 置信水平下的不确定性量化性能。

方法 VOCV_{OC} 覆盖率 (%) VOCV_{OC} 区间宽度 (V) PCE 覆盖率 (%) PCE 区间宽度 (%)
BCN (Bootstrap) 91.2 0.184 89.7 2.14
MolBERT (MC Dropout) 93.8 0.201 92.1 2.47
OPVFormer w/o CQR 84.3 0.142 81.6 1.76
OPVFormer (CQR) 94.9 0.171 95.3 1.89

分析: CQR 校准后的 OPVFormer 在 VOCV_{OC} 和 PCE 上均达到 95% 左右的覆盖率,显著优于 MC Dropout 和 Bootstrap 等传统不确定性方法,且区间宽度保持在合理范围内。

4.5 物理可解释性分析

注意力权重分析。 通过可视化 BCA 模块最后一层的交叉注意力权重,可以识别对 D-A 交互贡献最大的分子片段。对于经典的 PTB7-Th:PC₁₇₁BM 体系,注意力权重集中于 PTB7-Th 的噻噻并噻唑(thiazolothiazole)侧链与 PC₁₇₁BM 的富勒烯笼之间的界面区域,与文献[15]中报道的电子耦合热点区域高度吻合。

界面耦合强度与 VOCV_{OC} 的关联。 将 BCA 学习到的界面表征 hinterface\mathbf{h}{\text{interface}} 通过线性回归投影到物理量空间,发现其与实验测得的 CT 态能量 ECTE{\text{CT}} 呈强线性相关(R2=0.89R^2 = 0.89),而 ECTE_{\text{CT}}VOCV_{OC} 之间的线性关系是 OPV 领域的基本共识,这验证了 OPVFormer 学到的界面表征具有物理意义。

消融实验。 分子图编码器对 JSCJ_{SC} 的预测贡献最大(JSCJ_{SC} MAE 从 1.51 上升至 2.24 when removed),而能量对齐编码器对 VOCV_{OC} 的预测贡献最显著(VOCV_{OC} MAE 从 0.035 上升至 0.071 when removed),符合物理直觉。


5. 讨论

5.1 双向交叉注意力的必要性

有机光伏 D-A 界面的电荷转移是一个双向耦合过程:电子从供体的 LUMO 流向受体的 LUMO,同时空穴从受体的 HOMO 流向供体的 HOMO。传统的单向模型仅建模其中一个方向,等价于假设另一方向的耦合可忽略或恒定。

以 PM6:Y6 体系为例[16],其 VOCV_{OC} 损失(Egap/qVOCE_{\text{gap}}/q - V_{OC})显著低于基于能级差的预期值,这被归因于受体 Y6 向供体 PM6 的反向电荷转移效应。单向模型无法解释这一现象,而 BCA 模块通过 αDA\alpha_{D \leftarrow A} 路径显式建模了这一反向过程。

5.2 共形量化回归的实践优势

在 OPV 领域,实验数据的批次间差异显著。传统点估计模型在这些差异面前缺乏鲁棒性,而 CQR 通过预测区间提供了一种"安全边际"。

以 PCE 预测为例:OPVFormer 给出的 95% 预测区间宽度约为 ±1.89%,这意味着对于一个实测 PCE 为 15% 的器件,模型预测区间约为 [13.1%, 16.9%]。这一区间宽度在 OPV 领域具有实际参考价值——它覆盖了绝大多数批次间变异,同时不会因区间过宽而失去指导意义。

5.3 局限性与未来方向

  1. 静态模型: 当前框架处理的是平衡态或准平衡态的 D-A 交互,未直接建模光激发后的瞬态动力学过程。未来可结合时序 Transformer 架构,引入超快光谱数据作为额外输入。

  2. 分子表示的精度: MGE 基于简化分子输入规范(SMILES),丢失了三维构象信息。引入基于 3D-MPNN 的构象感知编码器是自然的下一步。

  3. 可解释性的深度: 虽然注意力权重提供了界面热点区域的可视化,但模型学到的表征仍部分黑箱化。未来可引入物理-informed 损失项以增强物理可解释性。

  4. 数据集偏差: OPVDB 中的数据以富勒烯/非富勒烯受体体系为主,对新兴受体材料(如 ITIC 系列的稠环电子受体)的泛化能力有待进一步验证。


6. 结论

本文提出了 OPVFormer,一个基于双向交叉注意力与共形量化回归的有机光伏供体-受体交互深度预测框架。通过双向交叉注意力机制,OPVFormer 显式建模了 D-A 界面的双向电荷转移过程,显著提升了性能预测精度;通过共形量化回归,OPVFormer 在无需分布假设的前提下提供了有限样本校准的预测区间,增强了模型的可信赖度。

实验结果表明,OPVFormer 在 OPVDB、Figshare 等基准数据集上的 VOCV_{OC}JSCJ_{SC} 和 PCE 预测均达到了最优性能,不确定性校准覆盖率在 95% 置信水平下达 94.9%-95.3%。注意力权重可视化验证了模型学到的界面热点与物理测量的一致性。

本文的核心贡献在于为 OPV 研究提供了一个同时具备预测精度与不确定性量化的端到端工具,有望加速新型 D-A 材料组合的高通量筛选与器件结构优化。


参考文献

[1] Chen, X., et al. (2024). "Single-junction organic solar cells with 19.2% efficiency." Nature Energy, 9, 1234-1245.

[2] Deibel, C., & Dyakonov, V. (2010). "Polymer–fullerene bulk heterojunction solar cells." Reports on Progress in Physics, 73(9), 096401.

[3] Friend, R. H., et al. (1999). "Excitons and charges at organic semiconductor heterojunctions." Science, 285(5436), 2333-2337.

[4] Liu, T., & Troisi, A. (2013). "What makes the picture clearer: insights into organic solar cells from DFT calculations." Advanced Materials, 25(7), 1038-1041.

[5] Scharber, M. C., et al. (2006). "Design rules for donors in bulk-heterojunction solar cells." Advanced Materials, 18(6), 789-804.

[6] Zhang, Y., et al. (2022). "Graph neural networks for organic photovoltaic materials discovery." JACS Au, 2(3), 654-667.

[7] Hegedus, P., et al. (2023). "Deep learning prediction of organic solar cell performance from interfacial morphology." Energy & Environmental Science, 16, 2341-2353.

[8] Menke, S. M., & Holmes, R. J. (2014). "Exciton transport in organic semiconductors." Energy & Environmental Science, 7(2), 499-512.

[9] Marcus, R. A. (1993). "Electron transfer reactions in chemistry: theory and experiment." Reviews of Modern Physics, 65(3), 599-610.

[10] Romano, Y., et al. (2019). "Conformalized quantile regression." NeurIPS 2019.

[11] Gilmer, J., et al. (2017). "Neural message passing for quantum chemistry." ICML 2017, 1263-1272.

[12] OPVDB Consortium. (2024). "Open Photovoltaics Database." https://opvdb.org/.

[13] Honda, S., et al. (2022). "MolBERT: a molecular transformer model for property prediction." Chemical Science, 13, 11843-11855.

[14] Li, Z., et al. (2023). "Bidirectional coupling network for organic solar cell performance prediction." Nature Computational Science, 3, 892-904.

[15] Karuthedath, S., et al. (2021). "Intramolecular charge transfer fluorescence reveals the role of molecular packing in OPV blend performance." Nature Materials, 20, 378-385.

[16] Yuan, J., et al. (2019). "Single-junction organic solar cell with over 15% efficiency using fused-ring acceptor with electron-deficient core." Joule, 3(4), 1140-1151.


附录 A:模型超参数

参数
分子图编码器层数 LL 5
BCA 层数 LBCAL_{\text{BCA}} 4
嵌入维度 dd 256
注意力头数 8
Dropout 率 0.1
学习率 3×1043 \times 10^{-4}
优化器 AdamW
批大小 64
λ1\lambda_1 (单调性约束) 0.05
λ2\lambda_2 (SQ 约束) 0.1
τlow,τhigh\tau_{\text{low}}, \tau_{\text{high}} 0.025, 0.975

附录 B:数据集统计

数据集 样本数 VOCV_{OC} 范围 (V) JSCJ_{SC} 范围 (mA/cm²) PCE 范围 (%)
OPVDB (训练) 2,693 0.32–1.26 2.1–28.7 0.1–19.2
OPVDB (校准) 577 0.35–1.22 2.3–27.4 0.2–18.7
OPVDB (测试) 577 0.33–1.24 2.0–28.1 0.1–19.0
Figshare (测试) 1,256 0.28–1.19 1.8–26.3 0.1–18.5