DeepS汇报
DeepS:通过深度神经网络加速3D质谱成像

研究目的
3D-MSI相对于2D来说,可以绘制复杂生物结构的分子分布图。本文提出一种多尺度采样单元的系数采样策略,通过3D稀疏网络重建。并提出DeepS工作流程和3D-SSNet,旨在在20-30%的采样率下也能得到和全采样近似的结果,缩短3D MSI技术分析构建的时长。
数据集
3D阿尔兹海默症小鼠脂质数据集
PDX胶质母瘤小鼠脑数据集
小鼠肾脏MALDI数据集
Method
稀疏采样策略
传统方法:集合S中按预定顺序选取1x1大小子集。
本文方法:定义S由多个采样单元(正方形区域)构成,H x W会调整为H/k x W/k,不能整除部分填0。而s由人工掩码(稀疏化全采样数据时)和操作掩码决定。


所有未采样化为三通道(0,1,0),采样复制值到三通道,以此区分未采样像素和低强度采样像素。
论文地址未提供randon_mask函数代码。
3D-SSNet模型

Generator:稀疏图像重建。
Unet:收缩:4x下采样-卷积 扩展:卷积 + 4x上采样。
Discriminator:区分真实、重建样本。
步长2的六块4x4卷积层。

Loss:
1 | |
netD:
errD_real:判别器对真实图像的判断损失
- 使用二元交叉熵(
BCELoss),标签为real_label=1。 - 目标:最大化判别器对真实图像的识别能力(输出接近1)。
errD_fake:判别器对生成图像的判断损失
- 同样使用
BCELoss,标签为fake_label=0。 - 目标:最大化判别器对生成图像的识别能力(输出接近0)。
1 | |

netG:
errG_D:生成器对抗损失
- 使用
BCELoss,但标签为real_label=1(欺骗判别器)。 - 目标:生成图像使判别器输出接近1(误判为真)。
errG_l1:L1重建损失
- 使用
L1Loss,计算生成图像与真实图像的像素级差异。 - 目标:约束生成图像与真实图像的结构一致性。
1 | |

训练过程
从集合{1,2,4,8,16}中选择一个值作为每个离子图像的采样单元的大小,生成一个随机的人工掩码,并执行模拟稀疏采样,遮挡80%。为每个epoch生成新的人工掩码,使3DSSNet了解截面的结构特征、适应不同大小的采样单元。
计算真实图像和生成图像的判别损失(
errD_real/errD_fake),反向传播更新netD。生成图像(
fake = netG(input_cropped)),计算对抗损失(errG_D)和L1损失(errG_l1),反向传播更新netG。如果有提升则保存参数,每五个epoch学习率衰减20% 。

在测试阶段,每个部分只生成一个操作掩码(M#2),由来自相同截面的所有离子图像共享。不需要使用相同的k值,k可以根据偏好设置。在此阶段,使用生成器网络,并丢弃了递归网络。
为了在数据多样性和数据收集成本之间取得平衡,DeepS利用三个切片的全采样数据作为训练数据集,根据沿着Z轴的等距标准进行选择。剩余的组织切片被稀疏采样并用于测试。

训练结果
Dataset:3D阿尔茨海默氏病小鼠脂质数据集
通过对采样率的对比实验表明,在模型训练过程中,采样率越低,重建效果越好。训练参数默认设置如下:50个训练时期,20%的模拟稀疏采样率,批量大小为8,剩余的组织切片被稀疏地采样以评估具有各种采样单元尺寸和采样比的模型的重建性能。
在海马区选择一个10 × 10的区域来评估。计算了特定区域的平均质谱,总体平均绝对误差(MAE)为5.861 × 10−6,与原始光谱高度可比。
固定k值,模型可以有效地恢复不同采样率下的离子图像,几乎所有的离子图像在50%的采样率下都被很好地重建,这由所有离子图像的PSNR值大于30和SSIM值大于0.8来证明。在20%的采样率下,超过90%的离子图像被良好地重建,PSNR和SSIM值分别高于27和0.7。

固定20%采样率,在k=32后PSNR、SSIM数值显著减小。

模型迁移到胶质母细胞瘤PDX小鼠脑模型,该模型对不同质荷比和不同组织切片具有较高的重建精度。
PDX和正常小鼠脑数据集在空间特征上存在差异,但该模型对两者都具有较好的重建效果。
