MAE Overview
  • 预训练:

    训练集:医院+公开,约 800x(3~4)x256x256x80

    1、单模态resize -> 160x160x80

    2、crop -> 0.4 mask -> 0.75

    3、mae3d输入,通道改为80,单个patch大小为160/patch_size,160/patch_size,80/patch_size 保存encoder权重。

    4、encoder输出为batch_size,160/patch_size x 160/patch_size x 80/patch_size,embed

image-20251112184515236

  • 训练:

    训练集:医院数据+labels

    1、单模态resize -> 160x160x80

    2、crop -> 0.4 mask -> 0

    3、encoder采用预训练权重,encoder输出batch_size,160/patch_size x 160/patch_size x 80/patch_size,embed 经过unpatch第二维度恢复至20,20,10三维。

    4、decoder改为CNN Decoder对20,20,10进行上采样,计算与label损失。

  • 手写研究思路


http://pleinelune-r.github.io/2025/11/12/medseg/
作者
Pleinelune
发布于
2025年11月12日
许可协议