预训练:
训练集:医院+公开,约
800x(3~4)x256x256x801、单模态resize ->
160x160x802、crop -> 0.4 mask -> 0.75
3、mae3d输入,通道改为80,单个patch大小为
160/patch_size,160/patch_size,80/patch_size保存encoder权重。4、encoder输出为
batch_size,160/patch_size x 160/patch_size x 80/patch_size,embed

训练:
训练集:医院数据+labels
1、单模态resize ->
160x160x802、crop -> 0.4 mask -> 0
3、encoder采用预训练权重,encoder输出
batch_size,160/patch_size x 160/patch_size x 80/patch_size,embed经过unpatch第二维度恢复至20,20,10三维。4、decoder改为CNN Decoder对
20,20,10进行上采样,计算与label损失。手写研究思路