Swin Unet 代码复现
参考博文:
- SwinUnet官方代码训练自己数据集(单通道灰度图像的分割)-CSDN博客
- 使用SwinUnet训练自己的数据集-CSDN博客
- SwinUnet代码运行教程(总结了多个训练和测试的问题)-CSDN博客
环境搭建
- 下载官方代码:
访问 GitHub - HuCaoFighting/Swin-Unet 下载官方代码。 - 创建虚拟环境
使用 Python 3.8 环境来运行:
conda create -n swinunet python=3.8
conda activate swinunet
- 安装依赖包
在安装了虚拟环境后,使用pip
安装requirements.txt
中的依赖包:
pip install -r requirements.txt
如果运行时提示缺少某些包,可以根据提示安装缺少的依赖。
下载预训练模型和数据集
- 下载预训练模型
访问 https://drive.google.com/drive/folders/1UC3XOoezeum0uck4KBVGa8osahs6rKUY
下载swin_tiny_patch4_window7_224.pth
预训练模型,并将其放入pretrained_ckpt
文件夹。 - 下载官方数据集
访问 https://drive.google.com/drive/folders/1ACJEoTp-uqfFJ73qS3eUObQh52nGuzCd
下载官方数据集project_TransUNet.zip
,并将解压后的data
文件夹放到根目录。 - 生成val.txt文件
将lists
文件夹中的list_Synapse
重命名为Synapse
,然后在Synapse
文件夹内创建val.txt
文件,内容如下:
case0001
case0002
case0003
case0004
case0008
case0022
case0025
case0029
case0032
case0035
case0036
case0038
修改部分代码
- 修改
train.py
我们需要对官方提供的train.py
文件做一些调整,主要是修改一些默认参数。以下是调整后的代码示例:
import argparse
import os
import random
import numpy as np
import torch
import torch.backends.cudnn as cudnn
from networks.vision_transformer import SwinUnet as ViT_seg
from trainer import trainer_synapse
from config import get_config
parser = argparse.ArgumentParser()
parser.add_argument('--root_path', type=str, default='./data/Synapse', help='root dir for data')
parser.add_argument('--dataset', type=str, default='Synapse', help='experiment_name')
parser.add_argument('--list_dir', type=str, default='./lists/lists_Synapse', help='list dir')
parser.add_argument('--num_classes', type=int, default=9, help='output channel of network')
parser.add_argument('--output_dir', type=str, default='./output', help='output dir')
parser.add_argument('--max_iterations', type=int, default=30000, help='maximum epoch number to train')
parser.add_argument('--max_epochs', type=int, default=150, help='maximum epoch number to train')
parser.add_argument('--batch_size', type=int, default=24, help='batch_size per gpu')
parser.add_argument('--n_gpu', type=int, default=1, help='total gpu')
parser.add_argument('--deterministic', type=int, default=1, help='whether use deterministic training')
parser.add_argument('--base_lr', type=float, default=0.01, help='segmentation network learning rate')
parser.add_argument('--img_size', type=int, default=224, help='input patch size of network input')
parser.add_argument('--seed', type=int, default=1234, help='random seed')
parser.add_argument('--cfg', type=str, default='./configs/swin_tiny_patch4_window7_224_lite.yaml', metavar="FILE", help='path to config file', )
parser.add_argument("--opts", default=None, nargs='+', help="Modify config options by adding 'KEY VALUE' pairs. ",)
parser.add_argument('--zip', action='store_true', help='use zipped dataset instead of folder dataset')
parser.add_argument('--cache-mode', type=str, default='part', choices=['no', 'full', 'part'],
help='no: no cache, '
'full: cache all data, '
'part: sharding the dataset into nonoverlapping pieces and only cache one piece')
parser.add_argument('--resume', help='resume from checkpoint')
parser.add_argument('--accumulation-steps', type=int, help="gradient accumulation steps")
parser.add_argument('--use-checkpoint', action='store_true', help="whether to use gradient checkpointing to save memory")
parser.add_argument('--amp-opt-level', type=str, default='O1', choices=['O0', 'O1', 'O2'], help='mixed precision opt level, if O0, no amp is used')
parser.add_argument('--tag', help='tag of experiment')
parser.add_argument('--eval', action='store_true', help='Perform evaluation only')
parser.add_argument('--throughput', action='store_true', help='Test throughput only')
# parser.add_argument("--dataset_name", default="datasets")
parser.add_argument("--n_class", default=4, type=int)
parser.add_argument("--num_workers", default=0, type=int)
parser.add_argument("--eval_interval", default=1, type=int)
args = parser.parse_args()
if args.dataset == "Synapse":
args.root_path = os.path.join(args.root_path, "train_npz")
config = get_config(args)
if __name__ == "__main__":
if not args.deterministic:
cudnn.benchmark = True
cudnn.deterministic = False
else:
cudnn.benchmark = False
cudnn.deterministic = True
random.seed(args.seed)
np.random.seed(args.seed)
torch.manual_seed(args.seed)
torch.cuda.manual_seed(args.seed)
dataset_name = args.dataset
dataset_config = {
args.dataset: {
'root_path': args.root_path,
'list_dir': f'./lists/{args.dataset}',
'num_classes': args.n_class,
},
}
if args.batch_size != 24 and args.batch_size % 6 == 0:
args.base_lr *= args.batch_size / 24
args.num_classes = dataset_config[dataset_name]['num_classes']
args.root_path = dataset_config[dataset_name]['root_path']
args.list_dir = dataset_config[dataset_name]['list_dir']
if not os.path.exists(args.output_dir):
os.makedirs(args.output_dir)
net = ViT_seg(config, img_size=args.img_size, num_classes=args.num_classes).cuda()
net.load_from(config)
# trainer = {'Synapse': trainer_synapse}
trainer_synapse(args, net, args.output_dir)
# python train.py --output_dir ./model_out/datasets --dataset datasets --img_size 224 --batch_size 32 --cfg configs/swin_tiny_patch4_window7_224_lite.yaml --root_path /media/aicvi/11111bdb-a0c7-4342-9791-36af7eb70fc0/NNUNET_OUTPUT/nnunet_preprocessed/Dataset001_mm/nnUNetPlans_2d_split
- 修改
trainer.py
只需修改num_workers=0
即可,避免在小数据集或单机训练时因多线程问题导致的错误。
运行代码
在配置好环境后,可以运行以下命令启动训练。根据你的 GPU 配置调整 --batch_size
的大小:
(swinunet) > python train.py --max_epochs 20 --base_lr 0.05 --batch_size 12
启动后,程序会显示类似以下的信息:
=> merge config from ./configs/swin_tiny_patch4_window7_224_lite.yaml
SwinTransformerSys expand initial----depths:[2, 2, 2, 2];depths_decoder:[1, 2, 2, 2];drop_path_rate:0.2;num_classes:4
---
final upsample expand_first---
pretrained_path:./pretrained_ckpt/swin_tiny_patch4_window7_224.pth
---
Namespace(accumulation_steps=None, amp_opt_level='O1', base_lr=0.05, batch_size=8, cache_mode='part', cfg='./configs/swin_tiny_patch4_window7_224_lite.yaml', dataset='Synapse', deterministic=1, eval=False, eval_interval=1, img_size=224, list_dir='./lists/Synapse', max_epochs=20, max_iterations=30000, n_class=4, n_gpu=1, num_classes=4, num_workers=0, opts=None, output_dir='./output', resume=None, root_path='./data/Synapse\\train_npz', seed=1234, tag=None, throughput=False, use_checkpoint=False, zip=False)
The length of train set is: 2211
277 iterations per epoch. 5540 max iterations
0%| | 0/20 [00:00<?, ?it/s]
Train: 0: 7%|█████▋ | 19/277 [00:08<01:31, 2.80it/s]
训练完成后,模型将保存在 output
目录下,生成 best_model.pth
和 last_model.pth
文件。
本文是原创文章,采用CC BY-NC-ND 4.0协议,完整转载请注明来自infanx.com
评论
匿名评论
隐私政策
你无需删除空行,直接评论以获取最佳展示效果