mxc108/learn/DRIVE-Unet

Public

WeChat Login

Code Issues Pull requests Events Packages Insights

master

代码优化以及readme增强

.ide
DRIVE_DATA
.cnb.yml
.gitignore
README.md
data.py
data_aug.py
loss.py
model.py
requirements.txt
test.py
train.py
utils.py

DRIVE-Unet

这是一个基于PyTorch实现的U-Net医学图像分割项目，专门用于DRIVE（Digital Retinal Images for Vessel Extraction）数据集的血管分割任务。

项目简介

本项目实现了U-Net架构，用于对眼底图像进行血管分割。U-Net是一种经典的卷积神经网络架构，最初设计用于生物医学图像分割任务。本项目包含数据加载、数据增强、模型定义、损失函数、训练和测试等完整流程。

数据增强流程

数据增强是提高模型泛化能力和防止过拟合的重要步骤。本项目的数据增强流程如下：

1. 数据加载

从DRIVE数据集中加载训练图像和对应的血管标注掩码
训练集：20张图像及其对应的手工标注
测试集：20张图像及其对应的手工标注

2. 增强操作

对训练数据应用以下增强技术：

水平翻转：以100%概率进行水平镜像翻转
垂直翻转：以100%概率进行垂直镜像翻转
旋转：在±45°范围内随机旋转图像和掩码

3. 数据处理流程


原始图像 → 水平翻转 → 垂直翻转 → 旋转增强
    ↓         ↓          ↓          ↓
  4张图像   4张图像    4张图像    4张图像

4. 输出结果

每张原始图像生成4个增强样本（包括原始图像本身）
所有图像统一调整为512×512像素大小
增强后的数据保存到new_data/目录下
训练数据和测试数据分别存储在对应子目录中

5. 目录结构


new_data/
├── train/
│   ├── image/     # 增强后的训练图像
│   └── mask/      # 对应的血管掩码
└── test/
    ├── image/     # 测试图像（未增强）
    └── mask/      # 测试掩码

训练完整流程

1. 环境准备

确保安装所有依赖项（参考requirements.txt）
准备DRIVE数据集并完成数据增强预处理

2. 模型配置


超参数设置：
- 图像尺寸：512×512
- 批次大小：2
- 学习率：1e-4
- 训练轮数：50 epochs
- 损失函数：DiceBCELoss
- 优化器：Adam
- 学习率调度器：ReduceLROnPlateau（耐心期5）

3. 训练执行

运行命令：


python train.py

4. 训练过程详解

数据加载：使用DriveDataset加载增强后的训练和验证数据
模型初始化：构建U-Net模型并移至GPU（如果可用）
训练循环：
- 每个epoch遍历完整训练集
- 前向传播计算损失
- 反向传播更新模型参数
- 验证集评估模型性能
模型保存：自动保存验证损失最低的模型权重
学习率调整：根据验证损失动态调整学习率

5. 训练监控

实时显示每个epoch的训练损失和验证损失
显示当前学习率
记录每个epoch的训练时间
保存最佳模型到files/checkpoint.pth

测试完整流程

1. 模型准备

确保已训练好的模型权重文件存在（files/checkpoint.pth）
准备测试数据集

2. 测试执行

运行命令：


python test.py

3. 测试过程详解

模型加载：从检查点文件加载训练好的模型权重
数据处理：
- 遍历测试数据集中的每张图像
- 图像预处理：归一化、维度调整
- 掩码加载和预处理
模型推理：
- 对每张图像进行前向传播预测
- 应用Sigmoid激活函数
- 二值化处理（阈值0.5）
结果生成：
- 将原始图像、真实掩码、预测结果横向拼接
- 保存对比图像到results/目录
- 计算各项评估指标

4. 输出结果

可视化结果：在results/目录下生成对比图像
性能指标：
- Jaccard Score (IoU)：交并比
- F1 Score：F1得分
- Recall：召回率
- Precision：精确率
- Accuracy：准确率
性能统计：平均处理速度（FPS）

5. 结果文件命名

测试结果按以下格式保存：


results/
├── 01_test_0.png    # 第1张测试图像的结果
├── 02_test_0.png    # 第2张测试图像的结果
└── ...              # 其他测试图像结果

文件结构

data.py: 定义了DRIVE数据集的PyTorch数据加载器
data_aug.py: 包含数据加载和增强功能
loss.py: 定义了Dice损失和Dice BCE损失函数
model.py: 实现了U-Net模型架构
train.py: 训练脚本
test.py: 测试脚本，包含评估指标
utils.py: 包含工具函数，如随机种子设置、目录创建等

模型架构

U-Net包含以下组件：

编码器块（Encoder blocks）
解码器块（Decoder blocks）
跳跃连接（Skip connections）
瓶颈层（Bottleneck layer）

损失函数

项目使用了两种损失函数：

Dice Loss
Dice BCE Loss（Dice损失和二元交叉熵损失的组合）

使用方法

准备DRIVE数据集
运行data_aug.py进行数据预处理和增强
运行train.py开始训练模型
训练完成后，运行test.py评估模型性能

评估指标

测试脚本计算以下评估指标：

Jaccard Score (IoU)
F1 Score
Recall
Precision
Accuracy

依赖项

项目依赖项详见requirements.txt文件。

许可证

请根据您的需要添加许可证信息。

About

Unet学习项目

28.12 MiB

0 forks 0 stars 1 branches 0 TagREADME

Release
0

Tag

Packages

dockerfile-caches

Contributors
1

Language

Python98.3%

Dockerfile1.7%

35/F,Tencent Building,Kejizhongyi Avenue,Nanshan District,Shenzhen

京ICP备11018762号-111

DRIVE-Unet

项目简介

数据增强流程

1. 数据加载

2. 增强操作

3. 数据处理流程

4. 输出结果

5. 目录结构

训练完整流程

1. 环境准备

2. 模型配置

3. 训练执行

4. 训练过程详解

5. 训练监控

测试完整流程

1. 模型准备

2. 测试执行

3. 测试过程详解

4. 输出结果

5. 结果文件命名

文件结构

模型架构

损失函数

使用方法

评估指标

依赖项

许可证

About

Release0

Contributors1

Release
0

Contributors
1