Information

The content of this repository represents work done by Przemysław Mirowski during Master's thesis titled "Generation of brain scan images from segmentation maps using diffusion models" and science article titled "Diffusion model-based synthesis of brain images for data augmentation" done at Lodz University of Technology in Poland.

This work is licensed under Creative Commons Attribution-NonCommercial 4.0 International.

Citation

@article{MIROWSKI2026108940,
    title = {Diffusion model-based synthesis of brain images for data augmentation},
    journal = {Biomedical Signal Processing and Control},
    volume = {113},
    pages = {108940},
    year = {2026},
    issn = {1746-8094},
    doi = {https://doi.org/10.1016/j.bspc.2025.108940},
    url = {https://www.sciencedirect.com/science/article/pii/S174680942501451X},
    author = {Przemysław Mirowski and Anna Fabijańska},
    keywords = {Brain lesion segmentation, ControlNet, Diffusion model, Image augmentation, U-Net, SPADE, Pix2Pix},
}

@mastersthesis{mirowski2024,
    author={Przemysław Mirowski},
    title={Generation of brain scan images from segmentation maps using diffusion models},
    school={Lodz University of Technology},
    year=2024
}

General information

All content of the repository was tested on Windows 11 23H2 with Docker Desktop 4.37.1 and NVIDIA Studio Driver 566.36. Computer configuration is listed in the table below:

Graphic card	Memory	CPU
NVIDIA GeForce RTX 3080 12GB	64 GB	AMD Ryzen 7 5800X

Below there are descriptions regarding every part of the work:

Data preparation - focuses on preparing data for generative model training and creating sets of ids for generative and segmentation model training,
Generative models - focuses on proposed, ControlNet, SPADE and Pix2Pix model training, data generation for evaluation and segmentation model, and evaluation of generative models
Segmentation model - focuses on segmentation model training

All sections are separate from each other which means that when there is command execution it should be done from root repository directory.

Data preparation

To run scripts for data preparation you need to execute below commands:

Move to dataset directory
```
cd ./dataset
```
Run PowerShell script (build and run docker container)
```
./run.ps1 -dataPath "C:\Users\$env:USERNAME\Desktop\data"
```
where you need to create data. Under data directory you will have raw directory created with BraTS2021_Training_Data.tar file downloaded and unpacked from BraTS2021 website
After finished data preparation there will be couple new directories created:
1. /data/raw/extracted - there are raw data which was extracted from nii.gz files to png
2. /data/metadata/dataset - there are some information regarding generated data
3. /data/ids/raw - there are files with information about which patient data belongs to which set group: train, validation or test

Generative models

Training

Proposed model

To train proposed model you need to execute below commands:

Move to custom model directory
```
cd ./generative/custom
```

Run PowerShell script (build and run docker container)

.\run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -modelPath "C:\Users\$env:USERNAME\Desktop\models\generation\custom"

where you need to create generation/custom directory under models.

Model training (running script instead docker container)
```
./src/bash/training/01_training.sh
```

When we will have our final model ready we can start to evaluation and generation of data for segmentation model (all command should be executed in previously created docker container):

Data generation for reconstruction analysis
```
./src/bash/generation/test/01_reconstruction.sh
```
before running script you need to provide proper --run_id value (if it is the last run it will be the newest name of the directory under /models/generation/custom/runs in docker container or C:\Users\$env:USERNAME\Desktop\models\generation\custom\runs in local).
Data generation for diversity analysis
```
./src/bash/generation/test/02_diversity.sh
```
before running script you need to provide proper --run_id value (if it is the last run it will be the newest name of the directory under /models/generation/custom/runs in docker container or C:\Users\$env:USERNAME\Desktop\models\generation\custom\runs in local). By default, for diversity test there will be 1000 images generated. If you want to change that number you can modify value of --img_to_gen_per_seg_map parameter inside the script.

Data generation for segmentation model

./src/bash/generation/seg/01_whole_train_set.sh

Copy segmentation maps for segmentation model

./src/bash/generation/seg/02_copy_seg_masks.sh

ControlNet model

To train ControlNet model you need to execute below commands:

Move to ControlNet model directory

cd ./generative/generative_brain_controlnet

Run PowerShell script (build and run docker container)

.\run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -configPath "C:\Users\$env:USERNAME\Desktop\synthetic-brain-mri-project\generative\generative_brain_controlnet\configs" `
   -artifactPath "C:\Users\$env:USERNAME\Desktop\models\generation\controlnet\artifacts" `
   -modelPath "C:\Users\$env:USERNAME\Desktop\models\generation\controlnet\runs" `
   -resultPath "C:\Users\$env:USERNAME\Desktop\models\generation\controlnet\results"

where you need to create generation/controlnet directory under models. Under newly created controlnet directory you need to create also artifacts, runs and results directories. Also, below command will work if the content of this repository will be cloned under C:\Users\$env:USERNAME\Desktop path.

Model training - autoencoder
```
./src/bash/training/01_train_aekl.sh
```
Model training - diffusion model
```
./src/bash/training/02_train_ldm.sh
```
where inside the script you need to update mlrun_id parameter with run_id which was printed out in console during autoencoder training.
Model training - ControlNet
```
./src/bash/training/03_train_controlnet.sh
```
where inside the script you need to update stage1_mlrun_id (autoencoder) and ldm_mlrun_id (diffusion model) parameters with run_id values printed during training of autoencoder and diffusion model.

When we will have our final model ready we can start to evaluation and generation of data for segmentation model (all command should be executed in previously created docker container):

Conversion of MLFlow models to PyTorch
```
./src/bash/training/04_convert_mlflow_to_pytorch.sh
```
where inside the script you need to update stage1_mlrun_id (autoencoder), ldm_mlrun_id (diffusion model) and controlnet_mlrun_id (ControlNet) parameters with run_id values printed during training of autoencoder, diffusion and ControlNet model.

Data generation for reconstruction analysis

./src/bash/generation/test/01_reconstruction.sh

Data generation for diversity analysis

./src/bash/generation/test/02_diversity.sh

Data generation for segmentation model

./src/bash/generation/seg/01_whole_train_set.sh

Copy segmentation maps for segmentation model

./src/bash/generation/seg/02_copy_seg_masks.sh

SPADE model

To train SPADE model you need to execute below commands:

Move to custom model directory
```
cd ./generative/spade
```

Run PowerShell script (build and run docker container)

.\run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -modelPath "C:\Users\$env:USERNAME\Desktop\models\generation\spade"

where you need to create generation/spade directory under models.

Model training (running script instead docker container)
```
./src/bash/training/01_training.sh
```

When we will have our final model ready we can start to evaluation and generation of data for segmentation model (all command should be executed in previously created docker container):

Data generation for reconstruction analysis
```
./src/bash/generation/test/01_reconstruction.sh
```
before running script you need to provide proper --name and --which_epoch values (if it is the last run it will be the newest name of the directory under /models/generation/spade/runs for --name parameter and under /models/generation/spade/runs/<name>/epochs for --which_epoch parameter in docker container or C:\Users\$env:USERNAME\Desktop\models\generation\spade\runs in local).
Data generation for diversity analysis
```
./src/bash/generation/test/02_diversity.sh
```
before running script you need to provide proper --name and --which_epoch values (if it is the last run it will be the newest name of the directory under /models/generation/spade/runs for --name parameter and under /models/generation/spade/runs/<name>/epochs for --which_epoch parameter in docker container or C:\Users\$env:USERNAME\Desktop\models\generation\spade\runs in local).

Data generation for segmentation model

./src/bash/generation/seg/01_whole_train_set.sh

Copy segmentation maps for segmentation model

./src/bash/generation/seg/02_copy_seg_masks.sh

Pix2Pix model

To train Pix2Pix model you need to execute below commands:

Move to custom model directory
```
cd ./generative/pix2pix
```

Run PowerShell script (build and run docker container)

.\run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -modelPath "C:\Users\$env:USERNAME\Desktop\models\generation\pix2pix"

where you need to create generation/pix2pix directory under models.

Model training (running script instead docker container)
```
./src/bash/training/01_training.sh
```

When we will have our final model ready we can start to evaluation and generation of data for segmentation model (all command should be executed in previously created docker container):

Data generation for reconstruction analysis
```
./src/bash/generation/test/01_reconstruction.sh
```
before running script you need to provide proper --name and --epoch values (if it is the last run it will be the newest name of the directory under /models/generation/pix2pix/runs for --name parameter and under /models/generation/pix2pix/runs/<name>/epochs for --epoch parameter in docker container or C:\Users\$env:USERNAME\Desktop\models\generation\pix2pix\runs in local).
Data generation for diversity analysis
```
./src/bash/generation/test/02_diversity.sh
```
before running script you need to provide proper --name and --epoch values (if it is the last run it will be the newest name of the directory under /models/generation/pix2pix/runs for --name parameter and under /models/generation/pix2pix/runs/<name>/epochs for --epoch parameter in docker container or C:\Users\$env:USERNAME\Desktop\models\generation\pix2pix\runs in local).

Data generation for segmentation model

./src/bash/generation/seg/01_whole_train_set.sh

Copy segmentation maps for segmentation model

./src/bash/generation/seg/02_copy_seg_masks.sh

Model evaluation

To run proposed, ControlNet, SPADE and Pix2Pix models evaluation (calculation of FID and MS-SSIM scores) you need to execute below commands:

Move to testing directory
```
cd ./generative/testing
```

Run PowerShell command (build and run docker container)

./run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -modelsGenPath "C:\Users\$env:USERNAME\Desktop\models\generation"

Run below command to generate MS-SSIM (reconstruction)
```
./src/bash/testing/01_reconstruction_ms-ssim.sh
```
Run below command to generate FID (reconstruction)
```
./src/bash/testing/02_reconstruction_fid.sh
```
Run below command to generate MS-SSIM (diversity) for proposed model
```
./src/bash/testing/03_diversity_ms-ssim.sh
```

After finished evaluation, under the directory /data/metadata/generation (from the container perspective) the metrics.json file will be created. It contains all results from the evaluation of all generative models.

Segmentation model

Training

To train segmentation model you need to execute below commands:

Move to custom model directory
```
cd ./segmentation
```

Run PowerShell script (build and run docker container)

.\run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -modelsPath "C:\Users\$env:USERNAME\Desktop\models\segmentation\artifacts" `
   -resultsPath "C:\Users\$env:USERNAME\Desktop\models\segmentation\results"

Start training of segmentation model
```
./bash/01_training.sh
```

Evaluation

To evaluate segmentation models you need to execute below commands:

Move to custom model directory
```
cd ./segmentation
```

Run PowerShell script (build and run docker container)

.\run.ps1 `
   -dataPath "C:\Users\$env:USERNAME\Desktop\data" `
   -modelsPath "C:\Users\$env:USERNAME\Desktop\models\segmentation\artifacts" `
   -resultsPath "C:\Users\$env:USERNAME\Desktop\models\segmentation\results"

Start training of segmentation model
```
./bash/02_evaluation.sh
```

Name		Name	Last commit message	Last commit date
Latest commit History 93 Commits
dataset		dataset
generative		generative
segmentation		segmentation
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Information

Citation

General information

Data preparation

Generative models

Training

Proposed model

ControlNet model

SPADE model

Pix2Pix model

Model evaluation

Segmentation model

Training

Evaluation

About

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Information

Citation

General information

Data preparation

Generative models

Training

Proposed model

ControlNet model

SPADE model

Pix2Pix model

Model evaluation

Segmentation model

Training

Evaluation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages