使用dcm2niix将dicom文件转为nii.gz格式

前言

在使用私有的数据集进行深度学习工作时,往往需要对dicom数据序列进行预处理。由于dicom文件格式的多样性,在原始的数据下进行诸如查看和打标签的工作变得困难。
本文将介绍如何使用dcm2niix这个工具进行dicom到nii.gz格式的转换。

测试环境:Windows10 + python3

工具准备

可以直接下载工具包,选择相应的系统版本即可:
https://github.com/rordenlab/dcm2niix/releases
也可以使用MRIcroGL 中集成的dcm2niix工具,两者都是一样的:
https://github.com/rordenlab/MRIcroGL12/releases

本人机器安装了MRIcroGL,dcm2niix.exe默认安装在C:\Program Files (x86)\MRIcroGL\Resources
在这里插入图片描述
这是一个命令行工具,没有GUI,需要添加环境变量,在用户变量和系统变量中同时添加名为dcm2niix的环境变量,在path路径也添加该目录:
在这里插入图片描述
打开powershell或者cmd,输入dcm2niix,如果出现以下界面,则环境变量添加成功:

在这里插入图片描述

Powershell中使用

接下来,测试工具的使用,可以打开MRIcroGL,在菜单的import中打开DIOCM to nifty 的对话框,如下图所示,在左侧输入文件名,选择一些参数后,将右侧红框命令复制到命令行运行,只需要复制dcm2niix后面的部分:
在这里插入图片描述
具体的命令参数说明可以在命令行输入dcm2niix查看,就是上面的powershell图。
此处,一个example是:

1
dcm2niix.exe -f "outputfilename" -i y -l y -p y -x y -v y -z y -o "E:\datasets" "c:\DicomDir"

其中,"E:\datasets"是输入nii文件的目录,"c:\DicomDir"是输入dicom的目录,"outputfilename" 是输出nii.gz的文件名。

你可以根据你自己的需要选择各种参数。

Python批处理

本部分介绍如何使用python进行批处理。
首先遍历一个含有非常多个dicom序列的文件夹,然后将其的dicom文件的路径保存到一个txt文件中,然后读取txt中的文件路径,在在for循环中调用dcm2niix进行格式的批处理。

分别执行下面两段代码:

首先,遍历文件:

遍历文件并保存为txt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
# 当前目录下所有文件夹下的文件名(不带后缀)写入对应txt文件(以文件夹命名)中
import os

# 如果文件夹不存在创建文件夹
def Makedir(path):
    folder = os.path.exists(path)
    if (not folder):
        os.makedirs(path)

# 利用os.listdir()、os.walk()获取文件夹和文件名
def GetFileName(fileDir, outDir):
    list_name = []
    Makedir(outDir)
    for dir in os.listdir(fileDir):  # 获取当前目录下所有文件夹和文件(不带后缀)的名称
        filePath = os.path.join(fileDir, dir)  # 得到文件夹和文件的完整路径
        if os.path.isdir(filePath) and not (filePath == outDir):
            txt = outDir+"list.txt"
            # 获取根目录路径、子目录路径,根目录和子目录下所有文件名
            for root, subDir, files in os.walk(filePath):
                for subfilepath in subDir:
                    f = open(txt, 'a')  # 以追加方式打开文件
                    subfilepath = os.path.join(filePath, subfilepath)  # 得到文件上层目录
                    f.write(subfilepath+'\n') #此处增加了一个换行符,方便txt文件的查看,后面读取的时候需要去掉换行符
                    f.close()

def main():
    print("procesiing……\n")
    fileDir = r"E:\datasets\LiverCT"  # 输入文件夹路径
    outDir = "E:\datasets\liver_ct_process_output\"
    files = GetFileName(fileDir, outDir)
    print("done!\n")

# 判断是否是程序主入口而已,如果是程序主入口,则代码块执行,否则代码块不执行
# 主要用于别人调用此代码时,不要进入该代码的入口
if __name__ == "__main__":
    main()

然后,读取txt文件,进行批处理转换,这里为了保护病人隐私,去掉了原文件的信息,使用以随机产生的名字:

批处理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
import sys    #导入sys模块
import os
#from PIL import Image  #PIL是python的第三方图像处理库

#dcm2niix.exe -f "outputname" -i y -m y -p y -x y -z y -b n -o "E:\datasets\liver_ct_process_output" "E:\datasets\LiverCT\庄健忠\20180105000198"
# system command line
d2n = 'dcm2niix.exe -f '
para = ' -i y -l y -p y -x y -v y -z y -o '
output_path = "E:\datasets\liver_ct_process_output"

###产生随机命名
import random

def ranstr(num):
    #dictionary
    H = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789'

    salt = ''
    for i in range(num):
        salt += random.choice(H)

    return salt

# read txt
filepaths = []
for line in open("E:\datasets\liver_ct_process_output\list.txt", "r"):  # 设置文件对象并读取每一行文件
    filepaths.append(line)
# deal with format transform    
for filepath in filepaths:
    filepath = filepath[:-1]   #去掉行位的换行符
    outputname = "liver_ct_"+ ranstr(10)
    cmd = d2n + outputname + para +'"'+ output_path +'" ' + '"'+ filepath +'"' #其中的双引号不可少
    os.system(cmd)
print("Congratulation, Done!")

处理好的文件,可以到你的输出目录中去查找,使用MRIcroGL直接打开如下:
在这里插入图片描述