用Python的pydicom库搞定DICOM文件：从读取患者信息到三维重建的保姆级教程

张开发

• 2026/5/28 7:01:17 • 15 分钟阅读

分享文章

用Python的pydicom库搞定DICOM文件从读取患者信息到三维重建的保姆级教程医学影像数据在现代医疗诊断中扮演着至关重要的角色而DICOMDigital Imaging and Communications in Medicine作为医学数字成像和通信的国际标准已经成为存储和传输医学影像数据的通用格式。对于Python开发者或医工交叉领域的研究者来说掌握DICOM文件的处理技能不仅能提升工作效率还能为后续的医学图像分析打下坚实基础。本文将带你从零开始通过pydicom这个强大的Python库一步步实现DICOM文件的读取、解析、可视化以及三维重建等核心操作。1. 环境准备与基础概念在开始处理DICOM文件之前我们需要确保开发环境配置正确。推荐使用Python 3.7及以上版本并安装以下必要的库pip install pydicom numpy matplotlib scikit-imageDICOM文件的结构相当复杂它不仅仅包含图像数据还存储了大量与患者和检查相关的元数据。一个典型的DICOM文件由以下几部分组成文件头包含128字节的前导码和4字节的DICM前缀数据集由多个数据元素组成每个元素包含Tag标签标识数据元素的类型如(0010,0010)表示患者姓名VR值表示定义数据的类型和格式值长度数据值的长度值实际的数据内容理解这些基本概念后我们就可以开始实际操作了。2. 读取和解析DICOM文件使用pydicom读取单个DICOM文件非常简单以下是一个基础示例import pydicom # 读取DICOM文件 ds pydicom.dcmread(sample.dcm) # 查看所有可用的数据元素 print(ds.dir()) # 获取特定患者信息 patient_name ds.PatientName patient_id ds.PatientID study_date ds.StudyDate print(f患者姓名: {patient_name}, ID: {patient_id}, 检查日期: {study_date})在实际项目中我们经常需要批量处理多个DICOM文件。以下代码展示了如何遍历文件夹中的所有DICOM文件import os import pydicom def load_dicom_series(folder_path): dicom_files [] for root, _, files in os.walk(folder_path): for file in files: if file.lower().endswith(.dcm): file_path os.path.join(root, file) dicom_files.append(pydicom.dcmread(file_path)) return dicom_files # 使用示例 dicom_series load_dicom_series(/path/to/dicom/folder) print(f共加载 {len(dicom_series)} 个DICOM文件)注意处理真实医疗数据时务必遵守相关隐私法规确保患者信息的安全。3. 图像数据处理与可视化DICOM文件中的像素数据可以通过pixel_array属性访问但直接显示这些数据可能会遇到一些问题比如显示效果不理想或像素值范围异常。以下代码展示了如何正确处理和显示DICOM图像import matplotlib.pyplot as plt import pydicom def display_dicom_image(dicom_file, normalizeTrue): ds pydicom.dcmread(dicom_file) pixel_data ds.pixel_array if normalize: # 将像素值归一化到0-1范围 pixel_data (pixel_data - pixel_data.min()) / (pixel_data.max() - pixel_data.min()) plt.imshow(pixel_data, cmapgray) plt.title(fSlice Location: {ds.get(SliceLocation, N/A)}) plt.axis(off) plt.show() # 使用示例 display_dicom_image(sample.dcm)对于CT图像我们还需要考虑Hounsfield单位HU的转换这能提供更准确的组织密度表示def get_hu_image(dicom_file): ds pydicom.dcmread(dicom_file) pixel_data ds.pixel_array # 检查是否存在必要的属性 if not hasattr(ds, RescaleIntercept) or not hasattr(ds, RescaleSlope): return pixel_data # 转换为HU值 hu_image pixel_data * ds.RescaleSlope ds.RescaleIntercept return hu_image # 显示HU图像 hu_image get_hu_image(ct_scan.dcm) plt.imshow(hu_image, cmapgray, vmin-1000, vmax2000) plt.colorbar() plt.show()4. 三维重建与多平面显示医学影像通常是多层二维切片的集合我们可以将这些切片组合成三维体数据进行可视化。以下是实现三维重建的关键步骤import numpy as np import pydicom import matplotlib.pyplot as plt def load_dicom_volume(folder_path): dicom_files [] for root, _, files in os.walk(folder_path): for file in files: if file.lower().endswith(.dcm): file_path os.path.join(root, file) dicom_files.append(pydicom.dcmread(file_path)) # 按切片位置排序 dicom_files.sort(keylambda x: float(x.SliceLocation)) # 创建三维数组 volume np.stack([d.pixel_array for d in dicom_files], axis-1) # 获取像素间距信息 pixel_spacing [float(dicom_files[0].PixelSpacing[0]), float(dicom_files[0].PixelSpacing[1]), float(dicom_files[0].SliceThickness)] return volume, pixel_spacing # 加载DICOM序列 volume, spacing load_dicom_volume(/path/to/dicom/series) # 显示三个正交平面 def show_orthogonal_views(volume): fig, (ax1, ax2, ax3) plt.subplots(1, 3, figsize(15, 5)) # 轴状面原始切片 ax1.imshow(volume[:, :, volume.shape[2]//2], cmapgray) ax1.set_title(轴状面) ax1.axis(off) # 冠状面 ax2.imshow(volume[:, volume.shape[1]//2, :], cmapgray, aspectspacing[2]/spacing[0]) ax2.set_title(冠状面) ax2.axis(off) # 矢状面 ax3.imshow(volume[volume.shape[0]//2, :, :], cmapgray, aspectspacing[2]/spacing[1]) ax3.set_title(矢状面) ax3.axis(off) plt.tight_layout() plt.show() show_orthogonal_views(volume)在实际应用中我们可能还需要进行更高级的三维可视化。以下代码使用matplotlib的3D功能展示体数据from mpl_toolkits.mplot3d.art3d import Poly3DCollection from skimage import measure def plot_3d_surface(volume, threshold300): # 使用Marching Cubes算法提取等值面 verts, faces, _, _ measure.marching_cubes(volume, threshold) # 创建3D图形 fig plt.figure(figsize(10, 10)) ax fig.add_subplot(111, projection3d) # 创建网格集合 mesh Poly3DCollection(verts[faces], alpha0.3) mesh.set_facecolor([0.45, 0.45, 0.75]) ax.add_collection3d(mesh) # 设置坐标轴范围 ax.set_xlim(0, volume.shape[0]) ax.set_ylim(0, volume.shape[1]) ax.set_zlim(0, volume.shape[2]) plt.tight_layout() plt.show() # 使用示例确保volume是HU值 hu_volume np.stack([get_hu_image(d) for d in dicom_files], axis-1) plot_3d_surface(hu_volume, threshold400)5. 实战技巧与常见问题解决在处理真实世界的DICOM数据时经常会遇到各种问题。以下是一些实用技巧和解决方案1. 处理不一致的DICOM文件不同厂商的设备生成的DICOM文件可能有差异以下代码展示了如何安全地访问可能不存在的属性def safe_get(ds, field, defaultNone): try: return getattr(ds, field) except AttributeError: return default # 使用示例 patient_age safe_get(ds, PatientAge, Unknown) print(f患者年龄: {patient_age})2. 像素值归一化与窗宽窗位调整医学图像通常需要调整窗宽(window width)和窗位(window level)以获得最佳显示效果def apply_window(image, window_center, window_width): window_min window_center - window_width // 2 window_max window_center window_width // 2 windowed np.clip(image, window_min, window_max) return (windowed - window_min) / (window_max - window_min) # 使用示例 hu_image get_hu_image(ct_scan.dcm) lung_window apply_window(hu_image, -600, 1500) # 肺窗 bone_window apply_window(hu_image, 300, 1500) # 骨窗 plt.figure(figsize(10, 5)) plt.subplot(121) plt.imshow(lung_window, cmapgray) plt.title(肺窗) plt.subplot(122) plt.imshow(bone_window, cmapgray) plt.title(骨窗) plt.show()3. 处理缺失的SliceThickness信息有些DICOM文件可能缺少SliceThickness信息我们可以通过计算相邻切片的SliceLocation差值来估算def estimate_slice_thickness(dicom_files): locations [] for ds in dicom_files: if hasattr(ds, SliceLocation): locations.append(float(ds.SliceLocation)) if len(locations) 2: return None locations sorted(locations) differences [abs(locations[i] - locations[i-1]) for i in range(1, len(locations))] return np.mean(differences) # 使用示例 dicom_series load_dicom_series(/path/to/dicom/folder) estimated_thickness estimate_slice_thickness(dicom_series) print(f估算的切片厚度: {estimated_thickness:.2f} mm)4. 性能优化技巧处理大型DICOM序列时内存和性能可能成为问题。以下是一些优化建议只加载需要的元数据不加载像素数据ds pydicom.dcmread(large.dcm, stop_before_pixelsTrue) print(ds.PatientName) # 可以访问元数据 # ds.pixel_array # 这会引发错误因为像素数据未被加载使用生成器处理大型序列def process_large_series(folder_path): for root, _, files in os.walk(folder_path): for file in files: if file.lower().endswith(.dcm): file_path os.path.join(root, file) ds pydicom.dcmread(file_path) yield ds del ds # 显式释放内存 # 使用示例 for ds in process_large_series(/path/to/large/series): print(ds.PatientID)6. 高级应用DICOM文件修改与创建有时我们需要修改现有DICOM文件或创建新的DICOM文件。以下是相关操作的示例修改现有DICOM文件# 读取文件 ds pydicom.dcmread(original.dcm) # 修改患者信息去标识化 ds.PatientName Anonymous ds.PatientID 000000 ds.PatientBirthDate # 修改像素数据例如简单的对比度增强 pixel_data ds.pixel_array enhanced_data np.clip(pixel_data * 1.5, pixel_data.min(), pixel_data.max()) ds.PixelData enhanced_data.tobytes() # 保存修改后的文件 ds.save_as(modified.dcm)创建新的DICOM文件from pydicom.dataset import Dataset, FileDataset from pydicom.uid import generate_uid import numpy as np import datetime # 创建新的DICOM数据集 file_meta Dataset() file_meta.MediaStorageSOPClassUID 1.2.840.10008.5.1.4.1.1.2 # CT Image Storage file_meta.MediaStorageSOPInstanceUID generate_uid() file_meta.ImplementationClassUID generate_uid() ds FileDataset(new_image.dcm, {}, file_metafile_meta, preambleb\0*128) # 添加基本属性 ds.PatientName Test^Patient ds.PatientID 123456 ds.StudyInstanceUID generate_uid() ds.SeriesInstanceUID generate_uid() ds.SOPInstanceUID generate_uid() ds.Modality CT ds.SamplesPerPixel 1 ds.PhotometricInterpretation MONOCHROME2 ds.PixelRepresentation 0 # unsigned ds.HighBit 15 ds.BitsStored 16 ds.BitsAllocated 16 ds.Columns 512 ds.Rows 512 ds.PixelSpacing [0.5, 0.5] # 0.5mm像素间距 ds.SliceThickness 1.0 # 1mm切片厚度 # 创建测试图像数据 image_data np.random.randint(0, 65535, size(512, 512), dtypenp.uint16) ds.PixelData image_data.tobytes() # 设置当前日期和时间 dt datetime.datetime.now() ds.ContentDate dt.strftime(%Y%m%d) ds.ContentTime dt.strftime(%H%M%S) # 保存文件 ds.save_as(new_image.dcm)重要提示在实际应用中修改或创建DICOM文件时务必确保符合DICOM标准和相关医疗法规要求特别是涉及患者隐私信息的部分。7. 与其他医学影像处理工具的集成pydicom可以与其他Python医学影像库配合使用构建更强大的处理流程。以下是一些常见集成示例与SimpleITK集成import SimpleITK as sitk import pydicom # 从DICOM系列创建SimpleITK图像 def dicom_series_to_sitk(folder_path): reader sitk.ImageSeriesReader() dicom_names reader.GetGDCMSeriesFileNames(folder_path) reader.SetFileNames(dicom_names) image reader.Execute() return image # 使用示例 sitk_image dicom_series_to_sitk(/path/to/dicom/series) print(f图像大小: {sitk_image.GetSize()}) print(f图像间距: {sitk_image.GetSpacing()}) # 可视化 sitk.Show(sitk_image[:,:,sitk_image.GetSize()[2]//2], title中间切片)与VTK集成进行高级三维可视化import vtk from vtk.util import numpy_support import numpy as np import pydicom def visualize_with_vtk(volume): # 将numpy数组转换为VTK图像数据 vtk_data numpy_support.numpy_to_vtk(volume.ravel(), deepTrue) vtk_image vtk.vtkImageData() vtk_image.SetDimensions(volume.shape) vtk_image.GetPointData().SetScalars(vtk_data) # 创建渲染器和映射器 mapper vtk.vtkGPUVolumeRayCastMapper() mapper.SetInputData(vtk_image) # 创建体积属性 volume_property vtk.vtkVolumeProperty() volume_property.ShadeOn() volume_property.SetInterpolationTypeToLinear() # 设置颜色和不透明度传输函数 color_transfer vtk.vtkColorTransferFunction() color_transfer.AddRGBPoint(0, 0.0, 0.0, 0.0) color_transfer.AddRGBPoint(500, 1.0, 0.5, 0.3) color_transfer.AddRGBPoint(1000, 1.0, 1.0, 0.9) opacity_transfer vtk.vtkPiecewiseFunction() opacity_transfer.AddPoint(0, 0.0) opacity_transfer.AddPoint(500, 0.1) opacity_transfer.AddPoint(1000, 0.5) volume_property.SetColor(color_transfer) volume_property.SetScalarOpacity(opacity_transfer) # 创建体积 volume_actor vtk.vtkVolume() volume_actor.SetMapper(mapper) volume_actor.SetProperty(volume_property) # 设置渲染器 renderer vtk.vtkRenderer() renderer.AddVolume(volume_actor) renderer.SetBackground(0.1, 0.2, 0.4) # 创建渲染窗口 render_window vtk.vtkRenderWindow() render_window.AddRenderer(renderer) render_window.SetSize(800, 600) # 创建交互式渲染窗口 render_window_interactor vtk.vtkRenderWindowInteractor() render_window_interactor.SetRenderWindow(render_window) # 开始渲染 render_window.Render() render_window_interactor.Start() # 使用示例 volume, _ load_dicom_volume(/path/to/dicom/series) visualize_with_vtk(volume)与MONAI集成进行深度学习import monai from monai.data import Dataset, DataLoader from monai.transforms import Compose, LoadImaged, AddChanneld, ScaleIntensityd # 准备DICOM数据集 dicom_files [{image: f} for f in glob.glob(/path/to/dicom/*.dcm)] # 定义转换 transforms Compose([ LoadImaged(keys[image], readerPydicomReader), AddChanneld(keys[image]), ScaleIntensityd(keys[image]) ]) # 创建数据集和数据加载器 dataset Dataset(datadicom_files, transformtransforms) dataloader DataLoader(dataset, batch_size4, shuffleTrue) # 使用示例 for batch in dataloader: images batch[image] print(f批量大小: {images.shape}) break8. 实际项目中的最佳实践在长期使用pydicom处理医学影像数据的过程中我总结出以下几点经验数据组织规范为每个研究(Study)创建独立文件夹在文件夹内按序列(Series)组织DICOM文件使用描述性命名如PatientID_StudyDate_Modality_SeriesNumber元数据管理提取关键元数据并存储在数据库中以便快速查询为常用查询字段(如PatientID、StudyDate)建立索引定期备份原始DICOM文件和提取的元数据性能优化对于大型DICOM序列考虑使用内存映射文件并行处理多个DICOM文件以利用多核CPU预处理常用数据并缓存结果错误处理与日志记录实现健壮的错误处理机制特别是对于不符合标准的DICOM文件记录详细的处理日志包括成功和失败的操作提供有意义的错误消息帮助快速定位问题质量控制实现自动化的数据质量检查验证关键元数据的完整性和一致性定期检查像素数据的完整性和显示质量以下是一个综合示例展示了如何在实际项目中应用这些最佳实践import os import pydicom import numpy as np from concurrent.futures import ThreadPoolExecutor import logging from typing import List, Dict, Optional class DICOMProcessor: def __init__(self, base_path: str): self.base_path base_path self.logger self._setup_logger() def _setup_logger(self): logger logging.getLogger(DICOMProcessor) logger.setLevel(logging.INFO) formatter logging.Formatter(%(asctime)s - %(levelname)s - %(message)s) # 控制台处理器 ch logging.StreamHandler() ch.setFormatter(formatter) logger.addHandler(ch) # 文件处理器 fh logging.FileHandler(dicom_processor.log) fh.setFormatter(formatter) logger.addHandler(fh) return logger def process_study(self, study_id: str) - Dict: study_path os.path.join(self.base_path, study_id) if not os.path.exists(study_path): self.logger.error(fStudy path not found: {study_path}) return {} result {study_id: study_id, series: []} # 并行处理每个序列 with ThreadPoolExecutor() as executor: series_dirs [d for d in os.listdir(study_path) if os.path.isdir(os.path.join(study_path, d))] futures [executor.submit(self.process_series, study_path, s) for s in series_dirs] for future in futures: series_result future.result() if series_result: result[series].append(series_result) self.logger.info(fProcessed study {study_id} with {len(result[series])} series) return result def process_series(self, study_path: str, series_dir: str) - Optional[Dict]: series_path os.path.join(study_path, series_dir) try: dicom_files [] for root, _, files in os.walk(series_path): for file in files: if file.lower().endswith(.dcm): file_path os.path.join(root, file) dicom_files.append(file_path) if not dicom_files: self.logger.warning(fNo DICOM files found in {series_path}) return None # 读取第一个文件获取元数据 first_ds pydicom.dcmread(dicom_files[0], stop_before_pixelsTrue) series_result { series_dir: series_dir, modality: safe_get(first_ds, Modality, UNKNOWN), series_description: safe_get(first_ds, SeriesDescription, ), number_of_slices: len(dicom_files), slice_thickness: safe_get(first_ds, SliceThickness, 0), pixel_spacing: safe_get(first_ds, PixelSpacing, [0, 0]), representative_image: None } # 处理中间切片作为代表图像 middle_idx len(dicom_files) // 2 try: middle_ds pydicom.dcmread(dicom_files[middle_idx]) pixel_data middle_ds.pixel_array series_result[representative_image] { shape: pixel_data.shape, mean_intensity: float(np.mean(pixel_data)), min_intensity: float(np.min(pixel_data)), max_intensity: float(np.max(pixel_data)) } except Exception as e: self.logger.warning(fFailed to process representative image: {str(e)}) return series_result except Exception as e: self.logger.error(fError processing series {series_dir}: {str(e)}) return None # 使用示例 processor DICOMProcessor(/path/to/dicom/studies) study_data processor.process_study(STUDY_001) print(study_data)

更多文章

前端开发 2026/5/10 20:42:44

慕尼黑工业大学突破：让AI医生像真正的放射科医生一样诊断病情

在传统的医学诊断中，放射科医生需要像侦探一样工作——他们不是简单地看一张X光片或CT图像就下结论，而是要仔细翻阅整套医学影像资料，在不同的切片之间寻找线索，调整显示设置来看得更清楚，有时还需要使用专业工具进行测…

张开发

前端开发 2026/5/11 4:46:05

SSHJ性能优化：7个技巧让你的SSH连接快如闪电

SSHJ性能优化：7个技巧让你的SSH连接快如闪电【免费下载链接】sshj ssh, scp and sftp for java 项目地址: https://gitcode.com/gh_mirrors/ss/sshj SSHJ（SSH for Java）是一个功能强大的Java SSH库，为Java开发者提供了完整…

张开发

前端开发 2026/5/28 1:53:01

Data-Juicer超参数优化实战：让数据处理效率提升300%的终极指南

Data-Juicer超参数优化实战：让数据处理效率提升300%的终极指南【免费下载链接】data-juicer Data processing for and with foundation models! 🍎 🍋 🌽 ➡️ ➡️🍸 🍹 🍷 项目地址: https…

张开发

前端开发 2026/5/14 22:03:56

PHP源码转换终极指南：5个必须避免的tokenizer常见误区

PHP源码转换终极指南：5个必须避免的tokenizer常见误区【免费下载链接】tokenizer A small library for converting tokenized PHP source code into XML (and potentially other formats) 项目地址: https://gitcode.com/gh_mirrors/to/tokenizer 你是否在P…

张开发

前端开发 2026/5/15 2:58:39

mrjob在Amazon EMR上的部署指南：完整配置与最佳实践

mrjob在Amazon EMR上的部署指南：完整配置与最佳实践【免费下载链接】mrjob Run MapReduce jobs on Hadoop or Amazon Web Services 项目地址: https://gitcode.com/gh_mirrors/mr/mrjob mrjob是一个强大的Python框架，能够简化在Hadoop或Amazon W…

张开发

前端开发 2026/5/11 8:26:35

Windows 11 + WSL2 SSH配置避坑指南：解决Xshell连接Ubuntu 22.04端口冲突与权限问题

Windows 11 WSL2 SSH配置实战：从端口冲突到安全连接的完整解决方案当开发者第一次尝试用Xshell连接WSL2中的Ubuntu系统时，往往会遇到各种意料之外的障碍。这些看似简单的SSH连接问题背后，实际上隐藏着Windows与Linux子系统之间复杂的网络架…

张开发

前端开发 2026/5/11 2:05:30

7个Bug Bounty代码审查终极技巧：快速发现隐藏安全漏洞的完整指南

7个Bug Bounty代码审查终极技巧：快速发现隐藏安全漏洞的完整指南【免费下载链接】awesome-bug-bounty A comprehensive curated list of available Bug Bounty & Disclosure Programs and Write-ups. 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-b…

张开发

前端开发 2026/5/14 22:19:24

Realistic Vision V5.1 使用Git进行版本管理：模型参数与生成作品的协同工作流

Realistic Vision V5.1 使用Git进行版本管理：模型参数与生成作品的协同工作流 1. 引言如果你和你的团队正在用Realistic Vision V5.1这类AI绘画模型做项目，是不是经常遇到这样的麻烦事：同事调出了一组特别棒的参数，你问他具体怎…

张开发

前端开发 2026/5/11 7:22:47

Pixel Script Temple 入门指南：Ubuntu系统下一键部署与Hello World

Pixel Script Temple 入门指南：Ubuntu系统下一键部署与Hello World 1. 前言：为什么选择Pixel Script Temple 如果你正在寻找一个简单易用的像素艺术生成工具，Pixel Script Temple绝对值得一试。这个基于Python的工具包可以让任何人轻松创建…

张开发

前端开发 2026/5/14 23:07:18

WebSocket 命令行神器 wscat：5分钟快速上手 WebSocket 调试

WebSocket 命令行神器 wscat：5分钟快速上手 WebSocket 调试【免费下载链接】wscat WebSocket cat 项目地址: https://gitcode.com/gh_mirrors/ws/wscat wscat 是一款轻量级的 WebSocket 命令行工具，能帮助开发者快速测试和调试 WebSocket 连接&a…

张开发