Sobes.tech
Back to questions
Senior
15

Какие особенности медицинских изображений (DICOM, KT, МРТ)?

Companies where asked
Сибур

Answer from AI

sobes.tech AI

Что хотят услышать интервьюеры:

Медицинские изображения отличаются от обычных фото тем, что содержат не только визуальную картинку, но и критически важные метаданные, а также строгие требования к масштабу, ориентации и качеству. DICOM — это стандарт хранения и передачи, а КТ и МРТ — это разные модальности с разной физической природой сигнала. Для ML важно учитывать 3D-структуру, калибровку интенсивностей, артефакты и нормализацию данных между аппаратами и клиниками.

Определение:

DICOM — это формат и стандарт для медицинских изображений, который хранит сам снимок и большое количество метаданных: параметры съёмки, размер пикселя, ориентацию, толщину среза, данные пациента и серию исследований.
КТ строится на рентгеновском ослаблении в тканях и обычно выражается в единицах Хаунсфилда, поэтому хорошо показывает плотные структуры, например кости и кровоизлияния.
МРТ основана на магнитном резонансе и даёт лучшее различение мягких тканей, но интенсивности там менее стандартизованы и сильнее зависят от протокола сканирования.
Для задач ML это означает, что нельзя относиться к этим данным как к обычным изображениям: нужно учитывать объёмность, метаданные, а также различия между устройствами и последовательностями.

Пример использования:

Например, при построении модели для поиска опухоли в головном мозге берут серии МРТ в формате DICOM, собирают их в 3D-объём, учитывают spacing по осям и нормализуют интенсивности отдельно для каждого исследования.

# Псевдокод обработки медицинского DICOM-объёма
dicom_series = load_dicom_series("patient_study/")
volume, metadata = stack_slices(dicom_series)

voxel_spacing = metadata["spacing"]  # размер вокселя по осям
volume = resample_to_isotropic(volume, voxel_spacing)
volume = normalize_intensity(volume)

prediction = model.predict(volume)

Пояснение кода:

  1. Загружается серия DICOM-срезов, а не отдельный файл, потому что для КТ и МРТ часто анализируют весь объём.
  2. Срезы объединяются в 3D-объём, чтобы сохранить пространственную структуру анатомии.
  3. Из метаданных берётся spacing, чтобы привести данные к изотропной сетке и не исказить геометрию.
  4. Интенсивности нормализуются, потому что у МРТ нет единого физически сопоставимого масштаба между сканерами и протоколами.
  5. На подготовленный объём подаётся модель, которая может быть 2D, 3D или гибридной в зависимости от задачи.

Ключевые моменты:

  • DICOM — это не просто картинка, а стандарт с изображением и богатыми метаданными.
  • КТ и МРТ различаются физикой сигнала и, как следствие, информативностью для разных тканей.
  • Медицинские изображения часто являются 3D/4D-данными, а не одиночными 2D-кадрами.
  • Для ML критичны spacing, orientation, slice thickness, артефакты и различия протоколов.
  • Интенсивности в КТ более интерпретируемы и сопоставимы, чем в МРТ, где нужна осторожная нормализация.
  • В реальных пайплайнах важно сохранять связь изображения с метаданными и не терять геометрию при предобработке.