Breast Cancer(유방암)

서울아산병원 챌린지를 위하여 이미지 학습 관점에서 유방암에 대해 정리하였습니다.
위키피디아, CAMELYON17를 참고하였고 한글자료는 서울아산병원 참고 하였습니다.

목차

  1. 유방암이란?
  2. 유방암 판단 단계
  3. 디지털 병리학

1.유방암이란?

유방암은 모든 암 중에서 가장 연구가 많이 된 편임에도 환경적 요인과 유전적 요인 두 가지에 의해 발생한다는 명확하지 않은 지식만이 있으며, 아직 유방암 발생의 원인에 관해서는 아직 확립된 정설은 없다. 다만 여러 연구 결과를 통해 몇 가지 요인들이 높은 상관관계를 보이고 있고 그 중 여성 호르몬인 에스트로겐이 발암과정에 중요한 역할 위키피디아

유방암 조기발견

  • 유방 자가 검진 방법
  • 유방 정기진찰 방법
  • 유방사진촬영 방법

보통 사람이 손으로 만져지면 1cm정도라고 할 수 잇고 이렇게 되기까지는 4~7년 걸림 유방사진 촬영을 하지 않으면 미세한 유방암을 알기 힘듬 만져지지 않는 유방암(occult cancer)라고 하며 사진상에 작은 덩어리가 보이거나, 유방조직이 변형되어있거나, 조개 껍질 같은 석회질을 미세하게 갈아서 뿌려놓은 듯한 모앙의 미세한 석회질침착(microcalcification)이 보이기도 하며 혹은 두 가지가 동시에 보이기도 함

2. 유방암 판단단계

TNM system: 고형 종양 환자의 암 확산 정도를 분류하는 국제적인 시스템

  1. T-Stage: 종양의 크기
  2. N-Stage: 암이 림프절로 전이되었는지 여부
  3. M-Stage: 종양이 신체의 다른 부위로 전이되었는지 여부

CAMELYON17의 경우는 N-Stage 에 포커스를 맞춤

breast_lymph_node

3. 디지털 병리학

슬라이드 스캐너가 고해상도(픽셀 당 최대 160nm)로 유리 슬라이드를 디지털화하는데 사용되는 의료용 이미징

resolution_pyramid

전체 슬라이드 이미지는 일반적으로 다중 해상도 피라미드 구조로 저장. 이미지 파일에는 원본 이미지의 여러 다운 샘플 버전이 포함되어 있음. 피라미드의 각 이미지는 일련의 타일로 저장되어 이미지의 하위 영역을 빠르게 검색할 수 있음.

일반적인 전체 슬라이드 이미지는 RGB픽셀 형식이 3바이트인 최고 해상도 수준에서 200000 x 100000 픽셀 단일 레벨에서 55.88GB의 비 암축 픽셀 데이터를 의미함

  • 고해상도 이미지 example_high_resolution
  • 중해상도 이미지 example_mid_resolution
  • 저해상도 이미지 example_low_resolution

4. 다른 팀 자료 정리

  1. Harvard Medical School-Massachusetts General Hospital-Center for Clinical Data Science(Team HMS-MGH-CCDS)

framework

  • Data preprocessing

data preprocessing

  • Data augmentation

Random flip Brightness adjustment Color shift in RGB space Contrast adjustment

hard example mining patch samples

  • Network

Fully convolutional Resnet-101 with dilated convolution and atrous spatial pyramid pooling

stride

network training

  • Post-processig

post preprocessing

  • Result

Accouracy of 91% on slide-wise classification Kappa score of 0.94 on training set

Other Team

MIL-GPAT
  • MIL-GPAT framework mil-gpat framework

  • Pre-processig

mil preprocessing

  • Patch-based classification model

deep texture network

  • Post Process

mil post process

TUe
  • TUe Framework tue method

  • Tissue Region Extraction tissue region extraction

  • Data Sampling

data sampling

  • Train-time Data Augmentation

train time data augmentation

  • Test time Color Augmentation test time color augmentation example of color conversion

정리

  1. 네트워크 구조: VGG, ResNet, GoogLeNet 등 다양하게 사용
  2. 데이터 전처리, 후처리가 매우 중요함