U-net

  • U자형 모형으로 되어있는 네트워크로, 의료영상 Segmentation 분야에서 비교적 높은 예측률을 보여옴.
  • 모델은 이미지의 컨텍스트를 학습하는 Contracting path과 정밀한 영역을 표시하기 위한 Expanding path로 나눠짐.
    • 둘은 서로 대칭관계
대칭형의 모양을 가진 u-net이지만,
사실은 평평하게 그려놓고 아치로 연결선을 표현한것과 다름이 없다.
  • Contracting path는 3X3 컨볼루션과 ReLU, 그리고 2X2 Max Pooling, 그리고 2stride로 학습
  • Expanding path는 2X2 컨볼루션인데 feature channel을 대신 절반으로 줄이는 연산을 함
    • 다만 Expanding path는 Contracting path에서 학습한 feature map을 그대로 붙여서 사용함
  • 이전의 방식은 컨텍스트와 정밀한 영역간의 트레이드 오프가 있었으나, 이러한 방식으로 두마리 토끼를 동시에 잡음
  • 학습 데이터가 많지않은 의료 데이터 특성을 반영을 잘 했기 때문에 비교적 적은 데이터로도 학습이 가능.
패딩을 하는 과정. 자세히 보면, 이미지가 복사되었음을 알수있음.
  • 바운드에서 벗어나는 곳 경계선은 다른 부분을 그대로 복사하여 사진 가운데로 느끼게끔 보충
weight map을 통해 경계선에 대한 가중치를 줘서 구별이 더 잘되게 함,
  • 셀들을 골라내는 작업도 중요한 분야가 있기 때문에 이러한 경우에는 weight map으로 보정
    • 다만 병변범위가 구별될 필요는 없는경우 위와같은 과정이 필요없을 수 있음
  • 이미지를 나눠서 그리드별로 섞는 등의 적당한 데이터 어그멘테이션도 진행이 되었다고 언급. 마지막의 드랍아웃 레이어도 간접적인 어그멘테이션이 진행되었다고 하ㅓㄹ수있음
  • 논문과 대회를 우승한 시기는 2015년으로, 다소 연식이 된 편이며, Unet++등으로 발전
우승한 ISBI 2015의 경우, Intersecotion Over Union 기준 우승을 차지.
  • 논문 마지막에는 Nvidia Titan GPU (6G)로 단지(?) 10시간정도의 학습소요시간이 걸렸다고 언급.

답글 남기기