- Ross Girshick, Region-based Convolutional Networks for Accurate Object Detection and Segmentation, 2015
- 최대한 그림을 분할 후, 이를 가까운 분할별로 통합하는 작업 (Selective Search)를 통해 ~2000개의 후보 Region을 산출
- 분할별 통합에는 shape, texture, color, size별로 유사도 계산
- 각각의 Region별로 CNN을 적용하여 feature 추출 후 멀티클래스 분류
- Bounding Box에는 회귀방법이, 최종 예측은 SVM(Support Vector Machine)방법 적용