관심있는 분야(3)
-
Object detection 3
Sementic Segmentation Segmentation은 픽셀단위로 사물을 쪼개는 것이다. downsampling과 upsampling을 이용하여 구할 수 있다. down sampling은 우리가 흔이 아는 max, mean pooling, stride를 이용한 conv등이 있다. up sampling 또한 여러가지 방법이 있다. 1) unpooling 2) bilinear interpolation RoI Align과 같은 방법이다. 3) Max Unpooling max pooling한 위치를 기억하여서 unpooling할때 그 위치에 수를 넣고 나머지는 0으로 처리하는 것이다. 따라서 이렇게 대칭적 구조로 만들어야 한다. 4) Transposed Convolution 이를 위해서 우선 일반적인 ..
2021.02.21 -
Object Detection 2
Fast R-CNN 기존의 R-CNN의 proposal 단계로 인해 굉장히 느린것을 보안하기 위하여 기존의 proposal단계와 Conv Net에 넣어서 돌리는 단계의 순서를 바꾸었다. 이것이 Fast R-CNN이다. 맨 처음 하는 ConvNet이 AlexNet에서 따지자면 convolution을 하는 자리이고 위에서 proposal된 부분을 cnn돌리는 부분이 fully connected부분이라고 할 수 있다. 따라서 계산량이 많은 부분을 딱 한번만 처리하기에 속도를 개선시킬 수 있었다. RoI Pool 여전히 proposal method를 이용하여 bounding box를 유추하는데 이번에는 original image가 아닌 ConvNet을 돌린 결과인 Image feature로 box를 옮겨야한다...
2021.02.21 -
Object Detection 1
1. Detecting Single Object 가장 기본적인 구조는 다음과 같다. 먼저 Transfer learning을 이용한다. 그다음 마지막 벡터를 이용해서 물체 classification과 box를 검사한다. 그리고 이 둘의 결과를 weighted sum하여서 loss값을 구한다. 하지만 이방식은 single object일때는 상관없지만 여러개의 object가 있다면 box coordinate를 하나하나 다 구해야 하기때문에 파라미터 수가 많아져서 계산이 불가능해진다. 따라서 Multiple object detection을 위해서 새로운 기법이 고안이 되었다. 2. R-CNN : Region-Based CNN 기본적인 구조는 우선 1) proposal method를 이용하여 RoI를 구하고 2)..
2021.02.20