관리 메뉴

iMTE

UNET 본문

Deep learning/Keras

UNET

사용자 Wonju Seo 2018. 6. 10. 18:19

UNET


Convolutional neural network (CNN)에서 receptive field이 다양하면 성능이 향상된다는 결과가 있었다. 즉 filter의 size를 3x3 뿐만 아니라 5x5 7x7 11x11등 다양하게 사용하면 다양한 형태의 receptive field가 생성이 되고 이는 성능을 향상시킨다는 것이다. Google의 Inception network은 이점을 이해하고 하나의 inception안에 다양한 receptive field를 구현하였다.


UNET은 network 구조가 U 자 형태로 생긴 것으로 이름이 명명되었다.


UNET에 대한 이미지 검색결과


형태는 Autoencoder와 비슷한데 고차원 형태의 이미지를 저차원 형태의 이미지로 변경시켜주는 Encoder(Convolutional)이 있고 이 encoded된 이미지를 다시 원래 형태로 변경해주는 Decoder(Deconvolutional)이 존재한다. 여기서 신기한 건, Autoencoder는 단순히 encoder와 decoder단계를 통해서 학습을 했지만, UNET에서는 encoder에서 축약된 정보를 decoder에 concatenate해서 사용한다는 것이다. 이로인해서 Convolution의 Maxpooling과 이미지 축소에 의한 공간 정보를 얻을 수 있다는 점이 매우 큰 장점이자 이 구조의 아이디어이다.


오늘의 예제는 흑백 CIFAR10이미지를 color CIFAR10이미지로 변경시켜주는 것이다.



결과를 확인해보면 첫줄에 있는 그림은 흑백사진이고 세번째 줄에 있는 사진은 ground truth이다. 사이에있는 줄이 바로 흑백이미지에서 color를 추정한 네트워크그 결과이다. 색이 ground truth에 비해서 매우 선명한것은 아니지만, 흑백에 비하면 color 정보가 생겼다는 것이 매우 눈여겨볼 점이라고 생각한다.

'Deep learning > Keras' 카테고리의 다른 글

Facial Emotion Recognition with Keras  (0) 2018.07.13
Variational Auto-Encoder (VAE)  (0) 2018.07.11
UNET  (0) 2018.06.10
Generative Adversarial Networks  (0) 2018.06.10
Autoencoder (자기부호화)  (0) 2018.06.09
Recurrent Neural Network  (0) 2018.06.09
0 Comments
댓글쓰기 폼