Smooth Grad-CAM++ 내용 정리 [XAI-4]

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

iMTE

Smooth Grad-CAM++ 내용 정리 [XAI-4] 본문

Deep learning study/Explainable AI, 설명가능한 AI

Smooth Grad-CAM++ 내용 정리 [XAI-4]

Wonju Seo 2021. 4. 14. 17:12

논문 제목 : Smooth Grad-CAM++: An Enhanced Inference Level Visualization Technique for Deep Convolutional Neural Network Models

논문 주소 : arxiv.org/abs/1908.01224

Smooth Grad-CAM++: An Enhanced Inference Level Visualization Technique for Deep Convolutional Neural Network Models

Gaining insight into how deep convolutional neural network models perform image classification and how to explain their outputs have been a concern to computer vision researchers and decision makers. These deep models are often referred to as black box due

arxiv.org

주요 내용:

1) 저자는 Grad-CAM++에 SmoothGrad를 적용시킨 Smooth Grad-CAM++을 제안하였다. 이는 기존 Grad-CAM++ 대비, object localizaiton과 multiple occurrences의 CAM 생성에 좋은 성능을 보여준다. 또한, feature map에 따른 CAM 형성 및 neuron level에서의 CAM 형성도 가능한 것이 이 논문의 contribution이다.

2) Grad-CAM에서는 k 번째 feature map의 중요도는 다음과 같이 gradients에 global-averaged-pooling 을 사용하여 계산된다.

$Wck=1Z∑i∑j∂Yc∂Akij<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msubsup><mi>W</mi><mi>k</mi><mi>c</mi></msubsup><mo>=</mo><mfrac><mn>1</mn><mi>Z</mi></mfrac><munder><mo data-mjx-texclass="OP">∑</mo><mi>i</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>j</mi></munder><mfrac><mrow><mi>∂</mi><msup><mi>Y</mi><mi>c</mi></msup></mrow><mrow><mi>∂</mi><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mi>k</mi></msubsup></mrow></mfrac></math>$

앞서 계산된 importance는 해당하는 feature map에 곱해지고, ReLU를 거쳐 최종 CAM이 형성된다.

$L c G r a d - C A M = R e L U (\sum k W c k A k) <math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msubsup><mi>L</mi><mrow data-mjx-texclass="ORD"><mi>G</mi><mi>r</mi><mi>a</mi><mi>d</mi><mo>-</mo><mi>C</mi><mi>A</mi><mi>M</mi></mrow><mrow data-mjx-texclass="ORD"><mi>c</mi></mrow></msubsup><mo>=</mo><mi>R</mi><mi>e</mi><mi>L</mi><mi>U</mi><mo stretchy="false">(</mo><munder><mo data-mjx-texclass="OP">\sum</mo><mi>k</mi></munder><msubsup><mi>W</mi><mi>k</mi><mi>c</mi></msubsup><msup><mi>A</mi><mi>k</mi></msup><mo stretchy="false">)</mo></math>$

Grad-CAM++ 에서는 global-averaged-pooling 대신에 positive partial derivative에 weighted sum을 하여 CAM을 형성한다.

$Wck=∑i∑jαkcijReLU(∂Yc∂Akij)<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msubsup><mi>W</mi><mi>k</mi><mi>c</mi></msubsup><mo>=</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>i</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>j</mi></munder><msubsup><mi>α</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mrow data-mjx-texclass="ORD"><mi>k</mi><mi>c</mi></mrow></msubsup><mi>R</mi><mi>e</mi><mi>L</mi><mi>U</mi><mo stretchy="false">(</mo><mfrac><mrow><mi>∂</mi><msup><mi>Y</mi><mi>c</mi></msup></mrow><mrow><mi>∂</mi><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mi>k</mi></msubsup></mrow></mfrac><mo stretchy="false">)</mo></math>$

위 식에서 $\alpha_{ij}^{kc}$ 는 target class c에 대한 k 번째 activation map $A^k$ 의 location (i,j)의 중요도를 가리킨다.

Target class c에 대한 class score Y는 다음과 같이 나타낸다.

$Yc=∑k[∑i∑j[∑a∑bαkcabReLU(∂Yc∂Akab)]Akij]<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msup><mi>Y</mi><mi>c</mi></msup><mo>=</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>k</mi></munder><mo stretchy="false">[</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>i</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>j</mi></munder><mo stretchy="false">[</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>a</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>b</mi></munder><msubsup><mi>α</mi><mrow data-mjx-texclass="ORD"><mi>a</mi><mi>b</mi></mrow><mrow data-mjx-texclass="ORD"><mi>k</mi><mi>c</mi></mrow></msubsup><mi>R</mi><mi>e</mi><mi>L</mi><mi>U</mi><mo stretchy="false">(</mo><mfrac><mrow><mi>∂</mi><msup><mi>Y</mi><mi>c</mi></msup></mrow><mrow><mi>∂</mi><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>a</mi><mi>b</mi></mrow><mi>k</mi></msubsup></mrow></mfrac><mo stretchy="false">)</mo><mo stretchy="false">]</mo><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mi>k</mi></msubsup><mo stretchy="false">]</mo></math>$

이전의 Grad-CAM++ 내용 정리에서 $\alpha_{ij}^{kc}$ 는 다음과 같이 정리되는 것을 확인하였다.

$αkcij=∂2Yc(∂Akij)22∂2Yc(∂Akij)2+∑a∑bAkab∂3Yc(∂Akij)3<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msubsup><mi>α</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mrow data-mjx-texclass="ORD"><mi>k</mi><mi>c</mi></mrow></msubsup><mo>=</mo><mfrac><mfrac><mrow><msup><mi>∂</mi><mn>2</mn></msup><msup><mi>Y</mi><mi>c</mi></msup></mrow><mrow><mo stretchy="false">(</mo><mi>∂</mi><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mi>k</mi></msubsup><msup><mo stretchy="false">)</mo><mn>2</mn></msup></mrow></mfrac><mrow><mn>2</mn><mfrac><mrow><msup><mi>∂</mi><mn>2</mn></msup><msup><mi>Y</mi><mi>c</mi></msup></mrow><mrow><mo stretchy="false">(</mo><mi>∂</mi><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mi>k</mi></msubsup><msup><mo stretchy="false">)</mo><mn>2</mn></msup></mrow></mfrac><mo>+</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>a</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>b</mi></munder><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>a</mi><mi>b</mi></mrow><mi>k</mi></msubsup><mfrac><mrow><msup><mi>∂</mi><mn>3</mn></msup><msup><mi>Y</mi><mi>c</mi></msup></mrow><mrow><mo stretchy="false">(</mo><mi>∂</mi><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mi>k</mi></msubsup><msup><mo stretchy="false">)</mo><mn>3</mn></msup></mrow></mfrac></mrow></mfrac></math>$

3) SmoothGrad는 input x의 주변에서 sample을 뽑아서 gradient-based sensitivity maps을 그리는 방법이다.

$Mc(x)=1nn∑1Mc(x+N(0,σ2))<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msub><mi>M</mi><mi>c</mi></msub><mo stretchy="false">(</mo><mi>x</mi><mo stretchy="false">)</mo><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>M</mi><mi>c</mi></msub><mo stretchy="false">(</mo><mi>x</mi><mo>+</mo><mi>N</mi><mo stretchy="false">(</mo><mn>0</mn><mo>,</mo><msup><mi>σ</mi><mn>2</mn></msup><mo stretchy="false">)</mo><mo stretchy="false">)</mo></math>$

이 방법은 좀 더 개선된 visualization map을 제공한다. 저자는 gradients의 계산에 이 방법을 사용하였다.

4) $D_1^k$ , $D_2^k$ , $D_3^k$ 를 k번째 feature map의 1차, 2차, 3차 미분의 값이라고 할 때, $\alpha_{ij}^{kc}$ 와 $W_k^c$ 는 다음 식으로 계산이 된다.

$αkcij=1n∑n1Dk121n∑n1Dk2+∑a∑bAkab1n∑n1Dk3<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msubsup><mi>α</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mrow data-mjx-texclass="ORD"><mi>k</mi><mi>c</mi></mrow></msubsup><mo>=</mo><mfrac><mrow><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo data-mjx-texclass="OP">∑</mo><mn>1</mn><mi>n</mi></munderover><msubsup><mi>D</mi><mn>1</mn><mi>k</mi></msubsup></mrow><mrow><mn>2</mn><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo data-mjx-texclass="OP">∑</mo><mn>1</mn><mi>n</mi></munderover><msubsup><mi>D</mi><mn>2</mn><mi>k</mi></msubsup><mo>+</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>a</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>b</mi></munder><msubsup><mi>A</mi><mrow data-mjx-texclass="ORD"><mi>a</mi><mi>b</mi></mrow><mi>k</mi></msubsup><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo data-mjx-texclass="OP">∑</mo><mn>1</mn><mi>n</mi></munderover><msubsup><mi>D</mi><mn>3</mn><mi>k</mi></msubsup></mrow></mfrac></math>$

$Wck=∑i∑jαkcijReLU(1nn∑1Dk1)<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><msubsup><mi>W</mi><mi>k</mi><mi>c</mi></msubsup><mo>=</mo><munder><mo data-mjx-texclass="OP">∑</mo><mi>i</mi></munder><munder><mo data-mjx-texclass="OP">∑</mo><mi>j</mi></munder><msubsup><mi>α</mi><mrow data-mjx-texclass="ORD"><mi>i</mi><mi>j</mi></mrow><mrow data-mjx-texclass="ORD"><mi>k</mi><mi>c</mi></mrow></msubsup><mi>R</mi><mi>e</mi><mi>L</mi><mi>U</mi><mo stretchy="false">(</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo data-mjx-texclass="OP">∑</mo><mn>1</mn><mi>n</mi></munderover><msubsup><mi>D</mi><mn>1</mn><mi>k</mi></msubsup><mo stretchy="false">)</mo></math>$

5) Grad-CAM, Grad-CAM++, SM-Grad-CAM++을 비교하면 다음과 같다.

위의 그림에서 알 수 있는 것 처럼, SM-Grad-CAM++가 좀 더 object localization이 잘 되어 있으며, multiple occurrences을 잘 반영하는 것으로 보인다.

6) 특정 feature map과 특정 neuron에 대한 CAM을 확인하면 다음과 같다.

Grad-CAM++에 비해서 성능이 좋은 것을 단순히 몇개의 그림만으로 확인하는 것은 어렵다고 생각된다. (CAM 생성에 실패한 것도 보여줘야 믿을 만 하지 않을까?) Grad-CAM++ 논문에서 사용한 것 처럼 다양한 데이터 셋에서의 성능을 계산하여 제안하는 알고리즘의 검증이 필요하다.

저작자표시

'Deep learning study > Explainable AI, 설명가능한 AI' 카테고리의 다른 글

Sanity checks for saliency maps, Equation sheets, [XAI-6 (1)] (0)	2021.04.20
SmoothGrad : removing noise by adding noise 내용 정리 [XAI-5] (0)	2021.04.15
Grad-CAM++ 내용 정리 [XAI-3] (0)	2021.04.09
CAM (Class activation mapping) 내용 정리 [XAI-2] (0)	2021.04.08
Grad-CAM (Gradient-weighted class activation mapping) 내용 정리 [XAI-1] (0)	2021.04.08

'Deep learning study/Explainable AI, 설명가능한 AI' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

iMTE

iMTE

Smooth Grad-CAM++ 내용 정리 [XAI-4] 본문

Smooth Grad-CAM++ 내용 정리 [XAI-4]

논문 제목 : Smooth Grad-CAM++: An Enhanced Inference Level Visualization Technique for Deep Convolutional Neural Network Models

논문 주소 : arxiv.org/abs/1908.01224

'Deep learning study > Explainable AI, 설명가능한 AI' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역