본문 바로가기

인공지능

(4)
Feature Pyramid Networks for Object Detection 2017년 CVPR에 게재된 Feature Pyramid Networks for Object Detection의 abstract, introduction, conclusion 및 FPN의 구조를 번역한 글입니다. 논문을 단순히 직역하기보다는 학부생 고학년 수준에서 좀 더 수월하게 읽을 수 있도록 의역하였고, 설명되지 않은 몇 가지 개념에 대하여 가급적 부연설명을 덧붙이도록 노력했습니다. 시간 관계상 응용 및 실험 등은 생략한 점 양해 바랍니다. 1. Abstract Feature Pyramid Networks (FPN)는 다양한 크기의 오브젝트를 효율적으로 탐지하기 위해 고안된 방법이다. 예를 들어, 어떤 classifier를 통해 여러 종류의 사물(object)을 분류할 수 있게 되었다고 하자. 이를테.. 2024. 2. 9. 04:06
CIDEr-D와 METEOR CIDEr-D와 METEOR는 모델이 수행한 캡셔닝 또는 번역의 질을 평가하는데 사용되는 메트릭이다. CIDEr-D CIDEr의 단점을 보완한 지표가 CIDEr-D이다. 따라서 CIDEr-D를 이해하기 위해 먼저 CIDEr을 살펴보자. 1. CIDEr : Consensus-based Image Description Evaluation for Image Caption n-gram 우선 n-gram에 대한 개념을 확실하게 짚고 넘어갈 필요가 있다. I love cats. 2-gram은 "I love" 또는 "love cats"와 같은 연속된 두 단어로 이루어진 객체를 의미한다. 2-grams는 {"I love", "love cats"}이라는 문장에서 가능한 모든 2-gram이 모인 집합이다. 개념 CIDEr.. 2023. 10. 5. 20:49
MLP 모델의 Weight Initialization에 대한 이해 ※ 이 글은 사이토 고키 저, 『밑바닥부터 시작하는 딥러닝』의 6.2 단원을 더 깊이 해설한 글입니다. Weight Initialization은 몹시 중요하다. 인공지능 모델을 학습시키기 위해서는 패러미터, 특히 가중치(weight)들의 초깃값을 설정해 주어야 한다. 초깃값 설정의 중요성이야 굳이 길게 언급할 필요가 없을 것이다. 애초에 초깃값을 설정해 주지 않고 모델을 학습시키는 것은 불가능할뿐더러, 패러미터의 초깃값을 어떻게 설정하느냐에 따라 모델의 학습은 천차만별로 달라질 수 있다. 비유적으로 표현하자면 공수부대가 깊은 산속에 낙하하여 목적지를 찾아갈 때, 어느 지점에 착륙할 것인가를 결정하는 것과 같다. 다음 그림에서, 아주 약간만 초깃값이 달라져도 전혀 다른 좌표로 최적화되는 사례를 확인할 수 .. 2022. 7. 5. 03:47
Output units - Sigmoid Unit & Softmax Unit ※ Ian Goodfellow의 Deep Learning, Chapter 6의 일부를 정리한 내용입니다. ※ Logistic 함수는 sigmoid 함수의 한 종류이지만 이하의 서술에서 혼용되어 사용될 수 있습니다. 1. Output Units output units이란 다층 신경망에서 output layer를 구성하는 unit을 말한다. 2. Bernoulli 분포에 대한 Sigmoid Units $0$ 또는 $1$을 갖는 이진 변수 $y$가 있다고 하자. 다층 신경망 구조에서 $\boldsymbol {x}$가 입력으로 주어졌을 때, 이를 구분하여 $y={0, 1}$을 출력하도록 모델을 설계하는 것은 Bernoulli 분포 하에서 전형적인 classification 문제이다. 본 절은 이때 사용되는 ou.. 2022. 6. 22. 04:51