본문 바로가기

전체 글

(39)
Feature Pyramid Networks for Object Detection 2017년 CVPR에 게재된 Feature Pyramid Networks for Object Detection의 abstract, introduction, conclusion 및 FPN의 구조를 번역한 글입니다. 논문을 단순히 직역하기보다는 학부생 고학년 수준에서 좀 더 수월하게 읽을 수 있도록 의역하였고, 설명되지 않은 몇 가지 개념에 대하여 가급적 부연설명을 덧붙이도록 노력했습니다. 시간 관계상 응용 및 실험 등은 생략한 점 양해 바랍니다. 1. Abstract Feature Pyramid Networks (FPN)는 다양한 크기의 오브젝트를 효율적으로 탐지하기 위해 고안된 방법이다. 예를 들어, 어떤 classifier를 통해 여러 종류의 사물(object)을 분류할 수 있게 되었다고 하자. 이를테.. 2024. 2. 9. 04:06
CIDEr-D와 METEOR CIDEr-D와 METEOR는 모델이 수행한 캡셔닝 또는 번역의 질을 평가하는데 사용되는 메트릭이다. CIDEr-D CIDEr의 단점을 보완한 지표가 CIDEr-D이다. 따라서 CIDEr-D를 이해하기 위해 먼저 CIDEr을 살펴보자. 1. CIDEr : Consensus-based Image Description Evaluation for Image Caption n-gram 우선 n-gram에 대한 개념을 확실하게 짚고 넘어갈 필요가 있다. I love cats. 2-gram은 "I love" 또는 "love cats"와 같은 연속된 두 단어로 이루어진 객체를 의미한다. 2-grams는 {"I love", "love cats"}이라는 문장에서 가능한 모든 2-gram이 모인 집합이다. 개념 CIDEr.. 2023. 10. 5. 20:49
AWS 필수 키워드 9개 AWS란? Amazon Web Service. 웹 및 앱 서비스 제공자가 컴퓨팅 파워, 저장소, 데이터베이스 등 광범위한 서비스를 제공할 수 있도록 도와주는 아마존의 클라우드 컴퓨팅 서비스. AWS 필수 키워드 1. EC2 (Elastic Compute Cloud) Virtual machine을 제공하는 서비스. 이러한 virtual machine에서 서비스 제공자는 웹서비스, 애플리케이션, 데이터베이스 등을 호스팅하며 벡앤드 서버를 구동할 수 있다. 또한 서비스 제공자가 직접 하드웨어 및 운영체제를 선택할 수 있다. 이렇게 탄력적으로 제공된다는 점에서 elastic compute cloud라고 이름 붙여진 듯하다. 2. S3 (Simple Storage Service) 파일을 저장할 수 있는 저장소를 .. 2023. 10. 3. 10:15
여우와 거인 chatGPT를 사용해 짧은 우화를 만들어 보았습니다. chatGPT에게 여우, 거인, 그리고 재채기를 이용해서 동화를 만들어 달라고 부탁하였고, 그렇게 만든 초안을 바탕으로 새롭게 재창조한 동화입니다. 옛날 옛적에, 변덕스러운 숲의 녹색 가장자리에, 레이나드라는 여우가 살았습니다. 레이나드는 당신이 흔히 여우에게 기대하는 것처럼 교활한 성격은 아니었습니다. 오히려, 그는 특별한 재채기로 유명했습니다. 레이나드가 재채기를 할 때마다 마법 같은 일이 벌어지곤 했습니다. 꽃은 한겨울에 피어나고, 나무는 계절에 맞지 않는 열매를 맺으며, 심지어 날씨도 종종 경로를 바꾸곤 했습니다. 하지만 레이나드의 재채기는 그저 무작위적인 현상이 아니었습니다. 그것은 현명한 올빼미조차도 이해할 수 없는 독특한 규칙을 가지고 .. 2023. 7. 5. 22:47
컴퓨터과학에서 좌표계의 원점 일반적으로 수학에서 좌표계 원점은 좌측 하단에 위치하는 것으로 표기하는데 반해, 컴퓨터과학에서 좌표계 원점은 좌측 상단에 위치하는 것일까? 그 이유는 초기 컴퓨터의 모니터 설계에서 찾을 수 있다. 초기 CRT 모니터는 주로 글자를 표시하는 용도로 제작되었다. 따라서 왼쪽 위에서 오른쪽 아래로 영상을 창출하도록 제작된 것이다. 즉 다수의 문화권에서 글을 읽는 방식과 같은, 왼쪽 위에서 오른쪽 아래로 글을 읽는 문화가 그대로 좌표계 시스템에 투영되었다고 할 수 있다. 이러한 연휴로 왼쪽 위 코너가 좌표계의 원점이 되었다. 반면 수학에서 좌표계의 원점이 왼쪽 하단에 위치하는 것은 직관적으로 당연하다. '숫자'란 오른쪽으로 가면 커지고, 위로 가면 커진다고 대다수의 사람들이 생각하기 때문에, 왼쪽 아래가 원점이.. 2023. 6. 15. 12:06
파이썬 구글 이미지 웹 크롤링 코드 기존 구글에 돌아다니는 코드는 더이상 지원하지 않는 문법을 사용하여, 다소 업데이트된 코드로 작성함 인자로 검색어를 받아 크롬에서 구글 이미지를 통해 검색 후 저장 from selenium import webdriver from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By from selenium.webdriver.chrome.service import Service import time import urllib.request import os, sys def crawling(word: str).. 2023. 3. 6. 08:08
카드마술 프로그램 카드마술 프로그램 기본적인 정보이론 분야의 실습 프로그램. $N$ 개의 정보를 분류하기 위해서는 최대 $\log_{2}{N}$개의 질문이 필요하다는 간단하고 기초적인 엔트로피 개념을 적용한 실습인데, 마술이라는 거창한 타이틀이 달려있다. 모르고 봤으면 신기했을려나...? def trans_num(n: int, item: int) -> str: bin_str = bin(item)[2:] bin_str = '0' * (n - len(bin_str)) + bin_str return bin_str[::-1] def make_deck(n: int) -> list[list[int]]: deck = [[] for _ in range(n)] arr = [i for i in range(2**n)] for item in .. 2023. 3. 1. 13:13
Git 명령어 정리 1. 깃 환경 설정하기 $ git config --global user.name "이름" $ git config --global user.email "메일" 버전을 저장할 때 사용하는 사용자 정보를 설정 2. 리눅스 명령어 $ pwd 현재 경로 표시(print working directory) $ ls -a all 숨긴 파일 및 디렉터리 표시 -l long 상세 정보 표시 -r reverse 정렬 순서를 거꾸로 표시 -t time 정렬 순서를 시간순(내림차순)으로 표시 현재 디렉토리의 파일 및 폴더(/) 리스트를 출력 $ rm -r {디렉토리명} 디렉토리와 하위 디렉토리 및 파일을 모두 삭제 $ cat {파일명} 텍스트 파일의 내용 확인 3. 깃허브 버전 관리 명령어 $ git init 프로젝트 폴더 내.. 2023. 2. 22. 11:31