728x90
반응형
You Only Look Once: Unified, Real-Time Object Detection (v1)
논문 출처 : https://arxiv.org/abs/1506.02640
■ 논문을 접한 계기
스터디를 준비하면서 인공지능 기술 분야 중 시각지능에 대한 관심이 점점 생겼습니다.
컴퓨터 비전 학문의 기술 동향을 찾아보니 이미지 detection(인식), tracking(추적) 알고리즘에 관한 내용이 있었고,
관련 논문으로 "실시간" 객체 탐지 알고리즘인 Yolo를 쉽게 발견할 수 있었습니다.
2015년~2020년 사이 총 5개 버전으로 출판되었고, 그 중 첫 번째 논문을 리뷰합니다.
■ YOLO 의 컨셉 요약
합성곱 신경망을 이용해 여러 bounding box와 class probability를 예측합니다.
- 객체 검출을 하나의 회귀문제로 재정의함 -> 빠른 속도로 실시간 처리 가능
- 단일 신경망으로 통합된 모델(Unified) 사용으로 얻은 장점 -> 주변정보도 함께 처리하기 때문에 BackGround Error가 Fast R-CNN에 비해 50% 감소
■ 용어 정리
- bounding box : 객체 위치를 알려주는 직사각형 박스
- class probability : 객체가 어떤 클래스에 해당하는지에 관한 확률
728x90
반응형
'논문 리뷰 > 컴퓨터 비전' 카테고리의 다른 글
[논문리뷰]딥러닝 기반 카메라 모델 판별 논문 리뷰 (2) | 2023.02.05 |
---|---|
[논문리뷰]Spatial Pyramid Pooling Network(SPPNet) (0) | 2022.04.17 |
[논문리뷰]AlexNet(클래스 분류) (0) | 2022.04.16 |
[논문리뷰] GoogLeNet(인셉션 모델) (0) | 2022.04.16 |