[Computer Vision] 컴퓨터 비전의 데이터

2023. 11. 21. 09:37ML&DL/CV

 

Annotation  (=Data labeling)

- 어노테이션(주석)은 데이터에 추가 정보를 더 해주는 것을 말한다.

- 학습용 데이터를 구축하기 위한 과정

ex) 컴퓨터 비전에서는 이미지의 특정 개체의 존재, 위치, 색상, 크기, 모양 등을 나타내는 레이블을 포함할 수 있음

- 인공지능 모델의 성능에 크게 영향을 준다.

 

Annotation 종류

1) Bounding Box

 

- 이미지 내의 객체의 범위를 박스로 지정해 주는 간단한 라벨링 방법

- 주로 object detection 에 사용

- 박스를 지정할 때는 여백을 최소화해야함

 

 

2) polygon

- 바운딩 박스보다 정교하다 => 여백이 생기지 않는다

- 영역 외곽선을 따라 점을 찍어 그리는 라벨링 방법

 

3) point

 

- 이미지의 객체에 점을 찍어 표기하는 법

- 찾으려고 하는 객체의 특징이 뚜렷한 경우에 효과적 ex) 안면 인식, 감정 분석

 

4) keypoint

- 폴리곤 + 포인트 

- 객체의 외곽을 따주고 포인트를 지정해줌

ex)  관절의 위치를 파악해 사람의 자세 추정에 효과적

 

 

 

 

5) Segmentation

- 이미지 내에서 객체간의 경계를 분류해줌 

 

 

Computer Vision Task

- image classfication

- Localization 

- Object Dectection

1) Classification (single object)

- 사진이 무엇인지 분류하는 것

ex) 고양이 사진이라면 고양이라고 분류

- 하나의 객체만 분류

2) classfication + Localization  (single object)

- 분류 + 위치 정보까지 알아내는 것

ex) 이미지에서 고양이가 어느 위치에 있는지 알려줌

- 하나의 객체만 분류

3) Object Detection (multiple objects)

- 분류 + 위치 정보까지 알아내는데 여러 객체를 분류해줌

ex) 고양이와 강아지가 섞여있는 사진에서 각각 누가 어디에 위치에 있는지 알려줌

4) Instance Segmentation  (multiple objecst)

- Object Detection는 대략적인 위치를 알려주는데  Instance Segmentation  는 객체들간의 경계선 까지 구분해줌

ex) 누끼따기

 

컴퓨터 비전의 Dataset

- 유명한 데이터셋 포맷

1) Pascal VOC

2) COCO

3) ImageNet

4) KITTI