ML&DL/CV(14)
-
[Object Detection] Yolo를 이용한 실내 공간의 객체 검출
[실내 이미지 Object Detection] 실내 객체 10가지 클래스 검출 0: door 1: openedDoor 2: cabinetDoor 3: refrigeratorDoor 4: window 5: chai 6: table 7: cabinet 8: sofa/couch 9: pole 데이터셋 https://www.kaggle.com/datasets/thepbordin/indoor-object-detection Indoor Objects Detection Indoor objects dataset for YOLOv5 format www.kaggle.com - 데이터셋 구조 INDOOR ├─train │ ├─images │ └─labels ├─valid │ ├─images │ └─labels ├─test ..
2023.11.21 -
[Computer Vision] Object Detection (객체 검출)
1. Object Detection - 이미지나 비디오 내에서 특정 객체를 식별하는 것 1) 객체가 무엇인지? 2) 객체가 어디 위치에 있는지? 2. One-stage / Two-stage 1)One-stage - 영역 제안 (Region Proposal) + Classification이 동시에 진행 - 투 스테이지 방식보다 속도가 빠름 - 앵커 박스(Anchor Boxes) 사용 : 사전에 크기와 비율이 모두 결정되어있음 2)Two-stage - 이미지 안에서 객체가 있을 법한 영역(ROI)를 바운딩 박스로 대략적으로 찾음 => 영역 제안(Region Proposal) - 이후에 후보 영역을 Classification 진행하여 객체 검출 - 원 스테이지 보다 시간이 오래 소요되지만, 좋은 성능을 낸다..
2023.11.21 -
[Multi-Class Classification] 재활용 쓰레기 분리수거 모델
[분리수거 Multi-Class Classification] * glass / paper / cardboard/ plastic / metal /trash - 6개의 클래스로 Multi-Class 분류 해보기 - trash 는 나머지 5개의 클래스에 들어가지 않는 기타 클래스를 의미함 ├─garbage │ └─raw │ ├─glass : 501 files │ ├─paper : 594 files │ ├─cardboard : 403 files │ ├─plastic : 482 files │ ├─metal : 410 files │ └─trash : 137 files * 데이터셋 - 총 2527 장의 데이터 https://www.kaggle.com/datasets/asdasdasasdas/garbage-class..
2023.11.21 -
[Computer Vision] Classification
1. 컴퓨터 비전의 Classification - 기계 학습을 통해 특성을 기반으로 입력 데이터를 여러 범주 또는 클래스 중 하나로 할당하는 것 1) Binary ex) 스팸 O or 스팸 X / 질병 O vs 질병 X 2) Multi-class ex) 필기 숫자 인식(0-9), 뉴스 기사 주제 분류 (정치, 스포츠, 기술) 3) Multi-Label ex) 이미지 내의 다수 객체를 분류 2. Classification 성능 평가 지표 1) Accuracy - 모델이 전체 예측 중 올바르게 예측한 비율 - 0 ~ 1 사이의 값을 가지고 1에 가까울수록 좋음 2) Precision - 모델이 positive라고 예측한 것들 중에서 실제로 정답이 positive인 비율 - 0 ~ 1 사이의 값을 가지고 1..
2023.11.21 -
[Computer Vision] 컴퓨터 비전의 데이터
Annotation (=Data labeling) - 어노테이션(주석)은 데이터에 추가 정보를 더 해주는 것을 말한다. - 학습용 데이터를 구축하기 위한 과정 ex) 컴퓨터 비전에서는 이미지의 특정 개체의 존재, 위치, 색상, 크기, 모양 등을 나타내는 레이블을 포함할 수 있음 - 인공지능 모델의 성능에 크게 영향을 준다. Annotation 종류 1) Bounding Box - 이미지 내의 객체의 범위를 박스로 지정해 주는 간단한 라벨링 방법 - 주로 object detection 에 사용 - 박스를 지정할 때는 여백을 최소화해야함 2) polygon - 바운딩 박스보다 정교하다 => 여백이 생기지 않는다 - 영역 외곽선을 따라 점을 찍어 그리는 라벨링 방법 3) point - 이미지의 객체에 점을 찍..
2023.11.21 -
[Computer Vision] CNN (Convolutional Neural Network)
1. 합성곱 신경망 (CNN, Convolutional Neural Network) - 주로 이미지 인식 및 처리에 많이 사용되는 알고리즘 - 합성곱 계층(Convolution Layer)와 풀링 계층(Pooling Layer)로 이루어져있음 - 공간적인 위치 정보를 유지하여 위치별 특징을 추출함 - 합성곱 계층은 이미지 특징을 찾아내어 새로운 feature map을 생성하고 풀링 계층은 feature map 의 사이즈를 축소하는 역할을 함 2. 채널(Channel) - 영상 처리에서 이미지는 3차원 텐서를 가짐 (높이, 너비, 채널) -> 높이 : 이미지 세로 방향 픽셀 수 , 너비 : 이미지 가로 방향 픽셀 수, 채널 : 색성분 - 흑백 이미지라면 채널 수가 1이고, RGB로 이루어진 컬러 이미..
2023.11.09