분류 전체보기(71)
-
[Binary Classification] MRI 데이터셋을 사용한 뇌종양 음성/양성 모델
[뇌종양 판단 이진 분류 모델] 데이터셋 https://www.kaggle.com/datasets/masoudnickparvar/brain-tumor-mri-dataset Brain Tumor MRI Dataset A dataset for classify brain tumors www.kaggle.com - 신경교종(glioma) / 뇌수막종(meningioma ) / 뇌하수체종양(pituitary) / 종양 없음(no tumor) 4가지 클래스로 이루어진 뇌 MRI 데이터셋을 이용 - 본 문제에서는 3개의 종양 클래스를 묶어 (신경교종 + 뇌수막종 + 뇌하수체종양)=> 양성 뇌종양 종양 없음=> 음성 뇌종양 데이터셋 구조 tumor ├─Training │ ├─glioma : 1321 files │ ├─..
2023.11.22 -
[Object Detection] Yolo를 이용한 실내 공간의 객체 검출
[실내 이미지 Object Detection] 실내 객체 10가지 클래스 검출 0: door 1: openedDoor 2: cabinetDoor 3: refrigeratorDoor 4: window 5: chai 6: table 7: cabinet 8: sofa/couch 9: pole 데이터셋 https://www.kaggle.com/datasets/thepbordin/indoor-object-detection Indoor Objects Detection Indoor objects dataset for YOLOv5 format www.kaggle.com - 데이터셋 구조 INDOOR ├─train │ ├─images │ └─labels ├─valid │ ├─images │ └─labels ├─test ..
2023.11.21 -
[Computer Vision] Object Detection (객체 검출)
1. Object Detection - 이미지나 비디오 내에서 특정 객체를 식별하는 것 1) 객체가 무엇인지? 2) 객체가 어디 위치에 있는지? 2. One-stage / Two-stage 1)One-stage - 영역 제안 (Region Proposal) + Classification이 동시에 진행 - 투 스테이지 방식보다 속도가 빠름 - 앵커 박스(Anchor Boxes) 사용 : 사전에 크기와 비율이 모두 결정되어있음 2)Two-stage - 이미지 안에서 객체가 있을 법한 영역(ROI)를 바운딩 박스로 대략적으로 찾음 => 영역 제안(Region Proposal) - 이후에 후보 영역을 Classification 진행하여 객체 검출 - 원 스테이지 보다 시간이 오래 소요되지만, 좋은 성능을 낸다..
2023.11.21 -
[Multi-Class Classification] 재활용 쓰레기 분리수거 모델
[분리수거 Multi-Class Classification] * glass / paper / cardboard/ plastic / metal /trash - 6개의 클래스로 Multi-Class 분류 해보기 - trash 는 나머지 5개의 클래스에 들어가지 않는 기타 클래스를 의미함 ├─garbage │ └─raw │ ├─glass : 501 files │ ├─paper : 594 files │ ├─cardboard : 403 files │ ├─plastic : 482 files │ ├─metal : 410 files │ └─trash : 137 files * 데이터셋 - 총 2527 장의 데이터 https://www.kaggle.com/datasets/asdasdasasdas/garbage-class..
2023.11.21 -
[Computer Vision] Classification
1. 컴퓨터 비전의 Classification - 기계 학습을 통해 특성을 기반으로 입력 데이터를 여러 범주 또는 클래스 중 하나로 할당하는 것 1) Binary ex) 스팸 O or 스팸 X / 질병 O vs 질병 X 2) Multi-class ex) 필기 숫자 인식(0-9), 뉴스 기사 주제 분류 (정치, 스포츠, 기술) 3) Multi-Label ex) 이미지 내의 다수 객체를 분류 2. Classification 성능 평가 지표 1) Accuracy - 모델이 전체 예측 중 올바르게 예측한 비율 - 0 ~ 1 사이의 값을 가지고 1에 가까울수록 좋음 2) Precision - 모델이 positive라고 예측한 것들 중에서 실제로 정답이 positive인 비율 - 0 ~ 1 사이의 값을 가지고 1..
2023.11.21 -
[Computer Vision] 컴퓨터 비전의 데이터
Annotation (=Data labeling) - 어노테이션(주석)은 데이터에 추가 정보를 더 해주는 것을 말한다. - 학습용 데이터를 구축하기 위한 과정 ex) 컴퓨터 비전에서는 이미지의 특정 개체의 존재, 위치, 색상, 크기, 모양 등을 나타내는 레이블을 포함할 수 있음 - 인공지능 모델의 성능에 크게 영향을 준다. Annotation 종류 1) Bounding Box - 이미지 내의 객체의 범위를 박스로 지정해 주는 간단한 라벨링 방법 - 주로 object detection 에 사용 - 박스를 지정할 때는 여백을 최소화해야함 2) polygon - 바운딩 박스보다 정교하다 => 여백이 생기지 않는다 - 영역 외곽선을 따라 점을 찍어 그리는 라벨링 방법 3) point - 이미지의 객체에 점을 찍..
2023.11.21 -
[회귀] 삼성전자 주가 예측 모델 구현하기 (시계열 데이터)
[삼성전자 주가 예측 모델 구현하기] 데이터 FinanceDataReader를 활용한 주가 데이터셋 https://financedata.github.io/posts/finance-data-reader-users-guide.html FinanceDataReader 사용자 안내서 FinanceDataReader 사용자 안내서 financedata.github.io 데이터 컬럼 Open: 시가 High: 고가 Low: 저가 Close: 종가 Volume: 거래량 Change: 대비 💻 실습 * 라이브러리 import import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings ..
2023.11.19 -
[분류] 학생 데이터 분석 & 성적 등급 예측 모델
[ 학생의 정보 데이터로 성적 등급을 예측해보기] 데이터셋 출처 https://www.kaggle.com/aljarah/xAPI-Edu-Data Students' Academic Performance Dataset xAPI-Educational Mining Dataset www.kaggle.com 데이터 컬럼 gender: 학생의 성별 (M: 남성, F: 여성) NationaliTy: 학생의 국적 PlaceofBirth: 학생이 태어난 국가 StageID: 학생이 다니는 학교 (초,중,고) GradeID: 학생이 속한 성적 등급 SectionID: 학생이 속한 반 이름 Topic: 수강한 과목 Semester: 수강한 학기 (1학기/2학기) Relation: 주 보호자와 학생의 관계 raisedhands..
2023.11.19