[KT AIVLE(에이블 스쿨) 3기] 6주차 : 미니 프로젝트 2차 / AI 모델 해석·평가

2023. 3. 17. 23:08KT 에이블 스쿨


[6주차] 미니 프로젝트 2차 / AI 모델 해석·평가

 다시 돌아온 미프 기간~  미니 프로젝트가 벌써 있나 했더만 다시보니 이때가 선녀였다. .. ..

다음 달은... 정말 지옥이다. .... 4월은 미니 프로젝트 기간이 무려 3주나 된다 !!!!


미니 프로젝트 2차


이번 미니 프로젝트도 두 가지 주제로 진행되었다.

  • 1일차: 미세먼지 예측 모델 만들기
  • 2일차 ~ 3일차 : 악성 사이트 탐지 모델 만들기

 

1일차 - 미세먼지 예측 모델 만들기

나는 모델 만드는 것에 집중할 줄 알았는데 또 데이터 전처리가 중요한 프로젝트였다!   

아마 앞으로 모든 프로젝트가 이러지 않을까? 정말로 데이터 마스터가 되어야겠다. .

 

그리고 이번에 제공해주신 미세먼지 데이터가 정말 날 것이라고 느껴졌다 ㅠ.ㅠ

정제가 하나도 되어 있지 않은. .. 어마어마한 결측치와 어마어마한 변수들과 ..

도대체 뭘 없애고 어떻게 채워야 할지 한참 고민하게 만드는 ..! 

아무튼 데이터 분석의 중요성을 또 한 번 깨닫게 된 프로젝트 였으며 다양한 데이터셋을 다뤄보고싶은 욕심이 생겼다.

1일차는 데이터 처리, 분석 & 머신러닝에서 배운 내용의 종합 실습 같은 느낌이었다. 

 

2일차~ 3일차 -  악성 사이트 탐지 모델 만들기

 오전에는 html 요소 추출이 진행됐다. 근데 배운 지 몇 주 지났다고 beautifulsoup이 가물가물 했다..

(나중에 복습하려고 들어갔는데 학습 기간이 끝나버렸다. 어쩐담🙃)

 

프로젝트는 다행히도 제공해주신 데이터셋으로 진행됐다.

그리고 이날 팀 단위로 경쟁했는데 Kaggle에서 진행됐다. 실시간으로 랭킹을 확인할 수 있었는데 좀 재밌었다! 

 

테스트 데이터를 가지고 모델 성능을 높여서 정확도가 얼마나 높은지 경쟁하는 것이었다. 

하이퍼 파라미터 튜닝 방법으로 GridSearch을 사용했는데 엄청 효과적이지는 않다는 것을 깨달았고~

그리고 랜덤 포레스트가 굿이라는 것을 깨달았다. (강사님피셜. 기본값으로 두어도 성능이 좋다고 한다! )

 

 

그리고 바보 같은 실수했는데 그걸 모르고 계속 계속 고생했다~ ~~ 

팀원님이 찾아주셨는데 아니었다면 지금까지도 원인을 모르고 있지 않았을까.. ? 

아무튼 마지막에 해결해서 다행이었다 😂😹

 

 

 


후기

저번 주에 딥러닝을 배워서 딥러닝 모델 짜는 건 줄 알았는데 데이터 처리 & 머신러닝 모델로 진행된 미프였다! 

우리 팀에  잘하시는 분이 많아서 순조롭게 진행되었다. 팀원 도움을 많이 받아서 정말 감사하다.

그리고 역시 교육장으로 가는 게 집중이 잘 된다. 그리고 막히는 거 있으면 바로바로 물어볼 수 있기도 하고!  

쉬는 시간에 눕진 못하지만 그만큼 열심히 할 수 있다 😏

그리고 kaggle을 처음 써봤는데 나는 너무너무 재밌었다. 다음에 다른 대회도 한번 도전해 보고 싶다~!

 

 

교육장