[KT AIVLE(에이블 스쿨) 3기] 2주차 : Python 라이브러리 / 데이터 처리 / 데이터 분석 및 의미 찾기

2023. 2. 27. 12:33KT 에이블 스쿨


[2주차] Python 라이브러리 / 데이터 처리 / 데이터 분석 및 의미 찾기

2주차 강의일정


강의 내용

파이썬에서 데이터 다루기 위한 라이브러리 Numpy 와 Pandas를 배웠다. 우리가 분석할 수 있는 정보는 크게 범주형과 수치형으로 나눌 수 있다. 데이터 처리를 위한  데이터 프레임을 변경, 결합하기 위한 다양한 함수를 등을 배웠다. 

데이터의 시각화를 위한 라이브러리를 배웠고, 수 많은 데이터를 파악하는 방법은 시각화와 수치화가 있다. 두 방법 모두 다 어떻게 표현하든 요약된 정보이기 때문에 정보의 손실이 발생할 수 밖에 없다.

데이터를 처리하는 방법도 중요하지만 제일 중요한 것은 분석하는 것이다. 주어진 데이터에서 우리에게 필요한 것은 무엇인가를 잘 생각해봐야한다. 데이터의 분석에는 단변량 분석과 이변량 분석이 있다. 단변량 분석는 변수가 하나인 것을 분석하는 것 , 이변량 분석은 두 변수 사이의 관계를 분석하는 것이다. 변수가 숫자형인지 범주형인지에 따라서 시각화, 수치화에 사용하는 함수가 다르므로 데이터를 잘 파악해야한다 !


후기 

 

데이터 모델링 전에 중요한 것은 데이터셋을 잘 이해하고 있어야 하는  것이다 ! 사실 데이터를 이렇게 자세히 분석해야하는 지는 몰랐다. 그냥 주어진 데이터셋으로 모델링 하면 되는 거 아닌가~? 라는 생각을 했었다. 데이터 분석을 이렇게 자세하게 해보는 것은 처음이라 신기했고, 데이터를 잘 이해하기 위해서는 다양한 관점에서 생각을 해봐야한다는 것이다.  강사님이 실습의 방향을 제시해주셔서 어찌저찌 하고 있기는 한데 만약 데이터셋만 달랑 주어진다면 내 스스로 데이터를 다룰 수 있을지는 의문이다..