Programming/혼공분석 9기.py

데이터 분석 1주차

hyuckee 2023. 1. 2. 22:25
반응형

데이터 분석은 쉽지 않은 작업이다.

 

양질의 데이터를 마련할 수 있어야 하고

데이터를 정제해서 사용하기 편하게 만들어야 하고

데이터 속에서 분석할 요소를 찾아야 하고

투명하고 합리적인 방법으로 분석해서

이해하기 쉽게 시각화해서 결론을 도출해야 하기 때문이다.

 

그래서 크롤링부터, 데이터베이스(sql), 통계학 등등

꽤 넓은 지식이 필요하다..

(아는 만큼 보이기에 많이 알수록 더 다양하고 명확한 분석이 가능하다)

 

이젠 국민 프로그램이 된 파이썬으로

데이터 분석이라니

기대된당^^

 

선택 미션

'혼공 학습단 8기'에서 썼던 구글 코랩

다시 쓰니까 좋다

 

뭘 깔아야 할 필요도 없고

메모리, 디스크 사용량도 볼 수 있고

셀 단위로 실행 가능해서 편리 그 잡채


기본 미션 #4

판다스 read_csv() 함수는 말 그대로 csv 파일을 읽을 때 사용된다.

파일을 읽을 때는 encoding 방식이 중요하기에 매개변수를 통해 특별히 지정할 수 있다.

(답: 3번)

 

(low_memory=False 매개변수를 사용하면, 파일을 한 번에 읽음으로써 데이터 타입 변동으로 인한 경고는 발생하지 않지만, 메모리를 많이 사용한다. 이를 대신해 dtype={ '열 이름' : 타입명} 매개변수로 미리 데이터 타입을 지정하는 방식도 있다.)

 

728x90