Data Analysis 시작하기 1 (준비)
사용 언어: Python 3.7.9
운영 체제: Windows 11 Home 21H2
데이터 분석을 한 번 해보겠습니다.
시작하기에 앞서 분석을 위한 도구가 필요하겠죠? 분석 도구로 파이썬(Python)을 사용할 겁니다.
파이썬을 설치해 주세요. 버전은 3 버전을 추천드립니다.
운영 체제: Windows 11 Home 21H2
데이터 분석 시작하기 1 (준비)
데이터 분석을 한 번 해보겠습니다.
시작하기에 앞서 분석을 위한 도구가 필요하겠죠? 분석 도구로 파이썬(Python)을 사용할 겁니다.
파이썬을 설치해 주세요. 버전은 3 버전을 추천드립니다.
pip로 jupyterlab을 설치해 줍니다.
pip install jupyterlab
jupyterlab은 코드를 블럭 단위로 실행할 수 있는 프로그램입니다. .ipynb
형식의 파일을 읽고 쓸 수 있습니다.
실행 방법은 다음과 같습니다.
jupyter-lab
이런 식으로 나옵니다.
그리고 csv 데이터를 읽을 때 사용하는 pandas와 숫자 처리에 좋은 numpy를
pip로 설치해 줍니다.
pip install pandas numpy
필요한 패키지는 나중에 pip로 또 설치할 수 있으니 그때 설치하기로 하고,
얼추 다 설치한 것 같네요.
그럼, 이제 중요한 분석에 사용할 데이터를 준비해 봅시다.
데이터는 인터넷 검색을 통하시거나 Kaggle에서 찾을 수 있습니다.
적당한 데이터를 찾다 보니 재미있는 걸 찾았는데요. 서울의 모기 지수
데이터입니다.
여기에 있는 데이터로 해보겠습니다.
라이선스도 확인해 주고요.
CC0는 상업적이든 뭐든 자유롭게 이용 가능합니다.
데이터 영역에서 미리 보기도 가능합니다.
데이터 영역 Summary를 보면, 파일을 열어보지 않고도 자료의 형식을 볼 수
있습니다.
끝.
카테고리: Data Analysis
댓글
댓글 쓰기
궁금한 점은 댓글 달아주세요.
Comment if you have any questions.