본문 바로가기

코딩스쿨/마케터를 위한 데이터 분석

#5. 판다스로 엑셀 데이터 불러오기 (XLSX, CSV 파일)

창업에 도전해서 새로운 세대를 위한 콘텐츠 큐레이션 플랫폼을 만들고 있습니다!

관심 분야에 대한 최신 트렌드를 가장 쉽고 빠르게 받아볼 수 있는 서비스에요. 많은 피드백 부탁드립니다. 🙏


https://oneoneone.kr


판다스로 엑셀 데이터 불러오기 (XLSX, CSV 파일)

 

01. 시작에 앞서

우리는 개념을 차근차근 배우기보다는 바로 실무에서 적용할 수 있는 것들부터 바로 시작해볼 거예요.

개념도 당연히! 너무 중요하지만 개념을 익히다가 지쳐서 포기하는 분들을 너무도 많이 봤기에...

지금은 개인적으로 무조건 흥미가 먼저라고 생각해요.

 

하다 보면 개념에 대해서 궁금해지는 시점이 무조건 올 거예요.

그럼 그때 다시 앞으로 돌아가셔서 개념부터 익히시면 됩니다 👍

 

자, 다시 본론으로 들어와서 오늘은 주피터 노트북에서 판다스 라이브러리를 활용해 엑셀 데이터를 불러올 거예요.

우선 시작에 앞서 아래 실습 파일들을 다운로드해서 주피터 노트북 실습을 진행할 폴더에 넣어주세요 😎

 

 

실습1.csv
0.00MB
실습1.xlsx
0.01MB

 

그럼 이제 같이 주피터 노트북에서 엑셀 데이터를 불러와볼까요?

먼저 우리는 엑셀 데이터를 불러오기 위해서 판다스 라이브러리를 사용할 거예요.

 

 

02. 판다스 라이브러리 사용하기

사전에 판다스 라이브러리를 설치했다면 주피터 노트북에서 '나는 판다스 라이브러리를 사용할거야~' 라고 말만 해주면 돼요 ☺️

이 말을 코드로 하면 아래 코드와 같아요.

import pandas

 

위의 코드를 입력하고 'Shift + Enter'를 통해 실행시켜주시면 판다스 라이브러리 사용 준비는 끝이에요 👍

 

근데 여기서 하나 더 pandas를 좀 더 간편하게 사용할 수 있는 방법이 있습니다.

바로 'import pandas as pd'입니다. as를 통해서 pandas의 별명을 붙여주는 건데요 ✅

import pandas as pd

 

이렇게 코드를 작성하면 판다스를 사용하고 싶을 때 'pandas'라는 이름이 아닌 'pd'라는 별명으로도 부를 수 있게 됩니다.

별명은 말 그대로 별명이라서 원하시는 대로 붙여주시면 되는데 다만 일반적으로는 'pd'라는 별명을 많이 쓴다고 생각해주시면 돼요.

 

 

03. 판다스로 엑셀 데이터 불러오기

판다스 라이브러리에는 많은 도구들이 있는데 그중 엑셀 데이터를 쉽게 불러오고 저장할 수 있도록 만들어주는 도구도 있답니다.

바로 'read_csv'와 'read_excel'입니다. 아래 코드들을 통해 우리는 쉽고 간편하게 엑셀 데이터를 불러올 수 있어요 😃

 

참고로 앞에 붙는 'pd'는 'pandas'의 별명이고 판다스 라이브러리에서 도구를 가져와서 사용하겠다는 의미랍니다.

pd.read_csv('파일경로 + 파일명.csv')
pd.read_excel('파일경로 + 파일명.xlsx')

 

 

- 파일 경로 확인하기

 

파일 경로는 어떻게 확인할 수 있을까요?

 

맥을 사용하시면 해당 파일의 정보에서 위치를 복사하시면 되고

윈도우를 사용하시면 해당 파일이 위치한 폴더에서 좌측 상단의 경로 복사를 눌러주시면 됩니다.

저는 맥을 사용 중입니다

 

파일 경로를 찾으셨으면 아래 예시처럼 코드를 입력하고 실행해주세요.

CSV 파일과 XLSX 파일을 불러오는 방식은 거의 동일해서 CSV 파일로 실습을 진행해볼게요.

import pandas as pd

pd.read_csv('/Users/goodluck/Projects/jupyter notebook/실습1.csv')

 

코드를 실행시키면 아래와 같이 엑셀 데이터 불러오기가 완료됩니다.

 

신기하지 않나요?

 

오늘은 주피터 노트북에서 판다스로 엑셀 데이터 불러와봤습니다.

그럼 다음 시간에 만나요 ✋✋

 

배움은 우연히 얻어지는 것이 아니라
열성을 다해 갈구하고 부지런히 집중해야 얻을 수 있는 것이다.


- 애비게일 애덤스