창업에 도전해서 새로운 세대를 위한 콘텐츠 큐레이션 플랫폼을 만들고 있습니다!
관심 분야에 대한 최신 트렌드를 가장 쉽고 빠르게 받아볼 수 있는 서비스에요. 많은 피드백 부탁드립니다. 🙏
판다스 라이브러리를 활용하여 파이썬 데이터프레임의 인덱스 제거하기
01. 시작에 앞서
판다스로 데이터 분석을 진행하다 보면 A열에 숫자로 된 컬럼이 생기는 것을 보실 수 있을 거예요!
인덱스로 사용되는 해당 컬럼은 특정 데이터를 찾을 때 사용된답니다.
물론 우리에게 편의성을 제공하는 컬럼이기는 하지만,
분석을 진행하다보면 자동으로 생긴 인덱스 컬럼을 제거하고 싶을 때가 많은데요 😭
그래서 오늘은 데이터프레임의 인덱스를 제거하는 방법에 대해서 알아보려고 합니다 🔥
02. 인덱스를 제거할 데이터프레임 데이터 확인하기
인덱스를 제거하기 전에 우선 아래 실습 파일을 다운로드하여 주세요 😎
해당 파일을 다운받았으면 안에 있는 데이터를 한번 같이 확인해볼까요?
데이터를 확인해보니 아래와 같이 날짜, 매체, 노출, 클릭, 비용 총 5개의 컬럼으로 구성되어 있네요 ✅
자, 이번에는 주피터노트북을 실행해서 실습1.csv 파일을 확인해볼 거예요!
이제 csv 파일 불러오는 건 너무 쉽죠? 다들 아시겠지만 아래처럼 코드를 작성하고 실행시켜주시면 돼요 👍
# 판다스 라이브러리 사용
import pandas as pd
# 실습1.csv 파일을 불러와서 file1로 저장
file1 = pd.read_csv('실습1.csv')
'file1' 이라는 변수에 '실습1.csv' 파일을 저장해주고 데이터를 확인해보면...
어랏? 날짜 컬럼 앞에 갑자기 숫자가 생겼네요? 😅
이 상태에서 그대로 엑셀 파일로 내보내기를 진행하면 어떻게 될까요?
아래 코드를 실행시켜서 'file1' 을 '실습1_수정.xlsx' 엑셀 파일로 내보내볼게요! 🧐
# file1을 '실습1_수정.xlsx'파일로 내보내기
file1.to_excel('실습1_수정.xlsx')
그리고 '실습1_수정.xlsx' 엑셀 파일을 확인해보면!!
앗, 날짜 컬럼 앞에 숫자로 이뤄진 인덱스 컬럼이 새롭게 추가된 것을 볼 수 있어요 😅
이처럼 판다스에서는 인덱스를 별도로 지정하지 않으면 자동으로 숫자로 된 인덱스 컬럼이 생기는 것을 기본 설정으로 가져가고 있는데요,
이렇게 만들어진 인덱스 컬럼을 제거해야 하는 경우가 심심치 않게 발생한답니다 😡
자, 이제 그럼 본격적으로 'file1' 에 있는 인덱스 컬럼을 제거해볼까요?
데이터프레임의 인덱스 제거하기
사실 주피터 노트북에서 인덱스 컬럼을 완전히 제거하는 것을 불가해요 😭
다만 아래 코드를 통해 다른 컬럼으로 인덱스 컬럼을 대체하거나 숨길 수는 있는데요,
- 인덱스 대체하기 : 데이터프레임.set_index("인덱스 컬럼으로 설정하고자 하는 컬럼명")
- 인덱스 숨기기 : 데이터프레임.style.hide_index()
# 날짜 컬럼으로 인덱스 대체하기
file1.set_index("날짜")
# 인덱스 컬럼 숨기기
file1.style.hide_index()
사실 굳이 위의 방식을 활용해서 인덱스를 대체하거나 숨기는 것은 일반적이지 않기에 추천하지 않고
그냥 가공된 데이터를 csv 파일이나 xlsx 파일로 내보내는 과정에서만 인덱스를 제거하는 방법을 주로 추천드려요 🙋♂️
정말 간단한데 to_csv 혹은 to_excel 함수를 사용하실 때 아래 코드처럼 'index=False' 만 추가하면 되거든요 👍
# file1을 인덱스 없이 '실습1_수정.xlsx'파일로 내보내기
file1.to_excel('실습1_수정.xlsx',index=False)
그럼 아래 화면처럼 인덱스 컬럼이 제거된 깔끔한 엑셀 파일을 확인하실 수 있을 거예요,
어떤가요? 참 쉽죠? 👏
오늘은 주피터 노트북에서 판다스 라이브러리를 활용하여 파이썬 데이터프레임의 인덱스를 제거해봤습니다.
그럼 다음 시간에 만나요 ✋✋
빠르게 보다는 꾸준하게, 결국 끝까지 남는 놈이 이긴다.
'코딩스쿨 > 마케터를 위한 데이터 분석' 카테고리의 다른 글
#7. 판다스로 데이터를 엑셀 파일로 내보내기 (XLSX, CSV 파일) (0) | 2021.05.22 |
---|---|
#6. concat 함수를 활용하여 엑셀 데이터 합치기 (판다스) (0) | 2021.04.16 |
#5. 판다스로 엑셀 데이터 불러오기 (XLSX, CSV 파일) (1) | 2021.03.25 |
#4. 주피터 노트북 판다스 라이브러리 설치하기 (파이썬) (0) | 2021.03.24 |
#3. 주피터 노트북(Jupyter notebook) 시작하기 (0) | 2021.03.22 |