본문 바로가기

코딩스쿨/마케터를 위한 데이터 분석

#8. 파이썬 데이터프레임의 인덱스 제거하기 (판다스)

창업에 도전해서 새로운 세대를 위한 콘텐츠 큐레이션 플랫폼을 만들고 있습니다!

관심 분야에 대한 최신 트렌드를 가장 쉽고 빠르게 받아볼 수 있는 서비스에요. 많은 피드백 부탁드립니다. 🙏


https://oneoneone.kr


판다스 라이브러리를 활용하여 파이썬 데이터프레임의 인덱스 제거하기

 

01. 시작에 앞서

판다스로 데이터 분석을 진행하다 보면 A열에 숫자로 된 컬럼이 생기는 것을 보실 수 있을 거예요!

인덱스로 사용되는 해당 컬럼은 특정 데이터를 찾을 때 사용된답니다.

 

물론 우리에게 편의성을 제공하는 컬럼이기는 하지만,

분석을 진행하다보면 자동으로 생긴 인덱스 컬럼을 제거하고 싶을 때가 많은데요 😭

 

그래서 오늘은 데이터프레임의 인덱스를 제거하는 방법에 대해서 알아보려고 합니다 🔥

 

 

02. 인덱스를 제거할 데이터프레임 데이터 확인하기

인덱스를 제거하기 전에 우선 아래 실습 파일을 다운로드하여 주세요 😎

 

실습1.csv
0.00MB

 

해당 파일을 다운받았으면 안에 있는 데이터를 한번 같이 확인해볼까요?

데이터를 확인해보니 아래와 같이 날짜, 매체, 노출, 클릭, 비용 총 5개의 컬럼으로 구성되어 있네요 ✅

실습1.csv 파일 데이터

 

자, 이번에는 주피터노트북을 실행해서 실습1.csv 파일을 확인해볼 거예요!

이제 csv 파일 불러오는 건 너무 쉽죠? 다들 아시겠지만 아래처럼 코드를 작성하고 실행시켜주시면 돼요 👍

# 판다스 라이브러리 사용
import pandas as pd

# 실습1.csv 파일을 불러와서 file1로 저장
file1 = pd.read_csv('실습1.csv')

 

'file1' 이라는 변수에 '실습1.csv' 파일을 저장해주고 데이터를 확인해보면...

어랏? 날짜 컬럼 앞에 갑자기 숫자가 생겼네요? 😅

file1 확인

 

이 상태에서 그대로 엑셀 파일로 내보내기를 진행하면 어떻게 될까요?

아래 코드를 실행시켜서 'file1' 을 '실습1_수정.xlsx' 엑셀 파일로 내보내볼게요! 🧐

# file1을 '실습1_수정.xlsx'파일로 내보내기
file1.to_excel('실습1_수정.xlsx')

 

그리고 '실습1_수정.xlsx' 엑셀 파일을 확인해보면!!

앗, 날짜 컬럼 앞에 숫자로 이뤄진 인덱스 컬럼이 새롭게 추가된 것을 볼 수 있어요 😅

 

이처럼 판다스에서는 인덱스를 별도로 지정하지 않으면 자동으로 숫자로 된 인덱스 컬럼이 생기는 것을 기본 설정으로 가져가고 있는데요,

이렇게 만들어진 인덱스 컬럼을 제거해야 하는 경우가 심심치 않게 발생한답니다 😡

 

자, 이제 그럼 본격적으로 'file1' 에 있는 인덱스 컬럼을 제거해볼까요? 

 

 

데이터프레임의 인덱스 제거하기

사실 주피터 노트북에서 인덱스 컬럼을 완전히 제거하는 것을 불가해요 😭

다만 아래 코드를 통해 다른 컬럼으로 인덱스 컬럼을 대체하거나 숨길 수는 있는데요,

 

  • 인덱스 대체하기 : 데이터프레임.set_index("인덱스 컬럼으로 설정하고자 하는 컬럼명")
  • 인덱스 숨기기 : 데이터프레임.style.hide_index()
# 날짜 컬럼으로 인덱스 대체하기
file1.set_index("날짜")

# 인덱스 컬럼 숨기기
file1.style.hide_index()

set_index 함수 활용
hide_index 함수 활용

 

사실 굳이 위의 방식을 활용해서 인덱스를 대체하거나 숨기는 것은 일반적이지 않기에 추천하지 않고

그냥 가공된 데이터를 csv 파일이나 xlsx 파일로 내보내는 과정에서만 인덱스를 제거하는 방법을 주로 추천드려요 🙋‍♂️

 

정말 간단한데 to_csv 혹은 to_excel 함수를 사용하실 때 아래 코드처럼 'index=False' 만 추가하면 되거든요 👍

# file1을 인덱스 없이 '실습1_수정.xlsx'파일로 내보내기
file1.to_excel('실습1_수정.xlsx',index=False)

 

그럼 아래 화면처럼 인덱스 컬럼이 제거된 깔끔한 엑셀 파일을 확인하실 수 있을 거예요,

어떤가요? 참 쉽죠? 👏

실습1_수정.xlsx

 

오늘은 주피터 노트북에서 판다스 라이브러리를 활용하여 파이썬 데이터프레임의 인덱스를 제거해봤습니다.

그럼 다음 시간에 만나요 ✋✋

 

빠르게 보다는 꾸준하게, 결국 끝까지 남는 놈이 이긴다.