신이 되고 싶은 갓지이

5. Python 기초 - 엑셀 파일 통합 정리 본문

Python

5. Python 기초 - 엑셀 파일 통합 정리

갓지이 2024. 1. 15. 18:59

1. 자주 사용하는 옵션

- pd.read_excel('파일경로', 옵션1 = 값1, 옵션2 = 값2 ....)

 

<옵션 종류>

  • index_col : 컬럼인덱스번호 (몇번째 컬럼을 인덱스로 지정할 것인지 선택)
  • header : row인덱스번호 (몇번째 row 부터 표 데이터로 볼 것인지 선택)
  • thousands : 천 단위 기호 ','  사용 (xxx,xxx를 문자가 아닌 숫자로 인식)

 

 

2. 폴더에 있는 모든 파일을 불러와서 병합

참고로 현재 버전에서 dataFrame은 append 사용이 되지 않기 때문에 concat을 활용해야한다. 이에 대한 내용은 https://godji.tistory.com/59 의 2번을 통해 자세히 확인 할 수 있다. 

import os

# os.listdir()을 이용해 특정 경로, 파일에 있는 파일 리스트를 확인
dirpath = './rawfiles/'
files = os.listdir(dirpath)
files 

# 빈 데이터프레임 준비하기
raw = pd.DataFrame() 

# 파일 하나씩 불러들여 합치기
for file in os.listdir('./rawfiles'):
    fpath = './rawfiles/'+file
#    print(fpath) # 경로명 확인
    temp = pd.read_csv(fpath)
    raw = pd.concat([temp], ignore_index = True)
   
raw