pandas csv 읽기/쓰기 인코딩 정리(read_csv, to_csv)
·
Programming
요약 pandas는 python에서 제공하는 데이터 처리, 분석에 사용되는 라이브러리다. csv, xls등 table 기반 데이터를 Dataframe이라는 자료구조로 가져와 다양한 조작을 할 수 있다. 최근에 회사 작업으로 table 기반 데이터를 조작해야 할 일이 있었는데 pandas의 함수 중 하나인 read_csv를 이용해 csv파일을 읽을 때 발생하는 한글 깨짐과, to_csv를 이용해 csv파일을 생성했을 때 Excel에서 한글이 깨지는 조건을 정리해봤다. 정말 단순한 옵션으로 했기 때문에 모든 경우에 통용되지 않겠지만, 원리를 이해할 겸... 소스 코드 # dict으로 테이블에 들어갈 데이터를 구성 # key값은 column 이름이, list에는 row 데이터가 들어간다. temp_dict =..