-
Pandas로 2차원 데이터를 파일로 저장하기 – 가장 대중적인 CSV 파일 활용법pandas 2025. 1. 4. 08:21
Pandas는 데이터 분석에서 가장 널리 사용되는 Python 라이브러리 중 하나로, **데이터프레임(DataFrame)**을 이용해 2차원 데이터를 손쉽게 다룰 수 있습니다. 그러나 단순히 데이터를 화면에 출력하거나 조작하는 데 그치지 않고, 데이터를 다양한 파일 형식으로 저장하여 공유하거나 재사용하는 데에도 활용할 수 있다는 사실, 알고 계셨나요?
그중에서도 가장 대중적이고 흔히 쓰이는 파일 형식이 바로 **CSV(Comma-Separated Values)**입니다. 이번 포스팅에서는 Pandas의 to_csv 메서드를 활용하여 데이터를 CSV 파일로 저장하는 방법과 몇 가지 팁을 소개하겠습니다.
import pandas as pd # 샘플 데이터 생성 data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } # 데이터프레임 생성 df = pd.DataFrame(data) # 데이터 출력 print(df) # CSV 파일로 저장 df.to_csv('output.csv', index=False) # index=False는 행 번호 제외 print("CSV 파일 저장 완료!")
. to_csv의 유용한 옵션들
Pandas의 to_csv는 단순한 저장뿐 아니라 다양한 설정 옵션을 제공하여 데이터의 형태를 원하는 대로 조정할 수 있습니다.
(1) 구분자 변경하기
CSV 파일의 기본 구분자는 쉼표(,)지만, 다른 구분자를 사용해야 할 때는 sep 옵션을 활용하세요
df.to_csv('output_tab_separated.csv', sep='\t', index=False) # 탭 구분자로 저장
(2) 특정 열만 저장하기
모든 열을 저장할 필요가 없다면 columns 옵션으로 저장할 열을 선택할 수 있습니다
df.to_csv('output_selected_columns.csv', columns=['Name', 'City'], index=False)
(3) 인코딩 지정하기
한국어와 같은 비영어권 데이터를 다룰 때는 encoding 옵션을 추가하는 것이 중요합니다
df.to_csv('output_utf8.csv', encoding='utf-8', index=False) df.to_csv('output_euckr.csv', encoding='euc-kr', index=False) # 한글 윈도우 환경에 적합
3. CSV 대신 문자열로 반환하기
파일로 저장하지 않고, CSV 데이터를 문자열로 얻고 싶을 때는 파일 경로를 지정하지 않으면 됩니다
csv_string = df.to_csv(index=False) print(csv_string)
4. CSV 이외의 파일 형식으로 저장하기
Pandas는 CSV 외에도 Excel(.xlsx), JSON(.json), SQL 등 다양한 형식으로 데이터를 저장할 수 있습니다. 다음은 Excel 파일로 저장하는 간단한 예시입니다
df.to_excel('output.xlsx', index=False, sheet_name='Sheet1')
'pandas' 카테고리의 다른 글
시각화의 매력적인 시각화 - seaborn (1) 2025.01.05 python의 가장 대중적인 시각화 (1) 2025.01.05 pandas 데이터 합치기 merge , concat (0) 2025.01.03 AI 주가 예측 전략 (2) 2024.12.21 기술적 지표 (1) 2024.12.19