ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Pandas로 2차원 데이터를 파일로 저장하기 – 가장 대중적인 CSV 파일 활용법
    pandas 2025. 1. 4. 08:21

    Pandas는 데이터 분석에서 가장 널리 사용되는 Python 라이브러리 중 하나로, **데이터프레임(DataFrame)**을 이용해 2차원 데이터를 손쉽게 다룰 수 있습니다. 그러나 단순히 데이터를 화면에 출력하거나 조작하는 데 그치지 않고, 데이터를 다양한 파일 형식으로 저장하여 공유하거나 재사용하는 데에도 활용할 수 있다는 사실, 알고 계셨나요? 

     

    그중에서도 가장 대중적이고 흔히 쓰이는 파일 형식이 바로 **CSV(Comma-Separated Values)**입니다. 이번 포스팅에서는 Pandas의 to_csv 메서드를 활용하여 데이터를 CSV 파일로 저장하는 방법과 몇 가지 팁을 소개하겠습니다.

     

    import pandas as pd
    
    # 샘플 데이터 생성
    data = {
        'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'City': ['New York', 'Los Angeles', 'Chicago']
    }
    
    # 데이터프레임 생성
    df = pd.DataFrame(data)
    
    # 데이터 출력
    print(df)
    
    # CSV 파일로 저장
    df.to_csv('output.csv', index=False)  # index=False는 행 번호 제외
    print("CSV 파일 저장 완료!")

     

     

    . to_csv의 유용한 옵션들

    Pandas의 to_csv는 단순한 저장뿐 아니라 다양한 설정 옵션을 제공하여 데이터의 형태를 원하는 대로 조정할 수 있습니다.

    (1) 구분자 변경하기

    CSV 파일의 기본 구분자는 쉼표(,)지만, 다른 구분자를 사용해야 할 때는 sep 옵션을 활용하세요

    df.to_csv('output_tab_separated.csv', sep='\t', index=False)  # 탭 구분자로 저장

     

    (2) 특정 열만 저장하기

    모든 열을 저장할 필요가 없다면 columns 옵션으로 저장할 열을 선택할 수 있습니다

    df.to_csv('output_selected_columns.csv', columns=['Name', 'City'], index=False)

     

    (3) 인코딩 지정하기

    한국어와 같은 비영어권 데이터를 다룰 때는 encoding 옵션을 추가하는 것이 중요합니다

    df.to_csv('output_utf8.csv', encoding='utf-8', index=False)
    df.to_csv('output_euckr.csv', encoding='euc-kr', index=False)  # 한글 윈도우 환경에 적합

     

     


    3. CSV 대신 문자열로 반환하기

    파일로 저장하지 않고, CSV 데이터를 문자열로 얻고 싶을 때는 파일 경로를 지정하지 않으면 됩니다

    csv_string = df.to_csv(index=False)
    print(csv_string)

     

    4. CSV 이외의 파일 형식으로 저장하기

    Pandas는 CSV 외에도 Excel(.xlsx), JSON(.json), SQL 등 다양한 형식으로 데이터를 저장할 수 있습니다. 다음은 Excel 파일로 저장하는 간단한 예시입니다

    df.to_excel('output.xlsx', index=False, sheet_name='Sheet1')

    'pandas' 카테고리의 다른 글

    시각화의 매력적인 시각화 - seaborn  (1) 2025.01.05
    python의 가장 대중적인 시각화  (1) 2025.01.05
    pandas 데이터 합치기 merge , concat  (0) 2025.01.03
    AI 주가 예측 전략  (2) 2024.12.21
    기술적 지표  (1) 2024.12.19
Designed by Tistory.