pandas

CSV 포맷 이해와 파이썬으로 CSV파일 다루기

gggg21 2024. 11. 13. 17:59

csv는 엑셀에서도 지원되는 만큼 널리 사용되는 data양식이며 데이터를 가장 방대한 양을 가지는 파일 형식을 말합니다.

csv형식 ( 각 열은 , 로 구분, 각 행은 줄바꿈 문자로 구분 )

 

# CSV의 라이브러리가 있으니 이 파일의 형식이 CSV를 사용할 것임을 알리기만 하면 됩니다.

import CSV
data_file = open(' 경로 ', ' 모드선택 == r / w / bw / rw ', encoding = )
csv_reader = csv.reader(data_file)

data_file.close() // file을 다 사용한 다음 닫아야 과부하를 방지시킵니다.

#
with open('file.csv', mode='r', encoding='utf-8') as file:
    csv_reader = csv.reader(file)
   
 #하지만 이 많은 형식들을 한 번의 읽는 것이 가능하도록 pandas에서 지원을 해주는데요?
 """
 csv
 df = pd.read_csv('file.csv')
df.to_csv('output.csv', index=False)
 
 excel
 df = pd.read_excel('file.xlsx', sheet_name='Sheet1')  # sheet_name을 통해 시트 지정
df.to_excel('output.xlsx', index=False)

json
df = pd.read_json('file.json')
df.to_json('output.json', orient='records')
 
sql
 import sqlite3
conn = sqlite3.connect('database.db')
df = pd.read_sql('SELECT * FROM table_name', conn)
conn.close()

html
df = pd.read_html('https://example.com')
 등등 여러가지들을 지원하고 있으니 이 점을 유의해주시기 바랍니다.
 
 """