pandas 데이터 이어붙이기

pandas

pandas 데이터 이어붙이기

gggg21 2024. 11. 20. 17:44

데이터 전처리는 보통 table안에 column을 확인하고 그에 값들을 가지고 데이터의 의미있는 value를 result하는 건데요.

pandas를 활용하는 이유는 방대한 data의 활용을 극대화하는 것의 큰 의미가 있기에 우리는 data의 변수들을 조절하여 값들을 도출하는 것이 가능해야 합니다.

여기서 가장 흔한 것은 여러 data의 column의 이름이 달라 벌어지는 것입니다.

그 밖에 여러 error의 대처를 해줄 수도 있어야하는데요.

두가지를 모두 해주는 기능이 있습니다.

try / except입니다.

try / except는 처음에 어떠한 기능들을 하다가 error가 있다면 except에 있는 다른 것을 시키는 기능들인데요.

이것을 column의 마지막 끝나면 바로 다음 그 부분을 이어서 하도록 만드는 것도 가능하지요

test = pd.read_csv(path + '01-22-2020.csv', encoding = 'utf-8-sig')
try:
	test = ['province_state', 'country', 'confirmed']
except: 
	test = ['province/state', 'country', 'confirmed']
	test.columns = ['province_state', 'country', 'confirmed']
    # province/state == province_state가능합니다.