pandas

pandas의 시각화 - 차트

gggg21 2024. 11. 22. 08:39

Pandas와 Matplotlib은 데이터 분석과 시각화의 "한 몸"처럼 밀접하게 연관되어 있습니다.

이유:

  1. Pandas:
    •   주로 데이터 전처리분석에 사용됩니다. 데이터를 읽어오고, 정리하고, 필터링하고, 변환하는 등의 작업을 처리합니다.
    •   그러나 데이터 자체를 시각화할 수 있는 기능도 내장하고 있습니다. 그 기본 기능은 Matplotlib을 기반으로 하고 있습니다.
  2. Matplotlib:
    •   시각화를 담당하는 라이브러리로, Pandas로 정리된 데이터를 그래프차트 형태로 쉽게 시각화할 수 있게 해줍니다.
    •   Pandas의 plot() 메서드는 기본적으로 Matplotlib을 사용하여 차트를 그리기 때문에, 이 두 라이브러리는 함께 사용할 때 매우 효율적입니다.
import matplotlib.pyplot as plt

# 데이터 준비
countries = final_df_grouped['Country_Region']
confirmed_cases = final_df_grouped['Confirmed']

# 그래프 생성
plt.figure(figsize=(10, 5))
plt.bar(countries, confirmed_cases, color='skyblue')

# 그래프 설정
plt.xlabel('Country/Region', fontsize=15)
plt.ylabel('Confirmed Cases', fontsize=20)
plt.title('Top 10 Countries by Confirmed Cases', fontsize=14)
plt.xticks(rotation=45, fontsize=10)
plt.tight_layout()

# 그래프 출력
plt.show()

 

Pandas와 Matplotlib의 연계성:

  1. 데이터 분석 → 시각화 흐름을 한 번에 처리할 수 있어서 매우 효율적입니다.
  2. 데이터 전처리 후 시각화할 때 별도로 다른 시각화 라이브러리를 설치할 필요 없이 Matplotlib을 자동으로 사용할 수 있습니다.

요약:

  •   Pandas는 데이터를 다루고 정리하는 데 강력하고, Matplotlib은 데이터를 시각화하는 데 강력합니다.
  •   두 라이브러리는 함께 사용될 때 매우 시너지를 발휘합니다. Pandas로 데이터를 처리하고 Matplotlib으로 그 데이터를 시각화하는 방식으로 한 몸처럼 사용할 수 있습니다.