pandas

시각화의 매력적인 시각화 - seaborn

gggg21 2025. 1. 5. 09:36

plt의 한글폰트 지원하게 하기

import matplotlib.pyplot as plt
from matplotlib import rc

# 한글 폰트 설정 (나눔고딕)
plt.rc('font', family='NanumGothic')  # 또는 'Malgun Gothic' (Windows)

# 음수 기호 깨짐 방지
plt.rcParams['axes.unicode_minus'] = False

# 데이터
labels = ['삼성전자', 'SK하이닉스', 'LG전자', '네이버', '카카오']
ratio = [50, 20, 10, 10, 10]

# 파이 차트
plt.pie(ratio, labels=labels, shadow=True, startangle=90)
plt.title('기업별 비율')
plt.show()

 

원 그래프 그리는 방법

labels = ['삼성전자', 'SK하이닉스', 'LG전자', '네이버', '카카오']
ratio = [50, 20, 10, 10, 10]

# 파이 차트 생성
plt.pie(ratio, labels=labels, shadow=True, startangle=90)

# 그래프 표시
plt.show()

 

seaborn 차트 그리기

seaborn의 전용 데이터

== seaborn을 이용하여 데이터를 시각화 시켜보라고 따로 준비시켜준 data를 가져오도록 해줍니다

 

tip = sns.load_dataser('tip')

tips.tail()

tips.describe() == 데이터 전처리를 간단하게 한 것을 말합니다


주로 목표를 가진다면 이는 회귀선을 구해서 정해주는 것이 옳씁니다

회귀선의 가장 기초적인 공식은 y = ax + b이며

 

여기서:

  • : 종속 변수 (예측하려는 값)
  • : 독립 변수 (설명 변수)
  • : 기울기 (slope, 회귀 계수)
  • : 절편 (intercept)

로 계산됩니다.

 


기초적인 선형 회귀의 이해

  1. 목적:
    • 데이터를 이용해 aabb 값을 추정하여, 주어진 xx에 대해 yy를 예측하는 것이 목표입니다.
  2. 회귀 계수 계산:
    • 기울기 (aa)와 절편 (bb)는 보통 **최소 제곱법(OLS, Ordinary Least Squares)**을 사용하여 추정합니다.
    • 최소 제곱법: 데이터와 회귀선 간의 오차(잔차, residual)의 제곱 합을 최소화하는 방법.
  3. 잔차(residual):
    • 잔차 = y실제값 - y예측