pandas
시각화의 매력적인 시각화 - seaborn
gggg21
2025. 1. 5. 09:36
plt의 한글폰트 지원하게 하기
import matplotlib.pyplot as plt
from matplotlib import rc
# 한글 폰트 설정 (나눔고딕)
plt.rc('font', family='NanumGothic') # 또는 'Malgun Gothic' (Windows)
# 음수 기호 깨짐 방지
plt.rcParams['axes.unicode_minus'] = False
# 데이터
labels = ['삼성전자', 'SK하이닉스', 'LG전자', '네이버', '카카오']
ratio = [50, 20, 10, 10, 10]
# 파이 차트
plt.pie(ratio, labels=labels, shadow=True, startangle=90)
plt.title('기업별 비율')
plt.show()
원 그래프 그리는 방법
labels = ['삼성전자', 'SK하이닉스', 'LG전자', '네이버', '카카오']
ratio = [50, 20, 10, 10, 10]
# 파이 차트 생성
plt.pie(ratio, labels=labels, shadow=True, startangle=90)
# 그래프 표시
plt.show()
seaborn 차트 그리기
seaborn의 전용 데이터
== seaborn을 이용하여 데이터를 시각화 시켜보라고 따로 준비시켜준 data를 가져오도록 해줍니다
tip = sns.load_dataser('tip')
tips.tail()
tips.describe() == 데이터 전처리를 간단하게 한 것을 말합니다
주로 목표를 가진다면 이는 회귀선을 구해서 정해주는 것이 옳씁니다
회귀선의 가장 기초적인 공식은 y = ax + b이며
여기서:
- : 종속 변수 (예측하려는 값)
- : 독립 변수 (설명 변수)
- : 기울기 (slope, 회귀 계수)
- : 절편 (intercept)
로 계산됩니다.
기초적인 선형 회귀의 이해
- 목적:
- 데이터를 이용해 aa와 bb 값을 추정하여, 주어진 xx에 대해 yy를 예측하는 것이 목표입니다.
- 회귀 계수 계산:
- 기울기 (aa)와 절편 (bb)는 보통 **최소 제곱법(OLS, Ordinary Least Squares)**을 사용하여 추정합니다.
- 최소 제곱법: 데이터와 회귀선 간의 오차(잔차, residual)의 제곱 합을 최소화하는 방법.
- 잔차(residual):
- 잔차 = y실제값 - y예측