ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 머신러닝의 지도학습 - 베이즈 정리 활용
    scikit-learn 2025. 2. 12. 15:34

    p( 원인 | 결과 ) = {  p( 결과 | 원인 ) * p( 원인 )  } / p( 결과 )

     

    응용 예시

    1. 의학 진단
      • P(질병∣검사 양성) = 검사가 양성일 때 실제로 질병이 있을 확률
      • P(검사 양성∣질병) = 질병이 있을 때 양성이 나올 확률 (민감도)
      • P(질병) = 특정 질병을 가진 사람의 비율 (사전 확률)
    2. 스팸 필터
      • P(스팸∣특정 단어) = 특정 단어가 포함된 이메일이 스팸일 확률
      • P(특정 단어∣스팸) = 스팸 메일에서 해당 단어가 나올 확률
      • P(특정 단어) = 모든 메일에서 해당 단어가 나올 확률
    # 베이즈 정리 적용: P(질병 | 검사 양성)
    P_disease = 0.01  # 질병이 있을 확률 (1%)
    P_positive_given_disease = 0.95  # 질병이 있을 때 검사 양성이 나올 확률 (민감도)
    P_positive_given_no_disease = 0.05  # 질병이 없을 때도 검사 양성이 나올 확률 (오탐)
    
    # 전체 검사 양성 확률: P(검사 양성)
    P_positive = (P_positive_given_disease * P_disease) + (P_positive_given_no_disease * (1 - P_disease))
    
    # 베이즈 정리 적용
    P_disease_given_positive = (P_positive_given_disease * P_disease) / P_positive
    
    print(f"검사 결과가 양성일 때 실제로 질병이 있을 확률: {P_disease_given_positive:.2%}")

     

    'scikit-learn' 카테고리의 다른 글

    머신러닝 - 분류 모델의 이해 -  (0) 2025.03.01
    scikit-learn_지도학습  (1) 2025.02.14
    Scikit-learn 주요 기능  (1) 2025.01.10
    scikit-learn 기능 구현  (0) 2025.01.09
    Classification - 분류  (0) 2025.01.09
Designed by Tistory.