-
머신러닝의 지도학습 - 베이즈 정리 활용scikit-learn 2025. 2. 12. 15:34
p( 원인 | 결과 ) = { p( 결과 | 원인 ) * p( 원인 ) } / p( 결과 )
응용 예시
- 의학 진단
- P(질병∣검사 양성) = 검사가 양성일 때 실제로 질병이 있을 확률
- P(검사 양성∣질병) = 질병이 있을 때 양성이 나올 확률 (민감도)
- P(질병) = 특정 질병을 가진 사람의 비율 (사전 확률)
- 스팸 필터
- P(스팸∣특정 단어) = 특정 단어가 포함된 이메일이 스팸일 확률
- P(특정 단어∣스팸) = 스팸 메일에서 해당 단어가 나올 확률
- P(특정 단어) = 모든 메일에서 해당 단어가 나올 확률
# 베이즈 정리 적용: P(질병 | 검사 양성) P_disease = 0.01 # 질병이 있을 확률 (1%) P_positive_given_disease = 0.95 # 질병이 있을 때 검사 양성이 나올 확률 (민감도) P_positive_given_no_disease = 0.05 # 질병이 없을 때도 검사 양성이 나올 확률 (오탐) # 전체 검사 양성 확률: P(검사 양성) P_positive = (P_positive_given_disease * P_disease) + (P_positive_given_no_disease * (1 - P_disease)) # 베이즈 정리 적용 P_disease_given_positive = (P_positive_given_disease * P_disease) / P_positive print(f"검사 결과가 양성일 때 실제로 질병이 있을 확률: {P_disease_given_positive:.2%}")
'scikit-learn' 카테고리의 다른 글
머신러닝 - 분류 모델의 이해 - (0) 2025.03.01 scikit-learn_지도학습 (1) 2025.02.14 Scikit-learn 주요 기능 (1) 2025.01.10 scikit-learn 기능 구현 (0) 2025.01.09 Classification - 분류 (0) 2025.01.09 - 의학 진단