scikit-learn
-
scikit-learn의 지도학습 라이브러리scikit-learn 2024. 12. 25. 08:07
1. clf.fit(x_train, y_train)의미: fit() 메서드는 분류기를 학습시키는 단계입니다.x_train: 훈련 데이터의 특징(feature) 행렬입니다.y_train: 훈련 데이터의 레이블(label) 벡터입니다.랜덤 포레스트 분류기가 주어진 데이터를 기반으로 의사결정 트리(decision tree) 여러 개를 생성하고, 이를 조합해 예측할 준비를 합니다.2. y_pred = clf.predict(x_test)의미: predict() 메서드는 학습된 모델을 사용해 테스트 데이터를 예측하는 단계입니다.x_test: 테스트 데이터의 특징(feature) 행렬입니다.y_pred: x_test에 대한 예측 결과(레이블)입니다.3. clf.score(x_test, y_test)의미: score(..
-
머신 러닝 _ 비지도 학습 _scikit-learn 2024. 12. 24. 13:17
**비지도 학습 (Unsupervised Learning)**은 라벨이 없는 데이터에서 패턴이나 구조를 찾아내는 머신러닝의 한 가지 방식입니다. 비지도 학습은 입력 데이터에 대한 정답(라벨)이 없을 때, 모델이 스스로 데이터의 특징을 파악하고 숨겨진 구조를 추출하는 데 사용됩니다. 이는 데이터를 분석하고, 그룹화하거나, 차원을 축소하는 등 다양한 방식으로 활용됩니다.비지도 학습의 주요 기법은 **군집화(Clustering)**와 **차원 축소(Dimensionality Reduction)**가 있습니다.1. 군집화(Clustering)군집화는 데이터를 유사한 특성을 가진 그룹으로 나누는 기법입니다. 주어진 데이터에서 비슷한 데이터를 묶어주는 방법으로, 대표적인 알고리즘에는 K-means, DBSCAN, ..
-
머신러닝 _ 지도학습 _scikit-learn 2024. 12. 24. 13:05
"지도학습은 정보의 정답을 가지고 학습하는 방식으로, 학습 과정에서 주어진 입력 데이터와 이에 대응하는 **정답 레이블(출력 데이터)**을 사용하여 모델을 훈련시킵니다. 이 과정에서 모델은 입력과 출력 간의 관계를 학습하며, 이를 바탕으로 새로운 데이터에 대한 예측을 수행할 수 있습니다. 지도학습의 성능은 주어진 훈련 데이터의 양과 질에 따라 달라지며, 충분한 양의 정확한 데이터가 주어지면 모델이 더 잘 일반화되어 예측 정확도가 높아집니다. 따라서 얼마나 많은 데이터를 학습에 활용할 수 있는지가 모델의 학습 효율성과 성능을 결정짓는 중요한 요소가 됩니다." 이와 같이 지도학습은 정답 레이블이 있는 데이터 세트를 이용하여 학습하고, 학습 데이터의 양과 품질이 모델의 성능에 영향을 미친다는 점을 강조할 수 ..
-
scikit-learn 머신러닝scikit-learn 2024. 12. 23. 10:39
머신러닝의 개념머신러닝은 어떠한 데이터들을 학습하고 이의 패턴을 찾아내 미래의 답을 찾는 예측기능입니다.이는 인과관계를 확인하며 이로 미래를 예측하는 결과값으로 보다 더 정확한 값을 만들어주는 것이 가능하니이는 우리에게 있어 업무의 여러 방면에 강머신러닝: 데이터에서 배우고 예측하는 기술1. 머신러닝이란 무엇인가?머신러닝(Machine Learning)은 기계가 데이터를 통해 스스로 학습하고, 그 학습을 기반으로 예측이나 결정을 내리는 기술입니다. 인간의 개입 없이도 데이터를 분석하고 패턴을 찾아내며, 이 패턴을 기반으로 미래를 예측할 수 있는 능력을 가지고 있습니다.2. 머신러닝의 핵심 원리기계가 데이터를 통해 "학습"하는 방법은 크게 세 가지로 나눌 수 있습니다:지도 학습 (Supervised Le..