분류 전체보기
-
웹스크롤링의 주요 매소드와 parameter카테고리 없음 2025. 4. 29. 17:00
웹스크롤링은 현대 웹 개발에서 매우 중요한 기술 중 하나입니다. 웹스크롤링은 대체로 HTML에서 얻는 것들과 스크립트에서 얻는 동적인 스크롤링으로 나누어집니다. 이 글에서는 웹스크롤링의 주요 메소드와 파라미터에 대해 자세히 알아보겠습니다.웹스크롤링의 정의웹스크롤링이란 웹 페이지의 데이터를 자동으로 수집하는 과정을 의미합니다. 이 과정은 주로 프로그램이나 스크립트를 통해 이루어지며, 사용자가 수동으로 데이터를 수집하는 것보다 훨씬 효율적입니다. 웹스크롤링은 데이터 분석, 가격 비교, 뉴스 수집 등 다양한 분야에서 활용됩니다.웹스크롤링의 주요 메소드웹스크롤링의 메소드는 크게 두 가지로 나눌 수 있습니다. 첫 번째는 HTML 스크롤링이고, 두 번째는 동적 스크롤링입니다.HTML 스크롤링HTML 스크롤링은 웹 ..
-
웹스크롤링카테고리 없음 2025. 4. 28. 15:31
웹 스크롤링의 모든 것: 데이터 수집의 필수 도구웹 스크롤링은 요즘 데이터 수집의 필수적인 방법으로 자리 잡고 있습니다. 많은 사람들이 웹에서 정보를 수집하고 분석하는 데 이 방법을 사용하고 있죠. 오늘은 웹 스크롤링에 대해 자세히 알아보겠습니다.웹 스크롤링의 정의웹 스크롤링은 웹 페이지의 데이터를 자동으로 수집하는 과정을 말합니다. 이 과정은 주로 크롤러라는 프로그램을 통해 이루어지며, 웹 페이지를 방문하고 필요한 정보를 추출하는 방식으로 진행됩니다. 크롤러는 인터넷을 돌아다니며 여러 웹 사이트에 접속하고, 페이지의 내용과 링크의 복사본을 생성하여 다운로드하고 요약본을 만듭니다.웹 스크롤링의 필요성웹 스크롤링은 다양한 분야에서 활용되고 있습니다. 예를 들어, 기업들은 경쟁사의 가격 정보를 수집하거나, ..
-
ensemble params모음scikit-learn 2025. 4. 24. 13:48
🌲 1. RandomForest (분류/회귀 공용)다수의 결정 트리를 평균 또는 다수결로 합산RandomForestClassifier / RandomForestRegressor 파라미터설명n_estimators생성할 트리 개수 (기본 100)max_depth트리 최대 깊이 제한min_samples_split내부 노드를 나누기 위한 최소 샘플 수max_features각 노드 분할 시 고려할 최대 특성 수random_state결과 재현을 위한 시드 ⚡ 2. GradientBoosting / HistGradientBoosting이전 오류를 보완하는 방식으로 트리를 연속적으로 학습GradientBoostingClassifier / HistGradientBoostingRegressor 파라미터설명learning..
-
Two-sample 검정통계 종류 정리카테고리 없음 2025. 4. 23. 17:27
두 표본 검정통계의 종류에 대해 정리해보았습니다. 통계학에서 두 개의 표본을 비교하는 방법은 여러 가지가 있으며, 그 중에서도 t검정이 가장 널리 사용됩니다. 이번 포스팅에서는 독립표본 t검정과 대응표본 t검정에 대해 자세히 알아보겠습니다.1. Two-sample 검정통계의 개요두 표본 검정통계는 두 개의 모집단 평균이 동일한지를 검정하는 방법입니다. 이 방법은 주로 실험이나 연구에서 두 그룹 간의 차이를 분석할 때 사용됩니다. 예를 들어, A/B 테스트에서 두 가지 마케팅 전략의 효과를 비교할 때 유용합니다.2. 독립표본 t검정독립표본 t검정은 두 개의 독립적인 표본에서 평균을 비교하는 방법입니다. 이 검정은 두 그룹이 서로 독립적일 때 사용되며, 예를 들어 남성과 여성의 평균 키를 비교할 때 적합합니..
-
two sample 각각의 상황의 따른 공식카테고리 없음 2025. 4. 22. 15:00
두 샘플 t-검정은 통계학에서 두 개의 샘플 간의 평균 차이를 비교하는 데 사용되는 중요한 방법입니다. 이 방법은 다양한 분야에서 활용되며, 특히 실험 결과를 분석할 때 유용합니다. 이번 포스팅에서는 two sample t-test의 개요부터 공식, 예시, 결과 해석까지 자세히 알아보겠습니다. 😊two sample t-test의 개요two sample t-test는 두 개의 독립적인 샘플이 있을 때, 이들의 평균이 통계적으로 유의미하게 차이가 있는지를 검정하는 방법입니다. 예를 들어, 두 개의 다른 약물의 효과를 비교하고자 할 때 이 검정을 사용할 수 있습니다. 이 검정은 두 샘플의 분산이 같거나 다를 때 각각 다른 공식을 사용합니다.two sample t-test의 필요성이 검정은 다양한 연구에서 필..
-
A/B 테스트의 시초: TWO - 샘플 가설 검정카테고리 없음 2025. 4. 18. 17:22
A/B 테스트는 현대 마케팅과 데이터 분석에서 매우 중요한 도구입니다. 특히, 두 가지 옵션을 비교하여 어떤 것이 더 효과적인지를 판단하는 데 사용됩니다. 이번 포스트에서는 A/B 테스트의 기초부터 시작하여, Two-sample 가설검정의 개념과 절차, 실제 사례, 그리고 유용한 도구들에 대해 자세히 알아보겠습니다.A/B 테스트의 개요A/B 테스트는 두 가지 버전(A와 B)을 비교하여 어떤 것이 더 나은 성과를 내는지를 평가하는 방법입니다. 예를 들어, 웹사이트의 버튼 색상을 변경했을 때, 어떤 색상이 더 많은 클릭을 유도하는지를 테스트할 수 있습니다. 이러한 방식은 데이터 기반의 의사결정을 가능하게 하여, 마케팅 전략을 최적화하는 데 큰 도움을 줍니다.Two-sample 가설검정의 정의Two-sampl..
-
검정통계량: 통계적 검정에서 중요한 개념카테고리 없음 2025. 4. 17. 15:15
통계학에서 검정통계량(Test Statistic)은 주어진 데이터가 어떤 가설을 검정하기 위해 사용되는 핵심적인 값입니다. 이 값은 우리가 설정한 귀무가설(null hypothesis)을 채택할지, 아니면 대립가설(alternative hypothesis)을 채택할지 결정하는 중요한 기준이 돼요.오늘은 검정통계량이 무엇인지, 그리고 어떻게 활용되는지에 대해 쉽게 설명해보겠습니다.1. 검정통계량이란?검정통계량은 주어진 데이터로부터 계산되는 수치적 지표로, 특정 가설이 맞는지를 검토하는 데 사용됩니다. 이 값은 귀무가설이 참일 때, 데이터를 통해 우리가 얼마나 그 가설로부터 벗어났는지를 나타냅니다.귀무가설(H₀): "차이가 없다", "효과가 없다", "변화가 없다"는 가설대립가설(H₁): "차이가 있다", ..
-
가설 검정이란? 귀무가설과 대립가설의 의미와 이해카테고리 없음 2025. 4. 16. 17:50
통계학에서는 주어진 데이터를 바탕으로 어떤 주장이 참인지 거짓인지 검증하는 과정이 바로 가설 검정입니다. 이 과정에서 중요한 개념이 바로 귀무가설과 대립가설입니다. 이 두 가지 가설은 우리가 실제 데이터를 분석하고 결론을 내리는 데 중요한 역할을 합니다. 오늘은 귀무가설과 대립가설에 대해 쉽게 이해할 수 있도록 설명해드릴게요.1. 귀무가설 (Null Hypothesis, H₀)귀무가설이란?귀무가설은 기본적인 상태나 기존 이론, 또는 변화가 없다는 주장을 의미합니다. 쉽게 말해, "변화가 없다"거나 "효과가 없다"는 가설을 말합니다.귀무가설의 예시어떤 약물이 효과가 없다.두 집단의 평균 차이가 없다.기업의 매출에 시즌 변화가 없다.귀무가설은 우리가 통계적 검정을 통해 기각할지 말지를 결정하는 가설입니다.표..