2025/04/17 2

[250417] 머신러닝 6강 앙상블

앙상블 기법을 통해 여러 모델을 결합하고, 손실 함수를 활용해 예측 오류를 측정하며, 과적합을 방지하고 하이퍼파라미터 튜닝을 통해 모델 성능을 최적화하는 방법 1. 앙상블 기법여러 개의 모델을 조합하여, 하나의 모델보다 더 좋은 예측 성능을 내는 방법why?서로 다른 관점(모델)을 결합함으로써 오류를 줄일 수 있음개별 모델의 편향과 분산을 상호 보완배깅 (Bagging, Bootstrap Aggregating)원리학습 데이터를 무작위로 여러 부분 샘플(부트스트랩)로 나누어 각각 독립적으로 모델 학습예측 시에는 여러 모델의 결과를 평균(회귀) 혹은 다수결(분류)로 결정예시랜덤포레스트 - 분류, 회귀 모두 가능결정 트리 여러 개를 만들 때, 각 트리에 사용하는 피처와 데이터 샘플을 무작위로 선택 (피처 샘플..

카테고리 없음 2025.04.17

[팀아티클] A/B 테스트 제대로 이해하기 5, 데이터 분석가가 되기 위한 취준생을 위한 안내서

[250415] 선정 아티클 : A/B 테스트 제대로 이해하기 ⑤ A/B 테스트에 적정한 표본과 주의 사항A/B 테스트 제대로 이해하기: 5 A/B 테스트에 적정한 표본과 주의 사항 | 요즘IT아티클 요약표본 크기는 실험의 기대 차이에 따라 달라진다. 예를 들어, 기존 전환율이 20%일 때 대안이 1% 차이가 난다면 최소 25,255개의 표본이 필요하지만, 5% 차이가 난다면 1,030개의 표본만으로도 유의미한 결과를 얻을 수 있다.무작정 트래픽을 더 모으는 것은 리소스 낭비가 될 수 있다.내가 원하는 결과가 나올 때까지 기다리는 것은 실험의 객관성을 해칠 수 있다.A/B 테스트를 다른 날짜에 시작하는 것은 외부 요인의 영향을 받을 수 있다.A/B 테스트는 단순한 비교가 아니라 고객에게 더 나은 방안을 ..

아티클 스터디 2025.04.17