- 2강 데이터 전처리데이터 전처리원시 데이터에서 불필요하거나 손실(노이즈)이 있는 부분을 처리하고, 분석 목적에 맞는 형태로 만드는 과정필요성1) 모델 정확도 및 신뢰도 향상2) 이상치나 결측치가 많은 상태로 학습하면 예측 성능이 크게 떨어짐3) 효율적인 데이터 분석과 모델 훈련을 위해 필수적인 단계 사례제조업센서가 간헐적으로 측정에 실패해 결측값이 발생센서 오작동으로 인해 극단적으로 큰 값(이상치)이 기록정상 제품과 불량 제품의 데이터 분포가 매우 다름(불균형 데이터)금융증권사나 은행에서 고객 정보 일부가 유실되거나, 특정 시점의 주가나 거래량 데이터가 취합되지 않은 경우 결측값 발생특정 종목에 대해 드물게 발생하는 급등락(‘Flash Crash’), 단일 대량 거래에 따른 비정상적 가격 변동 이상..