학습 기록/데이터 처리

    [Data] 결측치 처리 방식

    1. 결측치 접근 방식 1) 미가공 데이터(raw data) > 바로 결측치 처리 2) 미가공 데이터 > 필요한 feature만 따로 뽑기 > 그 후 결측치 처리 2. 결측치 처리 방식 : 데이터에 대한 이해( + 해당 데이터의 도메인에 대한 이해) & 데이터의 분포 확인 & 작업의 목적( 구하고자 하는 바가 무엇인가) 고려하여 결측치 처리 방식을 선택해야한다. 1) drop (삭제) - 결측치가 적은 경우 - 결측치가 있는 행 또는 열을 삭제해도 전체 데이터에 영향을 크게 안 미칠 것 같은 경우 - BUT 결측치가 들어있는 데이터(행/열)을 아예 삭제하는 것이므로, 전체 데이터에 영향 끼칠 수 있어 위험 - 따라서 drop할 땐 신중하게 선택 - dropna DataFrame.dropna(axis=0,..