데이터셋 설정

1. 학습데이터 사용여부

데이터의 항목(Column)별 학습 사용여부를 확인하고 제외할 속성이 있다면 학습데이터 사용여부를 비활성화합니다.

2. 전처리

데이터의 속성(Column)별 데이터 전처리가 필요하다면 해당하는 속성의 전처리 옵션을 체크하고 데이터 항목 리스트 상단의 전처리하기 버튼을 클릭합니다.

  1. 데이터 클렌징 데이터 값이 n개 미만인 유니크 값을 가진 경우, 해당 행(Row)을 모두 삭제합니다.

  2. 이상값 제거 유니크값이 해당 속성 전체 값 중 n% 이상을 차지하는 경우, 해당 열(Column)을 삭제합니다.

  3. 데이터 치환 비어있는 값을 n으로 채웁니다 // 비어있는 값이 있는 행(Row)을 모두 삭제합니다.

다른 질문이 있으신가요? [email protected]로 문의주시면 도움을 드립니다.

Last updated