대학원 입학 확률 예측하여 데이터 분석하기
종종 대학원 입학시험(GRE)에서 만점을 받아도 원하는 학교에 진학하지 못하는 학생들의 경우를 뉴스에서 보신 적이 있을겁니다. 일반적으로 대학원 입학은 대학원 입학시험(GRE) 점수, TOEFL 점수, 학교 랭킹, 학점, 자기소개서 등의 다양한 요소가 영향을 미칩니다. 이를 수치화하여 인공지능으로 예측할 수 있다면 대학원 입학 원서를 작성할 때 보완할 부분에 대한 파악과 원서 구성이 용이해질 것입니다.
본 레시피에서는 대학원 입학 확률을 예측하는 인공지능을 생성하고, 생성된 인공지능 모델의 분석 결과를 확인하는 프로세스를 살펴보도록 하겠습니다.
학생 데이터로 모델 생성하기
1. 데이터 살펴보기
학습 데이터를 확인하는 것은 인공지능 모델의 질을 향상시키는데 필수 과정입니다. 학습에 사용할 데이터를 살펴봅시다.
은행 과금 여부 예측 인공지능에 활용될 데이터는 csv 형식으로써, 데이터의 컬럼을 쉼표로 구분한 텍스트 데이터입니다. 아래와 같이 표의 형태를 가진 데이터라고 볼 수 있습니다.
Data : graduate_school_admissions.csv
본 레시피에서 인공지능 학습에 사용될 데이터인 'graduate_school_admissions.csv'를 살펴보도록 하겠습니다.
각 컬럼 별로 특정 학생의 GRE 점수, TOEFL 점수, 학점(GPA), 자기소개서(personal_statement), 추천서(recommendation), 연구 경험(research), 입학 확률(admission_rate)을 포함하고 있습니다. 이 데이터와 DS2.ai 플랫폼을 이용하여 특정 고객의 대학원 입학 확률을 예측하는 인공지능 모델을 생성해봅시다.
인공지능 입력 데이터 : 학생 정보 (GRE 점수, TOEFL 점수, 학점, 자기소개서, 추천서, 연구 경험)
인공지능 출력 데이터 : 대학원 입학 확률
2. 학습데이터 업로드하기
본 레시피는 학생의 정보를 입력 데이터로 하고, 대학원 입학 확률을 출력 데이터로 하는 인공지능 생성이 목적이므로 admission_rate를 결과값 칼럼으로 선택합니다. 인공지능은 각 칼럼의 데이터와 대학원 입학 확률의 상관관계를 유추하며 학습을 진행할 것입니다.
1. 상단 네비게이션 바에서 데이터셋 페이지로 이동합니다.
2. 데이터 추가하기
버튼을 클릭합니다.
3. 데이터 형식을 CSV로 선택합니다.
4. graduate_school_admissions.csv 파일을 찾아 업로드합니다.
5. 결과값 칼럼 선택하기를 활성화하고 admission_rate를 선택합니다.
6. 확인
버튼을 클릭하고 데이터를 업로드를 완료합니다.
3. 인공지능 개발하기 프로젝트 생성하기
1. 상단 네비게이션 바에서 데이터셋 페이지로 이동합니다.
2. 데이터셋 리스트에서 graduate_school_admissions.csv 파일을 찾아 좌측 체크박스를 클릭합니다.
3. AI 개발 시작하기
버튼을 클릭합니다.
4. 인공지능 학습 시작하기
1. 생성된 인공지능 개발하기 프로젝트의 모델 학습 조건을 설정합니다. (학습 조건 설정에 관한 자세한 사항은 모델 학습 조건 설정하기에서 확인할 수 있습니다.)
학습형태 : 정형 데이터 연속값 분류(Regression)
분석/예측하고 싶은 값 : admission_rate
2. 화면 우측의 START
버튼을 클릭하여 인공지능 학습을 시작합니다.
3. 최초 모델 학습이 완료되면 메일 및 알림이 발송되며, 프로젝트 내 모든 모델의 학습이 완료되면 한 번 더 메일 및 알림이 발송됩니다.
학습형태는 정형 데이터 연속값 분류(Regression)으로 설정합니다.
정형 데이터는 틀과 형식이 정해져있는 데이터를 의미합니다. graduate_school_admissions.csv는 표 형식이 정해진 데이터이면서 예측 결과값인 admission_rate는 소수점을 포함한 연속값으로 표시되기 때문에 연속값 분류에 해당합니다. 그 외의 설정은 희망 방식에 맞추어 선택할 수 있습니다.
5. 생성된 AI 모델 확인하기
모델 학습이 완료되었다는 것은, 업로드한 데이터셋을 이용하여 여러개의 인공지능 모델이 생성되었음을 의미합니다. 아래와 같이 모델명, 상태, 정확도, Error Rate를 확인하여 다양한 모델을 비교해보세요.
또한, 모델별로 상세보기, 개별예측, 일괄예측, 분석시작, 디플로이 기능을 지원합니다. 본 레시피에서는 분석시 기능을 살펴보겠습니다.
6. 분석하기
일괄 예측은 여러 고객의 정보를 입력하여 한 번에 예측할 수 있습니다. 일괄 예측을 선택한 후
예측용 템플릿 다운로드하기
버튼을 클릭하면, CSV 형식의 템플릿을 다운받을 수 있습니다.예측용 템플릿은 다음과 같이 컬럼명만 기재되어있고, 데이터는 공란으로 되어있습니다. 위와 같이 여러명의 고객 정보를 각 컬럼에 입력합니다.
고객 정보 기입이 완료된 예측용 템플릿 파일을 업로드합니다.
인공지능 모델 예측이 완료되면 이메일로 알림을 보내드립니다.
다른 질문이 있으신가요? [email protected]로 문의주시면 도움을 드립니다.
Last updated