의료 비용 예측 인공지능 생성하기
의료비용 예측 인공지능이란?
의료 분야에서 내리는 판단은 방대한 데이터와 변수를 기반으로 하는 경우가 많으므로, 빠르게 많은 정보를 처리하는 인공지능을 도입한다면 데이터의 패턴 분석과 예측 과정이 더욱 자유로워질 것입니다.
본 레시피에서는 고객 정보에 따른 의료비용을 예측하는 인공지능을 생성하고, 학습 데이터로 생성한 인공지능 모델을 외부에 판매하는 프로세스를 살펴보겠습니다.
의료 데이터 활용한 모델 생성하기
1. 데이터 살펴보기
학습 데이터를 확인하는 것은 인공지능 모델의 질을 향상시키는데 필수적인 과정입니다. 학습에 사용될 데이터를 살펴봅시다.
의료비용 예측 인공지능에 활용될 데이터는 csv 형식으로써, 데이터의 컬럼을 쉼표로 구분한 텍스트 데이터입니다. 아래와 같이 표의 형태를 가진 데이터라고 볼 수 있습니다.
Data : MedicalCost.csv
본 레시피에서 인공지능 학습에 사용될 데이터인 '의료비용예측.csv'를 살펴보도록 하겠습니다.
각 컬럼 별로 특정 고객의 나이, 성별, 체지방, 자식 수, 흡연 여부, 지역, 의료비용을 포함하고 있습니다. 이 데이터와 DS2.ai를 이용하여, 특정 고객의 의료비용을 예측하는 인공지능 모델을 생성합니다.
인공지능 입력 데이터 : 고객 정보 (나이, 성별, 체지방, 자식 수, 흡연 여부, 지역)
인공지능 출력 데이터 : 의료비용
2. 학습데이터 업로드하기
1. 상단 네비게이션 바에서 데이터셋 페이지로 이동합니다.
2. 데이터 추가하기
버튼을 클릭합니다.
3. 데이터 형식을 CSV로 선택합니다.
4. MedicalCost.csv 파일을 찾아 업로드합니다.
5. 결과값 칼럼 선택하기를 활성화하고 의료 비용을 선택합니다.
6. 확인
버튼을 클릭하고 데이터를 업로드를 완료합니다.
CSV 파일을 업로드하고 결과값 칼럼을 선택합니다. 본 레시피는 고객의 정보를 입력 데이터로 하고, 의료 비용을 출력 데이터로 하는 인공지능 생성이 목적이므로 의료 비용를 결과값 칼럼으로 선택합니다. 인공지능은 각 칼럼의 데이터와 의료 비용의 상관관계를 유추하며 학습을 진행할 것입니다.
3. 인공지능 모델 학습하기
1. 상단 네비게이션 에서 데이터셋 페이지로 이동합니다.
2. 데이터셋 리스트 중 업로드했던 MedicalCost.csv 파일을 찾아 좌측 체크박스를 클릭합니다.
3. AI 개발 시작하기
버튼을 클릭합니다.
4. 인공지능 학습 시작하기
1. 생성된 인공지능 개발하기 프로젝트의 모델 학습 조건을 설정합니다. (학습 조건 설정에 관한 자세한 사항은 모델 학습 조건 설정하기에서 확인할 수 있습니다.)
학습형태 : 정형 데이터 연속값 분류(Regression)
분석/예측하고 싶은 값 : 의료 비용
2. 화면 우측의 START
버튼을 클릭하여 인공지능 학습을 시작합니다.
3. 최초 모델 학습이 완료되면 메일 및 알림이 발송되며, 프로젝트 내 모든 모델의 학습이 완료되면 한 번 더 메일 및 알림이 발송됩니다.
학습형태는 정형 데이터 연속값 분류(Regression)으로 설정합니다.
정형 데이터는 틀과 형식이 정해져있는 데이터를 의미합니다. MedicalCost.csv는 표 형식이 정해진 데이터이면서 예측 결과값인 의료 비용은 소수점을 포함한 연속값으로 표시되므로 연속값 분류에 해당합니다. 그 외의 설정은 희망 방식에 맞춰 선택할 수 있습니다.
모델 학습이 완료되었다는 것은, 업로드한 데이터셋을 이용하여 여러개의 인공지능 모델이 생성되었음을 의미합니다. 아래와 같이 모델명, 상태, 정확도, Error Rate를 확인하여 다양한 모델을 비교해보세요.
5. AI 모델 확인하기
모델링이 완료되었다는 것은, 업로드한 데이터셋을 이용하여 여러개의 인공지능 모델이 생성되었음을 의미합니다. 아래와 같이 모델명, 상태, 정확도, Error Rate를 확인하여 다양한 모델을 비교해보세요.
또한, 모델별로 상세보기, 개별예측, 일괄예측, 분석시작, 디플로이 기능을 지원합니다. 본 레시피에서는 개별예측, 일괄예측 기능을 함께 살펴보겠습니다.
6. 예측하기
[개별 예측]
하나의 인공지능 모델을 선택한 후 컬럼 값을 직접 입력하여 결과값을 예측할 수 있습니다. 본 레시피의 경우, 나이, 성별, 체지방 등의 고객 정보를 입력하여 의료 비용 예측하는 인공지능 모델을 활용해 볼 수 있습니다.
[일괄 예측]
일괄 예측은 여러 고객의 정보를 입력하여 한 번에 예측할 수 있습니다. 일괄 예측을 선택한 후
예측용 템플릿 다운로드하기
버튼을 클릭하면, CSV 형식의 템플릿을 다운받을 수 있습니다.예측용 템플릿은 다음과 같이 컬럼명만 기재되어있고, 데이터는 공란으로 되어있습니다. 위와 같이 여러명의 고객 정보를 각 컬럼에 입력합니다.
고객 정보 기입이 완료된 예측용 템플릿 파일을 업로드합니다.
인공지능 모델 예측이 완료되면 이메일로 알림을 보내드립니다.
다른 질문이 있으신가요? [email protected]로 문의주시면 도움을 드립니다.
Last updated