2022.04.12
일일 회고 59회차
할일 및 한일
경험 및 배움
소변검사 이미지 데이터 기반의 질병 판단 AI 모델 구현
전날에 구현한 수치 데이터 기반의 질병 판단 AI 모델은 더 많고 다양한 데이터셋이 필요하여, 오늘은 소변스트립 이미지를 기반으로 질병을 판단하는 모델 구현을 진행했다.
학습 데이터셋 수집을 위한 첫 번째로 소변검사가 완료된 소변스트립 이미지와 검사의 대상자가 가진 질병 이름을 매핑했다. 두 번째로 이미지에서 소변스트립 학습에 방해가 될 배경이나 사물을 제거하기 위해 이미지의 가운데 부분만 추출하여 소변스트립만 남도록 가공했다. 세 번째로 모든 이미지를 같은 크기로 수정하여 학습 데이터셋을 위한 가공을 완료했다.
AI 모델은 이미지 학습에 많이 사용되는 CNN(Convolutional Neural Networks)을 기반으로 구현했다. CNN을 사용한 이유는 동일한 질병을 가진 환자의 소변스트립은 패턴이 존재하므로 이미지에서 특징을 추출하여 질병을 판단하기 위함이다. 또한 Pooling Layer를 활용해 소변스트립의 특징 중에서도 가장 질병에 영향력이 있는 값을 추출하여 학습시키도록 구성했다. 그리고 과적합 문제를 방지하기 위해 Dropout Layer도 적용했다.
구현된 AI 모델에 이전 과정에서 가공한 데이터셋을 학습시키는 것을 진행했다. 학습 정확도는 향상되는 것을 볼 수 있었지만, 평가 정확도는 0%로 떨어지는 것을 확인할 수 있었다. 이러한 이유에 대해 고민해본 결과 이미지의 개수가 학습용 24개, 평가용 4개로 총 28개이므로 학습이 잘 되지 않을 것이라고 결론을 내렸다.
추후에 소변검사 결과인 소변스트립 이미지를 더 많이 수집하여 학습을 진행할 예정이며, 이미지 데이터셋을 자동으로 가공하는 코드를 구현해 볼 예정이다.
개선 및 목표
질병을 갖고 있는 환자의 소변스트립 이미지 수집하기
이미지 데이터 기반의 질병 판단 AI 모델 개선하기
Last updated