"버려지던 음성 데이터를 핵심 자산으로."
상담 통화 내용을 AI로 분석하여 데이터셋을 구축하고, 최적의 간병인 매칭 및 요율을 예측하는 모델을 개발하여 특허를 출원했습니다.
테헤란로에 위치한 간병인 매칭 플랫폼 '코드블라썸'과의 산학협력 프로젝트입니다. 당시 고객과의 상담은 주로 전화로 이루어졌는데, 이 귀중한 상담 내용이 단순 녹음 파일(비정형 데이터)로만 남아 활용되지 못하는 문제가 있었습니다.
또한 간병인 매칭 및 요율(비용) 산정이 담당자의 경험과 직관에 의존하고 있어, 표준화된 기준이 부족했고 데이터 기반의 최적화가 절실한 상황이었습니다.
▲ 특허 출원된 AI 매칭 시스템의 데이터 파이프라인 구조도 (예시)
비정형 음성 데이터를 정형 데이터셋으로 변환하고, 이를 머신러닝 모델 학습에 활용하는 End-to-End 데이터 파이프라인을 설계 및 구축했습니다.
상담 녹음 파일을 STT(Speech-to-Text) 기술로 텍스트화한 후, LLM(거대언어모델)을 활용해 환자 상태, 필요 시간, 장소 등 핵심 정보(Feature)를 자동으로 추출하여 구조화된 데이터셋을 구축했습니다.
구축된 데이터셋을 기반으로 XGBoost 등 머신러닝 알고리즘을 적용하여, 특정 조건에서 가장 적합한 간병인을 추천하고 적정 요율을 예측하는 모델을 개발했습니다.
단순 모델 개발에 그치지 않고, 데이터 전처리부터 모델 추론 결과 반환까지의 전 과정을 API 서버로 구축하여 제공함으로써 클라이언트가 즉시 서비스에 도입할 수 있도록 했습니다.
코드블라썸 이라는 회사로부터 음성데이터를 전달받아 AI 모델링을 통해 간병인 매칭 시스템을 개발했고, 해당 솔루션을 기존에 회사에서 운영되는 시스템에 적용하기 위한 API 서버를 구축하여 제공했습니다.
'기계학습 기반의 간병인 자동 매칭 시스템'에 대한 독창적인 아이디어와 구현 방식을 인정받아 특허 출원을 완료했습니다.
활용되지 못하던 비정형 음성 데이터를 핵심 비즈니스 자산으로 전환시키는 자동화된 파이프라인을 성공적으로 구축했습니다.
개발된 추천 엔진을 기존 서비스 시스템에 즉시 적용할 수 있도록 Flask 기반의 REST API 서버를 구축했습니다. GET/POST 요청에 따른 실시간 데이터 통신 로직을 구현하고, Postman을 활용한 기능 테스트를 거치고 API 명세를 전달함으로써 실제 서비스 환경으로의 배포 및 연동을 완수했습니다.