"3일간의 타임 어택, 전략적 데이터 설계로 승부하다."
제한된 시간 내에 소형 드론 객체를 정확히 탐지하기 위해 병렬 학습 및 앙상블 전략을 수립하여, 해병대 대표로 해군참모총장상을 수상했습니다.
해군본부가 주관한 이 대회는 3일(72시간)이라는 매우 짧은 시간 안에, 영상 속의 작은 드론을 실시간으로 탐지하는 모델을 개발하는 것이 목표였습니다.
가장 큰 문제는 '시간 부족으로 인한 언더피팅(Underfitting)' 가능성과, 드론이 점처럼 보일 정도로 작아 '탐지 난이도가 높다'는 점이었습니다. 저는 팀 내에서 데이터 분석(EDA)과 데이터셋 구성을 전담하여 이 문제를 해결할 전략을 짰습니다.
▲ 타겟 크기 분석 및 앙상블 학습 파이프라인 구조
단일 모델로는 모든 케이스를 커버하기 어렵다고 판단하여, 데이터를 전략적으로 분리하고 병렬로 학습시키는 방식을 제안하고 실행했습니다.
주어진 데이터에서 타겟(드론)의 Bounding Box 크기 분포와 표준편차를 정밀하게 분석했습니다. 이상치(Outlier)를 제거하여 학습 안정성을 높이고, 드론의 크기에 따라 데이터를 '초소형/소형/중형' 등으로 그룹화했습니다.
모델이 다양한 상황을 학습할 수 있도록 데이터셋을 두 가지 버전으로 세팅하여 팀원들에게 전달했습니다.
Dataset A: 객체 유무만 판단하는 이진 분류(Binary Classification) 특화 데이터
Dataset B: 타겟 크기(표준편차)에 따라 클래스를 세분화한 데이터
시간을 절약하기 위해 여러 대의 GPU 서버에서 서로 다른 설정(Config)의 YOLO 인코더들을 동시에 학습시켰습니다. 이후 각 모델의 예측 결과를 결합(Ensemble)함으로써, 단일 모델 대비 재현율(Recall)과 정밀도(Precision)를 모두 비약적으로 향상시켰습니다.
타이트한 일정 속에서도 데이터를 과학적으로 분석하고, 병렬 처리 전략을 통해 언더피팅 리스크를 최소화한 점을 높게 평가받아 해병대 소속 대표 팀으로서 해군참모총장상을 수상하는 영예를 안았습니다.