#Graph Neural Network #GCN #Large-Scale Session Data #User Meta Fusion #Loan Recommendation

네이버파이낸셜
대출상품 추천 연구

대규모 세션 로그와 사용자 메타정보를 결합한 GCN 기반 정확도 중심의 개인화 대출 추천

Role

학부연구생 / 모델 구현 참여

Period

2025.03 - Ongoing

Partners

NAVER Financial

Tech Stack

Python, PyTorch, PyG, Pandas, Scikit-learn

Project Background

네이버파이낸셜은 대출비교 플랫폼을 통해 다수의 금융기관 상품을 사용자에게 제공합니다. 기존의 단순 금리 정렬 방식은 사용자 개인의 신용 상황과 행동 맥락을 반영하지 못해, "클릭은 일어나지만 사용자에게 실제로 적합하지 않은 상품"이 상위에 노출되는 한계가 있었습니다. 즉, 추천의 본질적인 정확도가 부족했습니다.


본 연구는 두 가지 큰 도전 과제를 다룹니다. 첫째, 대규모 세션 로그 — 사용자가 플랫폼 안에서 남기는 클릭·조회·전환 이력 — 와 정적인 사용자 메타정보 — 신용점수·연소득·기존 대출 보유 현황 같은 신용 관련 속성 — 를 동시에 활용해야 한다는 점입니다. 둘째, 두 정보를 어떤 구조로 결합할 것인가 입니다. 동적인 행동 시퀀스와 정적인 사용자 속성은 결이 다른 신호이기 때문에, 단순 concat이나 별도 모델링으로는 서로의 정보를 충분히 살리지 못합니다.


본 연구에서는 사용자–상품 상호작용을 그래프 구조로 표현하고, Graph Convolutional Network(GCN)를 통해 다중 홉(multi-hop) 협업 신호를 학습하는 방향을 택했습니다. 세션 기반 행동 신호는 그래프의 엣지 구조와 가중치로, 사용자 메타정보는 노드 피처로 결합하여 두 신호가 메시지 전파 과정에서 자연스럽게 섞이도록 설계하는 것을 핵심으로 삼고 있습니다.

🔒 보안 환경: 실제 사용자 금융 데이터를 다루는 연구 특성상, 네이버파이낸셜 내부 오프라인 환경에서 모든 실험이 진행되었으며, 데이터 외부 반출이 엄격히 제한되었습니다.

네이버파이낸셜 금융상품 추천

▲ 네이버파이낸셜 대출비교 서비스



Research Approach: 두 신호를 어떻게 결합할 것인가

본 연구의 핵심 질문은 "대규모 세션 로그와 사용자 메타정보를 어떤 방식으로 결합해야 추천 정확도를 가장 높일 수 있는가" 입니다. 두 데이터는 형태와 시간 스케일이 모두 다르기 때문에, 단순 결합으로는 서로의 강점을 살릴 수 없습니다. 이를 해결하기 위해 두 축을 그래프 표현 안에서 통합하는 접근을 설계하고 있습니다.

Large-Scale Session Logs
동적인 행동 신호

  • 수십 GB 규모의 사용자 행동 이력
  • 클릭·조회·전환 이벤트의 시간 순서 보존
  • 사용자–상품 상호작용을 엣지로 표현
  • 행동 빈도·최근성을 엣지 가중치에 반영

User Meta Information
정적인 사용자 속성

  • 신용점수·연소득·기존 대출 보유 현황
  • 상환 이력 등 신용 관련 속성
  • 그래프 노드의 초기 피처로 인코딩
  • 신용 미보유 등 세그먼트 특성도 함께 표현

Fusion Strategy — 메시지 전파를 통한 자연스러운 결합

두 신호를 입력 단계에서 단순 concat하면 행동 신호가 정적 속성에 묻히거나, 반대로 정적 속성이 노이즈로 취급되는 문제가 생깁니다.

본 연구는 사용자 메타정보를 노드 피처로, 세션 로그의 행동 신호를 엣지 구조와 가중치로 분리해 그래프를 구성한 뒤, GCN의 메시지 전파 과정에서 두 신호가 다중 홉을 거치며 결합되도록 설계합니다. 그 결과 사용자의 정적 신용 맥락과 동적 행동 맥락이 모두 반영된 임베딩이 자연스럽게 학습됩니다.

이 결합 구조의 핵심 목적은 추천 정확도입니다. 기존 모델이 행동 신호만으로 클릭을 예측하거나, 또는 신용 정보만으로 상품 적합도를 평가하던 방식과 달리, 두 신호를 한 사용자 표현 안에 녹여낸 임베딩 위에서 클릭·전환 확률을 추정함으로써 "사용자가 실제로 클릭하고 전환까지 이어지는 상품"을 더 정확하게 식별하는 것을 목표로 합니다.

Recommendation Pipeline

대규모 세션 로그와 사용자 메타정보를 그래프 구조에서 결합하고, 추천 정확도를 직접 평가하는 흐름으로 파이프라인을 설계하고 있습니다.

1
User Meta — 노드 피처 인코딩

신용점수, 연소득, 기존 대출 보유 현황, 상환 이력 등 사용자 속성을 정제하고 그래프 노드의 초기 피처 벡터로 변환합니다. 신용 미보유·다중 대출 보유 등 세그먼트 특성도 함께 인코딩하여 정적 사용자 맥락을 표현합니다.

2
Session Logs — 그래프 엣지 구성

대규모 세션 로그로부터 사용자–상품 이분 그래프(bipartite graph)를 구축하고, 행동 빈도·최근성을 엣지 가중치로 반영합니다. 동적 행동 신호가 그래프의 구조 자체에 새겨지도록 설계했습니다.

3
GCN — 메시지 전파를 통한 신호 결합

GCN의 다중 홉 메시지 전파를 통해, 노드 피처에 담긴 사용자 메타 신호와 엣지에 담긴 행동 신호가 자연스럽게 섞입니다. 그 결과 정적·동적 맥락이 모두 반영된 사용자 임베딩이 생성됩니다.

4
상품 매칭 및 클릭·전환 예측

학습된 사용자 임베딩과 상품 표현을 결합하여 각 사용자–상품 쌍의 클릭 및 전환 확률을 추정합니다. 두 확률을 함께 학습함으로써, 단순 클릭 예측을 넘어 "실제 전환으로 이어지는 상품"을 식별합니다.

5
정확도 평가 및 사용자 적합도 필터링

AUC-ROC, AUC-PR, Precision@K 등 다중 지표로 추천 정확도를 평가하고, 사용자의 상환 능력 범위를 벗어나는 상품은 필터 레이어에서 제외합니다. 정량 지표와 도메인 적합도를 함께 고려한 최종 추천을 생성합니다.

네이버페이 대출 비교

▲ 네이버페이 대출비교 서비스 화면


My Contribution

Status & Next Steps

본 연구는 현재 진행 중이며, 다음 단계로는 대규모 세션 로그와 사용자 메타정보의 결합 방식을 더 정교하게 설계하는 방향을 탐색하고 있습니다. 단순한 노드 피처 결합을 넘어, 시간성을 반영한 동적 그래프 구조와 이종 신호의 가중 결합 등 추천 정확도를 끌어올릴 수 있는 구조적 개선을 검토 중입니다. 동시에 사용자 ID마다 명시적 임베딩을 두지 않으면서도 협업 신호를 충분히 학습할 수 있는 파라미터 효율적 사용자 표현 방향에도 관심을 두고 있습니다.

Back to Portfolio