"안전 이상 무"...카카오페이, 기술 안정성 강화에 총력
카카오페이가 수십억 건의 트래픽이 오가는 생활 금융 플랫폼의 기술 안정성을 높이기 위해 올 한 해 다양한 노력을 기울인 것으로 나타났다.
26일 이 회사에 따르면 카카오페이는 최근 인프라 재해복구 모의훈련을 실시했다. 카카오페이의 혜택 서비스를 대상으로 재해가 발생했다는 가정 하에 내부 비상연락망을 통한 재해 상황을 전파하고 각 유관부서별 역할에 따라 서비스 중단 없이 최단 시간 내에 재해복구를 위한 업무를 수행하는 훈련을 진행했다.
올해 3월에는 모의훈련이 아닌 실전으로 서비스 중단 없이 방화벽 교체를 안정적으로 진행하며 서비스 안정성을 입증했다. 이원화된 데이터센터 중 한 곳의 방화벽 교체를 위해 통신을 완전히 차단한 상태에서 다른 데이터센터만으로 서비스를 단독 운영하고, 방화벽 교체 후 다시 원래의 상태로 복구하는 것까지 서비스 장애 없이 완료했다.
월간사용자수가 2천400만에 달하고, 작년 한 해 연간거래액만 141조원에 달하는 등 막대한 트래픽이 일어나는 플랫폼이 데이터센터 한 곳을 완전 차단한 상황에서 서비스 중단이나 장애 없이 이원화된 데이터센터 한 곳만으로 서비스를 운영한 것이다. 이에 회사는 “카카오페이의 이원화 시스템이 매우 안정적으로 구축, 운영되고 있다는 점을 보여준다”고 설명했다.
카카오페이는 서비스 성능을 한층 더 높이기 위한 프로젝트도 가동했다. 서비스 아키텍처를 개선하고 내부 요청 처리 플로우를 최적화해 서비스 성능 및 응답 속도를 향상했고, 이를 통해 성능 관련 문제 발생률을 작년 대비 50% 이상 감소시켰다.
모니터링 도구도 강화했다. 실시간 사용자 모니터링(RUM) 도입 및 탐지 범위 확대를 통해 서비스 장애 탐지 및 복구 시간을 지난해 대비 40% 이상 단축했다. 또 다양한 서비스 배포 전략을 도입하여 서비스 변경 시 발생할 수 있는 위험을 최소화하고 서비스 운영의 안정성을 높였으며, 이에 따라 서비스 가용성도 한층 더 개선됐다.
회사는 부정거래 방지를 위해 사용자 행동을 기반으로 비정상 거래를 탐지하는 FDS(이상거래탐지시스템)도 강화하고 있다. 카카오페이는 다양해지는 사기거래에 능동적으로 대응하기 위해 룰 기반의 FDS에 AI를 통해 예측, 방어할 수 있는 '어댑티브 ML(Adaptive ML)' 기반의 머신러닝 기술을 적용했다. 변화하는 데이터에 맞춰 모델을 실시간으로 학습시키고 학습된 모델을 다시 자동으로 업데이트하면서 탐지율을 높인다. 룰 기반의 FDS보다 정밀도가 20배 높다.
현재 카카오페이는 결제, 송금, 멤버십 적립, 청구서 요금 납부 등 일상적인 서비스부터 대출, 보험, 투자 등 다양한 금융상품을 비교하고 자산을 관리할 수 있는 전문 금융의 영역까지 확장한 만큼 매달 이용건수와 이용금액도 계속해서 증가하고 있다. 편리하고 안전한 전 국민의 생활 금융 플랫폼이 되기 위해 급증하는 트래픽을 안정적으로 운영하며 끊임없이 기술 안정성을 높이기 위한 노력을 지속적으로 강화한다는 방침이다.
카카오페이 김동용 최고기술책임자는 "금융 플랫폼이 최우선으로 생각해야 하는 가치는 '신뢰'라고 생각한다"며 "편의성을 높이기 위한 기술투자뿐 아니라, 사용자들이 안심하고 이용할 수 있는 플랫폼이 되기 위해 기술 안정성을 높이기 위한 노력은 계속해서 강화할 것"이라고 밝혔다.