행안부, 세계 최초 보이스피싱 대응 음성분석 모델 개발
전화사기(보이스피싱)에 대응하기 위해 범죄자를 그룹화하는 음성분석 모델이 국내에서 세계 최초로 개발됐다. 한국어 데이터를 학습해 판독률을 높였고, 해외 확산도 추진한다.
행정안전부는 보이스피싱 사기범 검거에 활용할 수 있는 '보이스피싱 음성분석 모델'을 개발하고, 이달 말부터 음성 감정 등 사기범 수사 과정에 활용한다고 22일 밝혔다.
그동안 국내에서는 국립과학수사연구원이 러시아와 영국에서 개발한 음성분석 모델을 활용해 보이스피싱 수사에 필요한 음성감정을 진행해왔다. 하지만 외국어로 학습된 음성분석 모델 특성상, 한국어를 사용하는 범죄자의 동일인 여부를 판별하는 정확도에 한계가 있었다.
또 범죄조직이 여러가지 역할을 나눠 그룹별로 활동하고 있어, 범죄에 연루된 범죄자들을 군집화하는 기능도 필요하지만 기존모델에는 이러한 기능이 없어 실효성이 부족했다.
이에 행안부 통합데이터분석센터는 국립과학수사연구원과 함께 지난해부터 보이스피싱 범죄자 검거에 초점을 두고 말하는 사람을 구분하는 정확도 개선과 범죄연루자 그룹화가 가능한 모델 개발을 추진했다.
최신 인공지능학습(AI 딥러닝) 기술을 활용한 이번 모델은 개발과정에서 국내외 약 6000여 명으로부터 추출한 100만 개 이상의 외국어와 한국어 음성데이터를 활용헸다.
특히 한국어는 약 10만 개 이상의 일반인 음성데이터와 국과수가 보유 중인 실제 보이스피싱 사기범 음성데이터를 함께 사용해 다양한 학습 과정과 성능 검증과정을 거쳤고, 보이스피싱 화자 구분 등에 필요한 최적의 알고리즘을 만들어 냈다.
1차 150명 660여 개, 2차 200명 1만2000여 개의 별도 음성데이터를 사용한 검증에서 범죄자의 음성을 정확하게 판별해내는 판독률은 기존 외국의 분석모델 대비 약 77% 향상된 것이 확인됐다.
또 통합데이터분석센터는 기존 모델에서는 불가능했던 범죄가담자 그룹화 기능도 세계 최초로 구현했다.
행안부는 모델 개발이 성공함에 따라 국과수, 경찰청과 협력해 보이스피싱범 수사와 검거 과정에 적극적으로 활용하고 해외 확산도 추진할 방침이다.
먼저 국과수는 새로 개발된 모델을 이달 말부터 보이스피싱 사기범 목소리 감정에 활용한다. 현재 보유 중인 약 1만 개의 보이스피싱범 음성데이터를 분석하여 범죄조직 그룹화와 이미 검거된 범죄자의 여죄 추궁 등에 사용한다.
경찰청과도 모델을 공유해 초동수사의 속도와 검거율을 높이는데 활용하고 기관사칭, 전세사기 등 다양한 음성관련 범죄 수사 전반에 적용해 나갈 예정이다.
아울러 새로운 모델로 분석한 보이스피싱범의 음성은 금융감독원 홈페이지에도 공개해 경각심과 사전예방 수준도 높여나갈 계획이다.
한창섭 행안부 차관은 "새로 개발된 보이스피싱 음성분석모델은 데이터 분석을 통해 사회현안을 해결하는 디지털플랫폼정부의 구체적 성과물"이라며 "데이터 기반의 일 잘하는 정부구현을 위해 국민이 필요로 하는 분석과제를 발굴하고, 분석된 결과를 현장에 적극 활용해 나갈 것"이라고 밝혔다.