북한이 인공지능(AI) 기술을 활용해 영상 속에 사람이 말하는 입 모양으로 대화 내용을 파악하는 기술을 연구하고 있는 것으로 보인다.

11월 6일 대북 소식통에 따르면 북한 과학백과사전출판사가 발행한 정보과학 2020년 1호에 ‘ 심층신뢰망을 이용한 입놀림 화상의 특징파라메터 생성 방법’이라는 글이 수록됐다.

이 글은 인공지능 기술인 심층신뢰망 기술을 활용해 입의 움직임을 파악하는 내용을 담고 있다.

글은 “입놀림 합성에 많이 이용되는 숨은 마르코브 모형에 기초한 방법과 단위 선택 방법은 지나친 평활화에 의해 합성되는 입놀림 화상이 흐려지는 결함을 가진다”며 “여기서는 지나친 평활화를 완화시키기 위한 한 가지 방법으로서 심층신뢰망(Deep Belief Network)을 이용해 입력되는 본문의 문맥 특징과 입놀림 화상 특징 사이의 결합 분포를 모형화 하는 한 가지 방법을 소개한다”고 설명했다. 이것은 영상에 입의 움직임을 파악해 그 사람이 무슨 말을 하고 있는지 알아내는 연구로 보인다.

이 기술을 개발하면 녹음기가 없어도 말하는 내용을 기록, 파악할 수 있다. 또 멀리 떨어져 있어서 소리가 들리지 않는 곳에 위치한 사람이 무슨 이야길 하는지 확인할 수도 있다. 반대로 가상 캐릭터가 자연스럽게 말하는 모습을 연출할 수도 있다.

글은 실험을 통해 심층신뢰망을 이용한 입놀림 화상 생성방법의 효과성을 확증했다고 주장했다. 개발한 기술을 실행해 봤고 실제로 성능이 입중됐다는 것이다.

이글을 통해 북한이 인공지능 기술을 다양한 영상 분석에 활용하고 있다는 것을 알 수 있다. 북한은 사람의 움직임을 인식하는 기술, 안면 인식을 통한 출입통제 기술, 특정 공간의 이상 징후를 확인하는 기술 등 영상분석 연구에 매진하고 있다.

강진규 기자  maddog@nkeconomy.com

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

관련기사

저작권자 © NK경제 무단전재 및 재배포 금지