북한 연구진이 영화 아이언맨, 어벤저스, 해리포터, 스타워즈 등의 사진 자료를 인공지능(AI)으로 분석해 사진, 영상 속 인물의 나이를 추정하는 기술을 개발한 것으로 알려졌다.

대북 소식통에 따르면 김일성종합대학은 최근 홈페이지를 통해 곽혁 김일성종합대학 첨단기술개발원 연구원의 ‘중첩신경망을 이용한 얼굴화상의 나이추정을 위한 근방손실함수’ 연구 내용을 소개했다.

북한 연구진은 중첩신경망을 Convolutional Neural Networks로 표기했다. 이 CNN은 동영상 분석 등에 많이 쓰이는 인공지능(AI) 기술이다.

대학은 화상분류, 얼굴인식과 관련 컴퓨터 시각 응용 분야 선행 연구에서 노화 특성, 나이 등에 대한 부분이 제대로 연구되지 못했다고 설명했다. 이에 곽혁 연구원이 중첩신경망을 활용해 나이를 추정하는 기술을 연구했다는 것이다.

나이 추정을 위한 전체적인 시스템은 얼굴 정렬 및 전 처리, 중첩신경망 모형, 나이값 예측으로 구성됐다고 한다.

대학 연구진은 제안한 방법에 의한 얼굴 화상의 나이추정 제안한 방법들을 파이썬(python)과 텐서플로(Tensorflow, 머신러닝을 위한 오픈소스 소프트웨어)로 구현했으며 4개의 엔비디아(NVIDIA) Titan XP GPU를 이용해 학습했다고 한다.

북한 연구진은 이 내용의 논문을 국제 학술잡지 ‘ICTACT Journal on Image and Video Processing’에 투고한 것으로 알려졌다.

NK경제는 북한 연구진이 국제 학술잡지에 투고한 해당 논문을 입수했다.

논문 제목은 ‘NEIGHBORHOOD LOSS FOR AGE ESTIMATION FROM FACE IMAGE USING CONVOLUTIONAL NEURAL NETWORKS’이며 곽혁 이외에 온철남, 한일, 김장수 등이 공동 저자로 돼 있다.

북한 연구진이 활용한 IMDB의 사진
북한 연구진이 활용한 IMDB의 사진

북한 연구진들은 영어 논문에서 자신들이 IMDB 및 WIKI의 데이터셋을 이용했다고 밝혔다.

연구진은 IMDB와 WIKI에는 각각 46만1871개의 이미지와 6만2359개의 이미지가 포함돼 총 52만4230개의 이미지가 있었지만, 일부 잘못된 샘플이 있어서 두 데이터를 병합하고 마이크로소프트(MS) 페이스(Face) 응용프로그래밍인터페이스(API)를 통해 수정했다고 설명했다.

북한 연구진은 IMDB, WIKI 데이터 습득 경로도 밝혔다. 이에 NK경제에서는 북한 연구진이 밝힌 IMDB 데이터 6.2기가바이트 46만장 사진, WIKI 데이터 728메가바이크 6만2000장 사진을 확보해 분석했다.

IMDB 데이터는 미국의 영화 정보 모음 사이트 IMDB의 사진들로 구성돼 있다. WIKI 데이터는 위키 백과 사진 데이터다.

북한이 AI 학습에 활용한 IMDB 데이터에는 미국을 비롯한 전 세계 영화배우들의 사진들이 담겨있었다. 아이언맨 시리즈, 어벤저스 시리즈, 해리포터 시리즈, 반지의제왕 시리즈, 스타워즈 시리즈 등 유명 영화 속 인물 사진들이 포함돼 있다. 빅뱅이론, 프렌즈 등 유명 드라마 관련 사진들도 들어있다.

북한 연구진이 활용한 IMDB의 사진
북한 연구진이 활용한 IMDB의 사진

특히 한 인물이 과거부터 최근까지 촬영한 영화 속 사진들이 나열된 것이 특징이다. 예를 들어 배우 로버트 다우니 주니어의 경우 2008년 아이언맨, 2008년 트로픽썬더, 2009년 셜록홈즈, 2010년 아이언맨2, 2012년 어벤져스 등에 등장했던 사진들이 데이터에 포함돼 있다. 이처럼 많은 배우들의 과거부터 최근까지 사진이 포함돼 있기 떄문에 나이 분석을 하는데 활용된 것으로 보인다. 

WIKI 데이터에는 전 세계 유명 인사들의 사진들이 포함돼 있다. 대표적으로 윌리엄 윈저 영국 왕세자가 있다. 이외에도 유명 기업인, 정치인들의 사진이 들어있다.

이 연구 내용을 통해 북한이 해외 데이터셋을 활용해 다양한 AI 연구를 하고 있다는 점을 확인할 수 있다.

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

저작권자 © NK경제 무단전재 및 재배포 금지