북한이 딥러닝 기술을 스마트스피커(Smart Speaker)에서 음성을 인식하는데 적용하고 있는 것으로 알려졌다. 

대북 소식통에 따르면 김일성종합대학이 발행한 학보 정보과학 2022년 제68권 제2호에 ‘매몰형 장치에서 중첩신경망을 이용한 음성강조’라는 논문이 수록됐다.

논문은 “지능형고성기와 같이 잡음세기가 높은 조건에서 정확한 잡음모형을 추정하는 것은 어려운 문제로 나서고 있다”며 “최근 잡음모형을 모형화하지 않고 심층신경망을 이용해 잡음 섞인 음성으로부터 깨끗한 음성을 얻는 방법들이 연구되고 있다”고 전했다.

지능형고성기는 북한에서 스마트스피커를 뜻하는 용어다. 논문은 영어 설명에서 지능형고성기를 Smart Speaker로 번역했다.

스마트스피커는 음성 명령을 인식해 음성으로 정보를 전달하거나 네트워크로 연결된 기기들을 작동한다. 음성을 인식할 때 주변 잡음이 있을 수 있는데 북한 연구진들은 인공지능 딥러닝 기술로 이를 해결한 것으로 보인다.

논문은 “선행 연구방법들에서는 심층신경망의 파라메터수가 많기 때문에 매몰형 장치들에서 실시간 처리를 진행하는데서 제한을 받고 있다”며 “중첩신경망은 재귀신경망(RNN: Recurrent Neural Networks)보다 적은 수의 파라메터를 이용하며 음성인식에서의 특징량 추출과 화상잡음 제거에서 효과적으로 이용된다”고 설명했다.

이에 논문에서는 지능형고성기를 비롯한 매몰형 장치에서 중첩신경망(CNN: Convolutional Neural Network)을 이용한 잡음제거방법을 제안하고 효과성을 확증했다는 것이다.

북한 연구진은 5000개의 음성자료와 200개의 잡음자료를 실험에 이용했다고 한다. 논문은 결론에서 매몰형 체계에서 중첩신경망을 이용한 음성잡음 제거 방법을 제안해 음성만을 강조하는 방법을 실현했다며 지능형고성기로 수집한 음성자료를 이용해 충분한 성능을 얻을 수 있다는 것을 확증했다고 밝혔다.

북한은 지난 2018년 음성인식 AI 스피커를 개발했다고 밝혔으며 2019년 이를 시현하는 모습을 공개하기도 했다. 2020년에는 스마트스피커 성능을 개선하고 있다는 소식이 전해기지도 했다. 북한은 스마트스피커 성능을 계속 개선하고 있는 것으로 보인다.

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

 

저작권자 © NK경제 무단전재 및 재배포 금지