북한의 음성인식 제품 모습

북한이 인공지능(AI) 기반 문자인식 기술과 음성합성 기능을 이용해 시각장애인들을 위한 음성낭독기를 개발한 것으로 알려졌다.

10월 16일 대북 소식통에 따르면 김일성종합대학은 홈페이지를 통해 문서인식낭독기를 개발했다고 10월 14일 밝혔다.

대학은 “김일성종합대학 정보과학부 연구집단이 지난 20년 간 문자인식과 음성합성 기술에 대한 연구를 진행해 왔으며 그 연구 성과에 기초해 문서인식낭독기를 개발했다”며 “문서인식낭독기는 수자식(디지털)사진기로 입력한 문서화상을 컴퓨터 본문 문서로 자동변환하고 인식결과 본문을 음성합성의 방법으로 낭독함으로써 사람이 책을 보고 읽을 수 있는 기능을 컴퓨터로 실현한 것이다. 다시 말해 문자인식과 음성합성이 통합된 체계”라고 설명했다.

대학은 문서인식낭독기 개발에서 중요한 것이 문자인식의 인식 정확도와 음성합성에서 사람의 억양을 그대로 모방할 수 있도록 합성음의 질을 높이는 것이라고 주장했다. 대학 연구원들은 디지털사진기로 입력한 한글인쇄 문서에 대해 99% 이상의 높은 인식 성능을 가지는 문자인식체계를 개발해 문서인식낭독기에 이용했다고 밝혔다.

북한이 개발한 문서인식낭독기는 문서화상전처리부, 인식부, 낭독부로 구성돼 있다고 한다. 이 기기는 디지털사진기로 입력된 문서화상을 높은 정확도로 인식하기 위해 화상전처리부에서 보정을 진행한다고 한다. 그리고 인식부에서 문서화상으로부터 본문행 추출과 문자분리방법을 이용해 개별문자 화상을 추출하고 그것을 인식한다는 것이다. 이후 낭독부에서는 인식부에서 출력되는 인식결과 본문으로부터 음성을 합성해 그것을 낭독한다고 한다.

대학은 음성합성이 HMM(Hidden Markov Model)에 의한 음성합성법 즉 음성 특징량을 HMM들로 모형화하고 그 HMM들로부터 합성음을 생성하는 통계적 파라미터 음성 합성을 진행한다고 소개했다. 또 HSMM을 이용해 스펙트르, 피치, 지속을 함께 모형화해 합성음의 자연성을 높이고 음성잔차 신호를 모형화하고 대역분산모형추정과 대역분산을 고려한 음성 파라미터를 적용해 합성음질을 개선한다는 것이다.

대학은 문서인식낭독기가 문건을 많이 보는 문서원들과 시력이 좋지 못한 사람들 특히 노인, 시각장애자들에게 독서의 편리성을 보장해주는데 널리 이용되고 있다고 설명했다.

대학은 오늘날 디지털사진기가 내장된 지능형손전화기(스마트폰)가 광범히 사용됨에 따라 문서인식낭독기의 응용범위는 더욱 커지고 있다고 주장했다. 대학은 연구원들이 앞으로 인공지능 분야에 대한 연구를 더욱 심화시켜 문서인식낭독기의 성능을 계속 개선나갈 것이라고 밝혔다.

강진규 기자  maddog@nkeconomy.com

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

저작권자 © NK경제 무단전재 및 재배포 금지