북한이 기존에 소프트웨어(SW) 기반 번역에서 벗어나 네트워크를 기반으로 한 번역 서비스를 연구하고 있는 것으로 알려졌다.

10월 1일 대북 소식통에 따르면 김일성종합대학이 발행한 김일성종합대학 학보 정보과학 2020년 제66권 제2호에 ‘망(네트워크) 환경에서 기계번역용 자료기지의 실시간 통합방법'에 관한 논문이 수록됐다.

논문은 “대규모의 기계번역용 자료기지(DB) 구축의 속도와 정확성, 효율성을 높이기 위해 많은 개발자들이 망(네트워크) 환경에서 자료기지에 대한 수정 결과를 실시간으로 통합하기 위한 한 가지 방법을 제안했다”고 설명했다.

북한은 인공지능(AI) 기술 등을 이용한 번역 프로그램을 오래 전부터 개발해 왔다. 그런데 그 프로그램들은 PC나 IT기기에 설치해서 사용하는 형태였다. 그런데 이 논문에서 설명하는 것은 네트워크를 기반으로 한 번역 서비스와 그것을 지원하는 대규모 데이터베이스(DB) 구축에 관한 내용이다. 구글 번역, 네이버 파파고 등과 같은 네트워크 번역 서비스를 만들겠다는 것이다. 

논문은 “기계번역 체계에서 번역의 정확성을 개선하기 위한 개발과정에는 여러 가지 종류의 사전을 비롯한 대규모의 자료기지들을 검사, 수정하거나 새로 구축해야 할 필요성이 자주 제기된다”며 “입력 언어의 형태 단어사전으로부터 두 언어병렬 코퍼스에 이르기까지 그러한 자료기지의 종류는 다양하다. 그 공통적인 특징은 규모가 방대하고 많은 번역 전문가들이 참가할 것을 요구한다는 것이다”라고 지적했다.

논문은 대규모 DB 구축과정에는 개별적인 개발자들에게 작업 대상을 분할해주고 그들의 구축결과를 통합하는 문제가 필수적으로 제기된다고 주장했다. 또 논문은 세계적으로 인터넷을 이용해 많은 개발자들을 대규모 DB구축에 참여시키는 것이 하나의 효과적인 DB 구축방식이 되고 있다고 전했다.

논문 저자들은 자신들이 연구한 번역을 위한 네트워크 DB 구축 방법을 독일어-한글 번역에 적용해 봤다고 한다.

논문은 “실시간 통합체계를 구축하고 도입한 결과 망 환경에서 여러 개발자들이 문장번역 실험 과정에 진행하는 독일어-한글 숙어 번역 패턴 DB에 대한 수정작업을 실시간으로 통합하면서 개발을 진행할 수 있다는 것을 검증했다”고 밝혔다.

북한에서 올해 5월 네트워크(북한 내부 인트라넷) 기반 번역 서비스가 나왔다는 소식이 전해졌다. 북한판 구글 번역? 인트라넷에서 번역 서비스 제공 북한에서는 이를 위한 연구가 계속 진행 중인 것으로 추정된다. 

강진규 기자  maddog@nkeconomy.com

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

저작권자 © NK경제 무단전재 및 재배포 금지