출처: 김책공대
출처: 김책공대

북한 김책공업종합대학은 윤철성 정보과학기술학부 연구사가 중첩신경망모형과 적응척도융합모형을 결합한 동화상 자막 본문 검출 모형과 중첩신경망 모형과 쌍방향 LSTM 모형을 결합한 자막 본문 인식 모형을 설계하고 실현했다고 11월 10일 홈페이지를 통해 밝혔다.

LSTM은 Long Short-Term Memory 죽 장단기기억신경망으로 순환 신경망(RNN)의 한 종류로 알려져 있다.

대학은 전통적인 문서 화상에서의 본문 인식과 달리 배경이 복잡하고 서체의 크기와 색이 각이하며 본문과 배경 사이의 대조도가 낮고 동화상에서 자막 본문들의 위치가 동화상마다 서로 다른 것으로 인해 동화상 자막 본문 인식이 화상 처리와 인공지능 분야에서 어려운 문제 중 하나 되고 있다고 설명했다. 이런 인자들로 인해 이미 개발된 문서 화상에 대한 문자인식 방법으로는 동화상 자막 본문에 대한 인식에 그대로 적용할 수 없다는 것이다.

이런 문제를 해결하기 위해 본문 검출과 인식을 다같이 진행할 수 있는 통합된 모형들도 제안됐지만 이 방법들은 이미 학습시키지 않은 단어들이나 임의의 문자들의 열들에 대한 인식에서 인식률이 높지 못한 결함이 있다고 한다.

이를 개선하기 위해 윤철성 연구사가 개발한 방법은 동화상에서 자막 본문 검출 정확도가 93.4%이고 자막 본문 인식 정확도가 94.6%로서 선행한 방법들에 비해 우월하다는 것을 확증했다고 밝혀다.

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

 

저작권자 © NK경제 무단전재 및 재배포 금지