북한이 검색 이력 등을 통해 개인 맞춤형 검색 서비스를 제공하는 방안을 연구하고 있는 것으로 알려졌다. 

11월 10일 대북 소식통에 따르면 북한 과학백과사전출판사가 발행한 정보과학 2020년 1호에 ‘사용자 흥미도에 기초한 웹 페이지의 발굴방법’이라는 내용이 수록됐다.

글은 “선행 문헌들에서 제기한 검색 이력에 의한 사용자 흥미발굴 방법은 흥미 척도가 정확히 설정되지 못하고 흥미 정도에 대한 계산 정확도가 낮다”며 “논문에서는 웹 페이지들에 대한 사용자 흥미도를 이용해 사용자가 흥미를 가지는 페이지들을 효과적으로 발견할 수 있는 웹 발굴방법을 제기한다”고 설명했다.

즉 개인이 어떤 분야, 어떤 내용이 관심이 있는지를 분석해 검색을 했을 때 그에 적합한 결과를 보여준다는 것이다. 이는 한마디로 개인 맞춤형 검색이라고 볼 수 있다.

글은 사용자 흥미 화일이 웹 페이지들에 대한 사용자 흥미정도를 통계적으로 기록하는 파일이며 사용자 흥미도 계산을 위한 학습 자료로 이용된다고 설명했다. 사용자의 활동 내역을 데이터베이스(DB)화 해 분석하는 것으로 보인다.

글의 내용을 보면 북한 연구원들은 페이지 제목을 기반으로 사용자가 흥미를 보이는지, 흥미를 보이지 않는지를 분석해 결과 표시에 반영하는 것으로 추정된다. 
글은 연구 내용을 실험했는지 그리고 실제 서비스에 적용했는지에 관한 내용은 소개하지 않았다. 방법론에 대해서만 설명했다.

북한은 주민들의 인터넷 사용을 제한하고 있다. 대신 인트라넷이라는 내부망을 주로 활용한다. 북한 연구원들이 연구하는 개인 맞춤형 검색도 인트라넷에 적용될 것으로 예상된다. 북한에서 이런 연구가 진행된다는 것을 통해 인트라넷 사용자들이 많아지고 있고 인트라넷 사이트와 정보도 많아지고 있다는 것을 알 수 있다. 

한편 이 글을 통해 북한이 검색 금지어를 운영하고 있다는 점도 엿볼 수 있다. 글에는 “특징용어는 웹 페이지 제목에서 표준형태부해석방법으로 추출한 용어들 가운데 금지어 모임 stopws에 속하지 않는 용어들이다”라고 내용이 나온다. 검색과 관련해 금지어 목록을 운영하고 있는 것으로 추정된다.

강진규 기자  maddog@nkeconomy.com

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

 

저작권자 © NK경제 무단전재 및 재배포 금지