North Korea tests imbalanced data analysis with YouTube data

 북한 연구원들이 해외에 투고한 논문 내용

북한 연구원들이 익스트림러닝머신(ELM)로 불균형(비대칭) 데이터를 분석하는 방안을 연구하면서 유튜브 데이터를 활용할 것으로 알려졌다.

대북 소식통에 따르면 북한 김일성종합대학 홈페이지에 6월 25일 리종혁 김일성종합대학 첨단기술개발원 연구원이 작성한 글이 2건 게재됐다.

글은 ‘불균형학습을 위한 G_mean에 기초한 극단학습기’과 ‘혼합비용함수에 기초한 극단학습기’이다.

글은 극단학습기 연구에 대한 내용을 소개하고 있다. 극단학습기는 Extreme Learning Machine(ELM)을 뜻한다. 김일성종합대학은 ELM이 단층앞방향 신경망 학습을 위한 이론적으로 간단하고 속도가 빠른 기계학습알고리즘으로 최근 수 년 간 여러 실천적인 문제들에 널리 적용됐다고 설명했다.

북한 연구원은 ELM이 균형 자료에 대해서는 효과적이지만 불균형 자료에 대해서는 좋은 결과를 얻을 수 없다고 주장했다. 고전적인 ELM이 최량화의 관점에서 각이한 클라스들에 대해 균형적인 클라스 분포나 같은 오분류 비용을 가정하기 때문이라고 한다.

북한 연구원은 불균형자료학습에 대한 ELM의 약점을 극복하기 위해 불균형 학습에서 평가척도로 널리 이용된 G-mean에 기초해 ELM 최량화 문제의 새로운 비용함수를 정의하고 이에 기초해 새로운 알고리즘을 개발했다는 것이다.

북한 연구원들은 유튜브(YouTube)-8M자료기지(DB)에서 실험을 진행해 제안된 방법이 높은 정확도를 달성할 수 있다는 것을 확인했다고 한다. 테스트용 불균형 자료로 유튜브 자료를 이용했다는 것이다.

글은 이 연구결과가 국제잡지 ‘Digital Signal Processing’에 ‘G-mean based extreme learning machine for imbalance learning’라는 제목으로, 국제잡지 ‘International Journal of Machine Learning and Cybernetics’에 ‘Extreme learning machine with hybrid cost function of G‑mean and probability for imbalance learning’라는 제목으로 출판됐다고 소개했다.

북한 연구원들은 앞으로 클라스 불균형 문제를 풀기 위해 ELM의 비용함수를 더 효과적으로 개선하고 불균형자료모임의 분포성질에 따라 효과적인 학습알고리즘을 연구할 것이라고 한다.

강진규 기자  maddog@nkeconomy.com

* 독자님들의 뉴스레터 신청(<-여기를 눌러 주세요)이 NK경제에 큰 힘이 됩니다. 많은 신청 부탁드립니다.

 

 

저작권자 © NK경제 무단전재 및 재배포 금지