[생각] 번역 시스템을 위해 학습형 AI가 필요한 이유



※전문적인 내용을 담고 있는 글은 아니며 일반적인 견해를 담은 글임을 시작에서 밝힙니다.

1. 개요


지금은 꽤나 시간이 지나 과거가 되어 버린 알파고라는 인공지능의 대국 이후의 세상이다. 딥러닝이라는 AI 학습기술이 요즘 시대에 엄청난 영향력을 떨치고 있다. 기업들은 딥러닝이라는 기술을 이용하기 위해서 엄청난 개인 정보들을 취득하고 있다. 흔히들 언급되는 빅데이터를 모으기 위해서 혈안이 되어 있다. AI에 관한 위험성은 과거로 보자면 망망 대해로 배를 타고가던 대항해시대 선원들의 생각날 정도이다.

다행이 아직까지는 싱귤렐리티 특이점이 오지는 않은 듯 하다. 이미 특이점이 왔으나 느껴지지 않는 것일까? 이미 인공지능의 명령이나 도움을 받아 세상이 조정당하고 있을 수도 있는 노릇이다. 그렇다 하더라도 우리는 인공지능의 속뜻을 알 수 없으니 진실은 저 너머에 있다. (참조 : [유튜브 영상 리뷰] 1분과학, 인공지능에 대해 우리가 간과하고 있는 무서운 사실! (특이점이 온다) – 2017. 1. 17.)



요즘 많이들 느끼고 있겠지만 AI를 이용한 번역 시스템이 개발되고 적용되고 있는 듯하다. 나는 완벽한 번역 시스템은 불가능 하다는 입장이다. 그렇다 하더라도 인간이 생각하기에 완벽하지는 않아도 인간 수준의 번역 수준을 만족할 만한 번역 시스템은 스스로 학습할 수 있어야 가능해 보인다.

이에 관한 근거와 연관된 이야기를 해보고 싶어서 글을 쓰게 되었다. 다만 번역 시스템에 대한 지식이 없고 그냥 저냥 관찰자로서 언어 번역에 관한 개인적인 생각을 적어보는 것이니 전문적인 내용은 아니라는 점을 알아 주었으면 한다.

2. 본문


2.1. 번역의 어려움 : 언어의 특성


왜 완벽한 변역 시스템이 불가능 하다고 말했는지 아마 독자들도 알고 있을 것이다. 그 이유는 언어의 여러 특성 중에서 역사성을 뽑고 싶다. 왜 완벽한 번역을 못하게 되는지에 관한 증거이다. 내가 살아온 기간만 하더라도 언어라는 것은 그 시대의 문화와 살아가는 사람에 따라서 달라졌다. 또한 사용하는 단어도 새로이 추가되고 사용되었던 단어도 서서히 사라졌다.

또한 같은 단어라도 그 의미와 느낌이 완전히 변화하기도 했다. 같은 단어라도 세대에 따라서 환경에 따라서 그 의미와 느낌이 천차만별이라 할 정도로 다르다. 장소와 시간이 같은 언어라 하더라도 언어에 변화를 만든다.



그러므로 언어를 번역하기 위해서는 그 언어를 쓰는 사람들과 밀접하게 관계를 맺고 그들의 언어를 습득하고 그들이 갖는 느낌과 사용 방법을 지속적으로 수정해 나가야 한다. 또한 그들이 모르는 단어에 대한 설명을 종합해서 알맞은 의미를 가진 형태로 이해하고 있어야 번역이 가능한 것이다.

번역기는 스스로 비슷한 시간대와 사회 속에서 언어를 학습해야지 인간 수준의 번역을 영원히 이뤄갈 수 있다는 것이다. 그런 이유에서 지속적으로 자기 스스로 학습할 수 있는 언어 번역 프로그램이 있다면 이는 인간 수준에서는 완전한 번역을 이룰 수 있을 것으로 보여진다. 인간이 완벽하지 않기 때문에 번역 프로그램도 그 수준에서 완전한 것이다.

흔히 언어의 특성을 들어 봤을 것이다. 기호성, 자의성, 역사성, 창조성, 규칙성, 사회성, 추상성, 분절성 등이 있다.



창조성이라는 특징은 완벽한 번역을 하기 위해서는 습득되지 않은 단어에 대해서도 지속적으로 기록을 하고 확인 받는 작업을 해야한다는 것을 의미한다. 최근 느끼는 공학적 감으로는 딥러닝 기술이라는 인공지능의 학습 시스템은 인간의 언어를 학습시키는 것에도 역할을 할 수 있어 보인다.

다만 스스로 언어를 창조할 수 있는 인간의 영역까지 침범할 수 있게 작동하게 된다면 번역 기능에는 오히려 문제가 발생할 수 있어 보인다. 또한 중요한 것은 사라져가는 언어도 언어를 학습하는 AI에게 중요한 요소로 작용하리라 생각된다.

다만 개인적으로 번역 기능을 벗어나 인공지능을 하나의 객체로서 인정하고 언어를 발전 시키는 것도 재미 있을 듯 생각된다. 인공지능이 새로이 만들어 내는 단어와 의미를 음미하고 그 단어를 사용하는 인류를 생각해보자 흥미롭지 않은가?

2.2. 번역과 더불어 언어에 관해


한편 언어를 이해한다는 것은 인공지능이 어느 수준까지 인간의 영역에 들어섰다는 것을 인정할 수밖에 없어 보인다.

우리가 단어를 보고나 듣거나 하면서 느꼈던 신체적 변화 및 상태의 기록이 그 언어가 가진 자신의 의미일 것이다. 언어에는 감정이 담겨있다 그 감정은 과거에 특정 단어가 사용되었던 상황에서 자신이 느꼈던 감각의 기록이다.

우리가 말이 통하지 않는 외국인과 어떻게 교감을 할 수 있느냐가 번역의 시작일 것이다. 외국인과의 신체적 감각적 동질감이 없으면 우리는 언어의 번역을 시작 할 수 없었을 것이다. 똑같은 음식을 먹고 비슷한 맛을 느낄때 표정을 보고 서로의 감정에 대한 단어를 교환하는 식으로 각 언어의 번역이 이뤄진다.



사과의 색을 보고 그 같은 것에 대해서 국어로는 빨강, 영어로는 Red로 각자가 공통된 감각을 서로 다르게 표현하고 이에 관해서 맞추는게 번역의 근본일 것이다. 그 감정은 미묘하게 문화에 따라서 다를 수도 있으면 외국에서는 표현되지 않는 표현도 표현될 가능성도 있다. 번역의 시작은 구상어로 시작함은 분명하다.

그나마 인간으로서 비슷한 느낌을 받게 되는 생물적 특징이 있음을 예상할 수 있기에 추상어로도 그 해석이 옮겨갈 수 있고 이에 관한 번역이 이루어 질 수 있어 보인다.

그에 비해 외계인과 대화를 한다고 가정해 보자 그들과는 대화를 시작하기 위해서는 비언어적인 것부터 시작해야 할 것이다. 일단은 자연에 관한 것부터 공통되는 것에 대한 언어의 교환이 시작될 것이다. 구상어로는 어느 정도 이해와 번역이 가능하리라 보인다.

하지만 같은 감각을 공유하지 못하기 때문에 서로 다르게 인식하고 우리가 가지는 느낌과 다른 느낌을 같은 단어로 여길 수 있어 오해를 가지 울 수도 있다.그럼에도 표면적인 범위에서는 의견 교환도 이뤄질 수 있지 않을까 생각된다. 어쩌면 동물과의 교감 정도로 어려울 수도 있겠다.

무지개의 색의 갯수도 나라마다 다르다고 하지 않는가? 이런 부분에서는 언어라는 것은 생각과 느낌이라는 것에 틀을 만드는 행위로 보인다.



전문가가 아니기에 언어에 관해서 깊은 내용으로는 접근하기가 까다롭다. 그럼에도 개인적인 생각으로 인간을 이해해야 보다 완전에 가까운 번역이 가능해질 것으로 보인다.

2.3. 1개의 번역만 보여주는 시스템은 옳지 못하다.


완벽한 번역 시스템은 불가능 하다고 했지만 인간이 하는 실수 정도로 문제를 일으키는 번역 시스템은 가능하지 않을까 생각된다. 또한 한 개체의 번역 시스템에 맡기는 것이 아니라 여러 번역 시스템의 결과를 종합하게 보여주는 식으로 해서 오류를 번역을 받아 보는 사람이 평가 할 수 있는 시스템이 된다면 더욱 완벽해지지 않을까 생각된다.

또한 어느 정도 학습 유연성을 지니고 있어야 하는 지도 중요할 것이다. 우리도 신조어에 대해서 알게 되더라도 이를 사용할지 의미가 정확한지에 대해서도 확신을 못가질때가 많다. 빈도수가 적다고 생각되는 단어에 관해서는 굳이 깊게 이해할 필요는 없어 보인다. 그럼에도 지속적으로 번역을 원하는 사람과 의견 교환 식으로 빈도가 높아지고 이해가 윤각이 잡히면 우선 순위를 갖추는 방법으로 진행하면 될 것 같다.



현재 인터넷 검색 사이트들은 사람들의 검색 키워드들을 받아 보고 있지만 번역 시스템을 완전하게 만들기 위해서는 사람들이 사용하고 있는 단어와 문법에 대해서 자가 학습을 하는 시스템을 구축할 필요가 있어 보인다. 근미래에 이것이 이뤄질지는 솔직히 애매한 거 같다. 가능할 것 같기도 하고 아니기도 하다.

개인적으로 완전한 번역 시스템이 가능하기 위해서는 세계 곳곳에서 번역 시스템을 학습 시키는 동작이 작동 되고 있어야 한다. 또한 번역되는 답이 단 하나라고 생각하면 안된다. 여러가지 답이 나올 수 있고 그에 여러가지 번역 결과에서 각 번역 결과에 선택 확률을 표기하는 식으로 그 번역 결과에 대해서 신뢰 정도로 표시하는 식으로 번역이 이뤄지면 지금 단계에서 상상할 수 있는 미래 번역 시스템이다.



혹시 모르지만 현재에도 인터넷 글이나 댓글을 통해서 언어를 습득하고 있는 인공지능이 있다고 보아도 될 것이다. 없으면 솔직히 개인적으로 좀 실망일 것이다. 더 나아가 인터넷 생태계가 아니라 현실인 물질 세계에도 출현해서 우리와 대화를 하고 언어에 대해서 학습을 하고 세상을 보고 느낌과 의미를 학습하는 인공지능이 존재 한다면 보다 완전한 번역 시스템이 가능하리라 생각된다.

3. 마무리


선행 되어야 하는 기술이 무엇인지 정확히 감을 잡는 것도 애매하다. 인간 수준의 인공지능이 완성된다면 당연히 번역 시스템은 완전하게 완성될 것이라는 것은 의심의 여지가 없을 것이다. 그렇지만 인공지능이 인간 수준으로 올라오지 않는 상태에서도 과연 번역 시스템이 완전하게 돌아갈 시스템을 구축 할 수 있을까가 의문인 것이다. 인간 수준으로 올라온 인공지능은 이미 우리의 생각 수준을 뛰어 넘는 상태라 논외의 대상임은 다들 인정할 것이라 생각한다.



여러 고양이나 개의 사진을 보고 대상물을 구별하는 것이 언어 습득과 결코 무관하지 않다는 것을 알 수 있을 것이다. 그것이 언어의 시작이라고 할 수 있다.

이상으로 내가 생각하는 완벽한 번역 시스템은 불가능하지만 인간 수준까지는 작동할 수 있는 번역 시스템 가능하리라 보는 글을 적어보았다. 긴 글을 읽어 주어서 고맙다. 당신의 앞길에 행운이 있길 바란다.

구독
통지
0 댓글들
인라인 피드백
모든 댓글 보기