마이크 슈스터 구글 브레인 박사 “그래도 언어를 배워야한다”

2017년 2월 구글코리아가 개최한

‘신경망 기계번역 포럼’에 다녀왔습니다.

이야기들음

“2016년 11월이었죠?

무슨 기술 덕분에 구글 번역기가

한국어를 예전보다 훨씬 정확하게

번역하게 됐다고 발표했던 때요!”

기본_수정

“네. 그 기술은 ‘신경망 기계번역(NMT)’이죠.

원래 기술은 ‘구문단위 번역(PBMT)’이었습니다.

단어, 구문 단위로 끊어서 문장을 번역했습니다.

하지만 NMT론 (사람처럼) 통번역할 수 있죠”

“PBMT가 추측, NMT는 배움입니다.

배워서 다른 문장 번역에도

써먹을 수 있다는 이야기죠”

(참조! – “인공지능으로 103개 언어 장벽 허물겠다”)

구글은 이 기술을 16개 언어,

8개 언어 조합에 우선 적용했습니다.

기존 구글 번역기는 103개 언어를

번역할 수 있었으니까 87개 언어를

번역하는 데엔 아직 PBMT를 씁니다.

barak-1024x832

(버락 투로브스키 총괄, 사진=구글코리아)

그래서 구글 번역 매니지먼트 제품총괄

버락 투로브스키는 NMT를 적용할 수 있는

언어 개수를 늘리는 것이 미션이라고 했죠.

미션을 빠르게 달성하기 위해

구글이 내놓은 비밀병기는

‘다중 언어 트레이닝’이었습니다.

포럼에선 이 기술을

소개하는 데에 초점을 뒀네요.

(마이클 슈스터 박사, 사진=구글코리아)

(마이클 슈스터 박사, 사진=구글코리아)

 

구글에서 인공지능 기반기술을

연구하는 ‘구글 브레인’ 그룹 소속의

마이크 슈스터 박사와 화상연결했습니다.

그는 한국어, 일본어 음성인식

모델의 메인 개발자기도 합니다.

그는 다중 언어 트레이닝을 하면

하나의 언어를 하나의 모델로 훈련시켜서

다양한 언어로 번역할 수 있다고 했습니다.

훈련 예시를 움짤로 공개했습니다.

 

우선 번역기를 훈련시킬

영어, 한국어, 일본어 데이터가 있네요.

이중 영어->한국어와 한국어->영어,

영어->일본어, 일본어->영어 데이터는

훈련하기 충분하게 수집, 분석했습니다.

하지만 한국어와 일본어 데이터는 부족하죠.

그랬을 때 다중 언어 트레이닝을 하면

영어-한국어, 영어-일본어 조합으로만

번역기를 훈련시켜도 한국어-일본어

조합을 번역할 수 있다는 겁니다.

‘제로샷 번역’이라 합니다.

하나의 언어(영어)를 하나의 모델로

훈련시켜서 다양한 언어(한국어, 일본어)

로 번역할 수 있는 거죠.

현재까지 영어와 프랑스어, 독일어,

스페인어, 포르투갈어, 중국어, 일본어,

한국어, 터키어에 적용됐습니다.

이 기술을 사용한 이유는

 효율적으로 번역하기 위해섭니다.

구글 번역기는 5억명 이상이 사용하고

매일 천억회의 번역을 하는 글로벌 서비스죠.

버락 투로브스키가 밝혔다시피,

데이터 등 자원을 최대한 적게 사용해서

빠르게 번역가능한 언어 수를 늘려야 합니다.

궁금_수정

“잠깐, 대단한 기술인 건 알겠어요.

근데 결국 번역기의 완성형은

‘여러 언어를 빠르고 정확하게’잖아요”

“구글은 이 대단한 기술을 사용해서

‘빠르게’에 일단 집중하는 거네요”

둘 중 하나만 추구하는 건 아니지만,

지금까지의 모습을 보면 그런 것 같죠?

글로벌 서비스로서 내놓은 정책입니다. 

(사진=파파고)

(사진=파파고)

 

최근 주목받는 네이버 번역기 ‘파파고’의 경우,

빠르게 언어를 추가하기보다는 한국어

사용자에게만 특화한 번역 서비스를 내놓습니다.

그래서 네이버는 그들이 자주 사용하는 순서로

(영어, 일본어, 중국어) 기술 고도화를 하죠.

올해 6개 언어를 추가하겠다고 밝혔는데요.

각각의 언어에 PBMT->NMT를

순차적으로 적용해서 내놓습니다.

한국어 사용자를 타깃으로 정확하게

번역하는 데 집중하는 것이겠네요.

NMT는 아직 걸음마 수준입니다.

NMT를 적용한 뒤 몇 개월 동안

거의 10년 동안의 번역기술 발전도에

맞먹는 기술 향상이 일어나긴 했습니다.

하지만 불과 지난해 말 제품화됐죠.

PBMT 기술의 레거시도 남아있을 테고요.

baidu

구글, 바이두, 네이버가 먼저 제품화해서

“우리 이만큼 뛰어난 기술을 썼어요”라며

세계 미디어로부터 엄청난 주목을 받았지만,

NMT가 지금 보여준 것만큼의

드라마틱한 성장을 보여줄지,

제품을 내놓은 회사들이 각자

추구하는 방향이 기술발전, 전략,

정책적으로 정답인지는 모른단 거죠.

때문에 구글이 NMT로 번역가능한

언어 개수를 ‘빠르게’ 늘리기 위해 사용하는

다중 언어 트레이닝의 성능과 의미도

다소 과장됐다고 볼 수도 있겠는데요.

간접적으로 훈련해서 번역하는 거라

품질에 대한 의문이 생길 수밖에 없습니다.

exception3

이에 대해 버락 투로브스키 총괄은

‘품질은 떨어지지 않는다’고 한 반면

오늘 마이크 슈스터 박사는

‘숫자, 날짜, 짧지만 드물게 사용하는 문장,

상호명이나 고유명사를 번역하지 못한다’며

‘개선할 점이 정말정말 많다’고 밝혔습니다.

그 개선할 점 중 두 가지만 짚어봤습니다.

커피

먼저 원래 언어 조합 번역에

오류가 있는 상태에서

다중 언어 트레이닝을 하는 경웁니다.

앞서 영어, 한국어, 일본어 예시에서

영어-한국어, 영어-일본어 조합이

맥락, 문화와 상관없이 틀리게

트레이닝 될 수 있을텐데요.

이 상황에서 다중 언어 트레이닝을 하면,

상대적으로 데이터가 부족한 한국어-일본어

조합에서의 번역결과도 틀리게 될 테니까요.

(시험에서 떨어졌다는 의미로 사용되는 관용구죠)

(시험에서 떨어졌다는 의미로 사용되는 관용구죠)

 

물론 구글이 예시로 든

한국어-일본어 조합의 경우엔

이를 상쇄할만큼의 데이터가 있겠지만,

데이터가 절대적으로 부족하면 문제겠죠.

지난해 11월 간담회에서 버락 투로브스키 총괄은

힌두어, 방갈리어 등 무수한 인도어를

다중 언어 트레이닝으로

번역할 수 있다고 이야기한 바 있습니다. 

(사진=MBC)

(사진=MBC)

 

한 업계 관계자는 옛날 프로그램

‘가족오락관’의 ‘고요 속의 외침’에

이 번역을 비유하기도 했습니다.^^;

한숨

다음은 직접 트레이닝과 비교하는 경웁니다.

다양한 언어를 포용할 수 있는가.

예를 들어 모국어가 영어인 사람이

하나의 에세이를 스페인어와 프랑스어로

각각 번역하는 숙제를 한다면요.

(스페인어와 프랑스어는 비슷합니다)

숙제를 아무리 잘해도(직접 트레이닝)

스페인어 번역본으로

프랑스어 번역본을 평가하면

어색한 번역을 심심찮게 발견할 겁니다.

(사진=픽사베이)

(사진=픽사베이)

 

스페인어와 프랑스어 데이터는 충분하겠지만

이를 인도 안에서 쓰는 무수한 언어들,

동남아시아 각국 언어들에 적용한다면,

대혼란을 초래하지 않을까 싶습니다^^;

정말 효율적인가.

다중 언어 트레이닝의 핵심입니다.

번역기가 컴퓨팅 자원을 거의 들이지 않고

새로운 언어를 배울 수 있는지의 문제입니다.

(사진=구글리서치블로그)

(사진=구글리서치블로그)

 

사람의 경우 두 개의 언어를 구사하면

새 언어를 빨리 배운다는 연구가 많습니다.

번역기가 그럴 것인지는 미지수입니다.

그렇다고 하더라도 두 언어는

여전히 전혀 다른 데이터셋입니다.

두 가지 언어를 잘해서 새로운 언어를

잘 배운다고 해도 지식(자원)을 써야하죠.

번역기가 두 언어를 (구문 단위가 아닌)

의미 단위로 배울 수 있는 스킬을

지니고 있다고 하더라도 새 언어를 배우려면

자원이 추가적으로 들 수밖에 없다는 겁니다.

제로 리소스 트레이닝은 어렵겠네요.

일하는모습_수정

당연히, 세상 그 어느 번역기도

아직 완벽하지 않습니다.

구글은 선도적인 기술 회사로서

방향을 잡아가고 있다고 봅니다.

번역기 성능도 몇 갑절씩 향상시키고 있고요.

기술적인 허점이 있다는 것을 인정하고

팀끼리 협력해서 보완해가기도 하고요.

하지만 기술 개발을 위한 개발에 함몰돼,

숫자로 표현되는, ‘빠르고 정확한’ 번역기를

개발하는 데에만 몰두하지 않았으면 합니다.

님뭐임

기술이라는 도구에 대한 의구심은

저렇게 끊임 없이 제기될 것입니다. 

기술 발전의 가치가 성능의 향상,

생산성의 향상에만 집중되면

그 의구심은 더 커지게 되겠죠.

대중이 자동 번역 기술,

이 기술의 기반이 되는 기술,

인공지능(AI) 기술을 두려워하는

원인이 아닐까도 생각해보게 되네요.

포럼 막바지에 마이크 슈스터 박사는

“번역기가 이렇게 발전하면 아이들은

영어를 배울 필요가 없지 않냐”는

질문에 이렇게 답변했습니다.

mike_

“저는 독일에서 태어났지만,

일본에서 대학 공부까지 마쳤습니다.

서로 다른 언어들을 배우고 사용해왔는데,

그 과정이 정말 흥미로웠습니다”

“언어를 배운다는 것은

그 언어만 익히는 것이 아니라

사용하는 지역, 문화, 행동을

같이 배우는 과정이라고 봅니다”

“번역기 기술이 향상돼도 그와 별개로

언어를 꼭 배워야한다고 생각해요”

기본_수정

원래 소통을 위한 도구니

사회, 문화, 맥락 등의 가치를 고려하고,

편견을 최대한 배재하는 방향으로 번역기를

개발하겠다는 의지로 해석해보았습니다.^^

(참조 – 구글 리서치 블로그)

(참조 – 제로샷 번역 감탄글)

(참조 – 제로샷 번역 관련 글)

(참조 – 한성숙 “인공지능 기반한 파파고에 6개 언어 추가”)

 

*월 9900원 정기구독을 통해

아웃스탠딩과 함께 하세요!

결제하기 (클릭해주세요)

*혹시 아웃스탠딩 회원가입을 안하셨다면
회원가입 부탁드립니다. ^^

회원가입하기 (클릭해주세요)


*해당 기사는 유료 콘텐츠로서 무단캡쳐 및

불법게재 시 법적 제재를 받을 수 있습니다. 


페이스북 댓글

0

댓글 남기기

기사 저장하기

작성자

장혜림

장혜림 기자

헤르메스처럼 '전달', '이야기'.합니다. 해외 IT 뉴스와 스타트업의 모든 소식을 저만의 방식으로 만들어 드릴게요. 굴러다니는 돌이니 언제든 불러주세요!. Covering all the IT stuffs that you can't get enough :)