바이두 AI 인식수준은 어디까지 와있나

7월 4일 [2018 바이두 AI 개발자대회]가 

베이징에서 열렸습니다.

 

(사진= 바이두)

 

바이두 AI 개발자대회는

2017년에 처음으로 열렸으며

이번이 두 번째인데요.

 

바이두 회장 리옌훙이

2017년 5월 ‘인공지능에 올인’을 선포한 이래

AI 개발성과를 보여주는 대회라 할 수 있죠.

 

지난해는 바이두 인공지능 사업의

밑그림을 보여줬다면

올해는 얼마나 더 ‘인공지능’다워 졌는지

보여준 대회라 할 수 있습니다.

 

이번 대회서 바이두 인공지능의 핵심인

바이두 브레인이 3.0 버전을 출시했는데요.

 

이번 업그레이드 주요 내용이 바로

[다중모달 정보 의미에 대한 심층 이해]입니다.

 

*중국어 원문과 영문번역

多模态深度语义理解

Multimodal depth semantic understanding

 

이에 대해 바이두 부총재이며

AI 플랫폼 개발그룹(AIG) 총책임자인

왕하이펑(王海峰)은 아래와 같이 설명했는데요.

 

“텍스트, 음성, 이미지, 동영상 등

다양한 형태의 정보들을 입력하여

똑바로 듣고, 볼 수 있는 것은 물론

그 뒤에 숨겨진 의미까지 이해하고”

 

“인공지능이 그 이해한 것들을 데이터로 만들어

다양한 사용환경에 맞춰 대응하는 것을 가리킵니다’

 

즉 인공지능이 자기가 보고 들은 것을

‘자기말’로 만들어 저장해 놨다가

사람들이 요구할 때 ‘인간처럼’ 대응한다는 것인데요.

 

구체적으로 어떻게 작동하는지

왕 부총재는 아래와 같은 몇 가지 예로

친절하게 설명했습니다.

 

월드컵 중계하는 인공지능

 

영상에 대해 바이두 AI는 어떻게 이해하고

어떤 결과물을 만들어 낼까요?

 

왕 부총재는 현재 진행중인

러시아 월드컵 경기영상을 예로 보여줬는데요.

 

(사진= 바이두)

 

화면에서 인공지능은

선수들 개개인을 식별하고 있으며

반칙, 경고, 코너킥, 슈팅 등 이벤트를

사건별로 기록하고 있었죠.

 

하이라이트는 마지막 부분인데요.

 

크리스티아누 호날두가 골을 넣는 장면을

인공지능이 음성으로 중계한 것입니다!

 

“경기 진행 43분, 크리스티아누 호날두 슛,

골이 들어갔습니다. 호날두는 달려가

세레모니를 날렸습니다.

현재 포루투갈이 3대2로 이기고 있습니다’

 

중문원문 첨부

“比赛进行到第43分钟,C罗射门,球进了。

C罗奔跑庆祝,葡萄牙队3比2领先”

 

누가 언제 무엇을 했으며‘를

6하원칙에 의해 문장을 만들었고 

현재 경기 상황까지 분석하고 있죠.

 

영상속의 이벤트, 행위를 분석해

자연어로 처리하는 능력을 보여준 것입니다.

 

바이두 무인편의점 솔루션

 

위에서 보여준 예가 바이두 인공지능의

동영상에 대한 이해를 보여줬다면

다음으로 보여준 예는

인간 실시간 행동에 대한 이해를 보여줬는데요.

 

사용환경은 아마존고와 같은 무인편의점이었죠.

 

안면인식하여 편의점에 들어가기만 하면

여러 각도의 카메라가 트래킹을 시작하고요.

(사진= 바이두)

 

모자를 쓰거나 다른 옷을 입어도

추적에서 벗어날 수 없다고 합니다.

 

상품을 고를 때는 진열대에 있는 카메라가

누가 어떤 상품을 집었는지 기록하며

원하지 않는 상품을 아무곳에 내버려도

정확히 장바구니서 빼놓을 수 있다죠.

 

(사진= 바이두)

 

마지막 편의점에서 나올 때

안면인식으로 결제만 하면 끝입니다.  

 

이렇게 편리한 사용환경 뒤에는

바이두 인공지능이 작동하고 있는데요.

 

안면인식, 인체 트래킹, 상품식별 등을 통해

AI는 누가 언제 어떤 상품을

집었고 내려놓았는지에 대해

시나리오를 구성하고 주문을 형성하죠. 

 

(사진= 바이두)

 

아래와 같은 형태로 기록이 된다는데요.

 

(구매행위에 대한 시나리오 형성과정 사진= 바이두)

 

‘고객 A는 5분 13초 머물러 있었으며

A브랜드 케이크, B브랜드 통조림, C브랜드 감자칩

등 4 가지 상품을 사서 결제금액이 5천원입니다’

 

위의 월드컵 사례와 무인편의점 사례가 바로

‘시각의미화(视觉语义化)’라는 기술로 구현되는데요.

 

인공지능이 영상, 카메라등 시각화 정보로부터

다양한 행위들의 의미를 이해한다는 뜻이죠.

 

복잡한 지령을 이해하는 바이두 맵

 

‘볼’ 줄 아는 것 외에 ‘들을’ 줄 아는 것도

인공지능 능력의 중요한 부분인데요.

 

왕 부총재는 바이두맵에서 인공지능이

어떻게 대응하는지를 예로 들었습니다.

 

인공지능 스피커를 쓰다보면

두 개 이상의 지령을 내렸을 때

이해 못하는 경우가 많은데요.

 

예를 들어

‘트와이스하고 블랙핑크노래 틀어줘’,

‘스타벅스에서 아메리카노와 라떼 주문해줘’

이런 경우에 인공지능이 못 알아듣더라구요.

 

내비(맵) 앱 같은 경우에도

‘합정역 갔다가 홍대역을 들러 집으로’처럼

여러 경유지를 설정하면 안내를 못하죠.

 

바이두가 이번에  바이두 맵에서 선보인

음성인식은 정말 놀라웠는데요.

 

왕부총재가 직접 바이두 맵에 

요구한 지령은 이랬습니다.

 

“홍대역 부근에서 출발해

고속터미널 신세계백화점을 거쳐

청담동 갔다가 집에 갈건데,

신호등이 적고 막히지 않고

가장 빠른 경로로 안내해줘”

 

*이해를 돕기 위해 한국 지역명으로 바꿨습니다.

 

이 지령을 받고 바이두 맵은

몇 초 안지나 경로를 기획하더라구요!

 

(복잡한 지령을 인식하는 바이두 맵 사진= 바이두)

 

‘어디 부근’, ‘어디를 거쳐’를 이해한다는 것은

단순히 조건(지령)에 대한 인식보다

자연어에 대한 이해가 가능함을 보여준 것입니다.

 

가던 길 중 음성으로 목적지를 바꾸는 부분이나

가는 길에 가까운 주요소를 찾는 명령도

매우 자연스러운 언어로 진행되었죠.

 

얼마나보다 무엇을 인식했냐가 중요하다

 

축구경기 중 다양한 이벤트에 대한 이해나

복잡한 지령을 알아듣는 능력을 봐서도

바이두 인공지능의 인식수준이

상당히 높다고 할 수 있는데요.

 

사실 이 사례들에서 보여준 것은

바이두 브레인 능력의 일부분입니다.

 

왕 부총재에 의하면

컨퍼런스 당일 기준으로

오픈되어 있는 스킬의 수량은 117개로

지난 해 60개의 두 배에 달하고요.

 

(사진= 바이두)

 

하루 인용 횟수도 4090억 회에 달하여

지난 해 2188억 회의 거의 두 배에 달했습니다.

 

(참조 – 2017 바이두 월드 컨퍼런스)

 

그러나 이번 대회서 바이두가 말하고 싶은 것은

AI가 얼마나 많이 인식할 수 있다가 아니었습니다.

 

AI가 아무리 빨리 계산하거나

많은 것을 인식할 수 있어도

일반인들에겐 그저 복잡한 코딩일 뿐이죠.

 

바이두 AI기술이 인식한 것을

일반인도 이해할 수 있는

언어와 문자로 표시하고

 

일반인도 약간의 학습을 통해

원하는 결과를 얻을 수 있음을 보여준 것이

이번 바이두 AI 컨퍼런스의 목적이었죠.

 

코딩을 모르는 의사가

기생충 식별 프로그램을 만들고

 

 

동물학자가 동북호랑이

행위분석 프로그램을 만들고

 

 

12살 어린이가 그림보고

사자성어 맞추기 게임을 만들었습니다.

 

 

비즈니스 현장에서도

더 효율적이고 창의적인 아이디어가

나타나고 있는데요.

 

AI 카메라를 통한 품질 검사는

평소보다 효율을 2배 이상 향상시키고

 

 

음성으로 주문하고 안면인식으로 결제하는

자판기도 곧 출시를 앞두고 있으며

 

 

어린이와 대화가 가능한 반려로봇은

시장의 높은 평가를 받고 있죠.

 

 

바이두의 인용하기 쉬운 기술과 오픈된 정책이

이들의 성장을 견인하고 있습니다.

 

또 이들의 성장과 더 많은 이용자들이 있어야

바이두 AI 생태계가 더 커지게 되겠죠.

 

“Everyone Can AI”

이번 바이두 AI 컨퍼런스 슬로건인데요.

 

(사진= 바이두)

 

바이두가 그리고 있는 AI 생태계 그림이

더욱 가시화되고 있다는 느낌입니다.

 

(참조 – 2018 바이두 AI 개발자 대회 동영상)

 

(참조 – 2018 바이두 AI 개발자 대회 요약)

 


*해당 기사는 유료 콘텐츠로서 무단캡쳐 및

불법게재 시 법적 제재를 받을 수 있습니다.


 

1

  1. 김가원

    오 정말 신기하네요 인공지능이 빠른속도로 진화하고 있는 것 같습니다.
    국내에도 AI에 집중되어 괄목할 만한 성장을 하는 기업 또는 스타트업이 있을까요?

댓글 남기기

기사 저장하기

작성자

이송운 기자

이송운 기자

한국과 중국 사이에서 정확하고 객관적인 전달자가 되고 싶습니다.