Skip to main
기계학습
인공지능 시대에 더욱 각광받을 '데이터 라벨러'의 명과 암
*이 글은 외부 필자인 권정민님의 기고입니다. 요즘 데이터 관련 기사에서 '데이터 라벨러'라는 단어를 어렵지 않게 볼 수 있습니다. 자율주행차, 안면 인식, 챗GPT 같은 각종 인공지능 서비스가 급부상하면서 이 직업도 빠른 속도로 친숙해졌습니다. 하지만 갑자기 떠올랐다보니 정작 직업 자체에 대해서는 피상적으로 알려진 감이 있지 않나 싶습니다. 먼저 '데이터 라벨링'이 무엇인지 살펴보겠습니다. '데이터 라벨링'이란 작업은 일종의 문서 분류나 자료의 수를 세는 것과 유사한 맥락입니다. 즉, 갑자기 새롭게 만들어진 일은 아닙니다. 다만 '사람이 필요한 이유'가 달라졌습니다. 예전에는 많은 자료를 집계하고 정리하기 위해 필요했다면, 이제는 기계가 데이터를 학습하기 위해 필요해졌다고 정리할 수 있습니다. 인공지능은 기계학습(머신러닝) 알고리즘으로 만듭니다. 말 그대로 '기계'가 '데이터'를 '대량으로 학습'하는 알고리즘입니다. (참조 - AI, 머신러닝 그리고 딥러닝의 변천사) 그런데 기계가 동시다발적으로 학습하는 엄청난 분량의 데이터를 사람이 하나하나 관리하긴 힘듭니다.
권정민
데이터 과학자
2023-03-14
무엇이 인공지능을 쓸모없게 만드는가?
그는 죽었습니다. 르네 카밀이라는 인물인데요.원래 평범한 엔지니어였습니다.도표 작성 장치를 다루는 전문가였어요. 그가 다루던 기계는 주로사람들의 인적사항에 구멍을 뚫은인구조사 카드를 분류했습니다. https://youtu.be/tOEFO1kU8rY 헌데 전쟁이 일어났습니다.나치는 어느새 카밀이 살던프랑스 비쉬까지 근접했습니다. 카밀은 직감했습니다. 자기가 다루는 인구 분류표가비쉬에 사는 유대인을 골라내서끌고 가는 데 쓰인다는 걸요. 실제로 인구조사 카드에는종교를 기재하는 부분이 있었고거기에 ‘유대교’라고 적는 건수용소로 간다는 뜻이었습니다. 카밀은 나름 기지를 발휘합니다. 원래 인적사항에 맞게인구조사 카드에 구멍을 내면기계가 그 구멍에 맞춰서카드를 분류하고 모았는데요. 카드에 펀칭할 때 일부러 11번째 줄에는 구멍을 내지 않도록펀칭 기계를 조작한 겁니다. 11번째 줄은종교를 표시하는 부분이었습니다. 카밀은 30개월간 몰래11번째 줄 데이터를 기재하지 않고인구조사 분류를 시행했습니다. 많은 사람이 수용소행을 피했고대신 다른 곳으로 피신할 수 있었습니다.
김지윤
스텔러스(Stellers) 창업자
2017-12-22
인공지능을 전기처럼 쓰는 시대
저는 평소에 음악을 자주 듣습니다.취향은 잡식이지만, 그날 기분에 따라듣고 싶은 노래가 휙휙 달라지는 편이죠. 어느 날, 갑자기 불편했습니다.그날은 꼭 힙합만 듣고 싶었는데,그래서 힙합이 아닌 노래가 나오면번번이 ‘그다음’ 버튼을 눌렀는데 앱에서는 평소처럼 자꾸만랜덤으로 발라드나 댄스곡을틀어줬습니다. ‘어째서 이게 학습이 안 되지?은근히 불편해서 못 쓰겠네;;;’ 문득 이런 생각을 하는 저를 발견했죠. 아무래도 유튜브에 익숙해진 까닭이었습니다.유튜브는 제가 무엇을 선택하는지에 따라그 선택과 비슷한 다른 추천을 해주잖아요. 하지만 모든 서비스가 그렇지는 않고,다만 저는 AI 기술을 조금이라도 활용해추천해주는 서비스에 길들여진 터였습니다. 예전에는 불편한 줄도 몰랐던 부분을불편이라고 자각하는 순간, 영영이전의 상태로 돌아갈 수 없다는 걸체감했던 날이었습니다. (참조 - 레트로가 아니라 아날로그가 반격한다) “지난 10년간 AI 분야에서는크나큰 발전이 이어졌습니다” “2007년 아이폰이 생겼을 때만 해도아이폰에 말까지 걸 순 없었습니다.기술이 멀었고, 서비스 자체가 없었죠” “하지만 얼마 지나지 않아 컴퓨터는인간보다 사물을 더 잘 식별하게 됐습니다.단기간 내에 인간의 능력을 뛰어넘었죠” “이제 스마트폰에 말로 지시할 수 있고,소비자들이 그러기를 기대하고 있습니다”
김지윤
스텔러스(Stellers) 창업자
2017-12-13
AI, 머신러닝 그리고 딥러닝의 변천사
지난해 3월, 전국민의 이목은TV 생중계 영상에 쏠립니다. 구글의 딥마인드(DeepMind)의 알파고(Alphago)와이세돌이 펼치는 세기의 바둑 대결을 보기 위해서죠. 아마 이를 계기로 대한민국뿐만 아니라 전세계인이인공지능, 머신러닝, 딥러닝이라는생소한 용어를 접하게 된 게 아닌가 생각마저 듭니다. “구글 알파고 이후로 인공지능에 대한전국민의 관심이 높아졌습니다” "지난 30년간 뇌인지와 인공지능을 연구하고 있는데이 분야에 대한 산업화가이렇게 빠르게 이뤄질 줄은 차마 상상도 못 했습니다" (장병탁 서울대학교 컴퓨터공학부 교수) 실제로 그 당시 나온 많은 언론 기사들은인공지능/머신러닝/딥러닝이라는 용어를 혼용하며알파고가 이세돌을 꺾고챔피언이 될 수 있었던 이유에 대해서 설명합니다. 하지만 따지고 보면 기계 지능에 관한 용어기계가 스마트하다는 것을 표현하기 위해,사람들 입맛대로 사용됐다고 보시면좀 더 명확할 것 같은데요, 서로 연관성도 높고 겹치는 부분도 많기 때문에얼뜻보면 비슷해 보이지만사실 이들 용어 간에는 큰 차이가 있습니다. 다만 정말 이 용어가 무엇을 의미하는지 이해하기엔'넘나' 기술적이라는 문제만 남아있을 뿐이죠. 지난해 알파고 이슈를 함께 커버했던선배와 저의 실제 대화를 통해이 어려움을 간접적으로 접할 수 있습니다. "그래서 알파고가 어떻게 학습을 한다는 건데?" "딥러닝이라는 인공신경망을 이용했습니다"
이수경
2017-08-23
1
;