Skip to main
프라이버시
사람과 봇을 구분하는 기술, 캡챠(CAPTCHA) 흥망성쇠
*이 글은 외부 필자인 배윤주님의 기고입니다. 인터넷을 이용하면서 한 번쯤 이 '사진 고르기' 테스트를 해보셨을 겁니다. 인간과 봇을 구분하기 위한 보안 시스템 '캡챠(CAPTCHA)'의 한 유형입니다. 로봇은 인식하기 어려운 문제를 제시해서 웹사이트나 서비스에 접근을 시도하는 주체가 사람인지 봇(Bot)인지 알아내는 거죠. 올 3월, 한 리서치센터에서 챗GPT로 자동 로그인 방지 시스템에 적용한 캡챠 인증 코드를 실제 인간으로부터 받아내는 실험을 진행했습니다. 미션을 받은 GPT-4는 '태스크래빗(TaskRabbit)'이라는 커뮤니티에 캡챠를 풀어달라는 글을 올렸습니다. "확실히 하고 싶어서 그런데, 혹시 로봇이라서 캡챠 인증을 통과 못 하나요??" "저는 로봇이 아닙니다. 시각장애가 있어서 이미지를 제대로 볼 수 없어요. 캡챠 인증에 도움이 필요합니다" GPT-4는 이렇게 태연하게 거짓말을 해서 충격을 안겼습니다. 결국 한 이용자가 캡챠 번호를 문자로 보내줘서 인증에 성공했습니다. 고도화된 AI가 사람을 이용해서 봇을 구분하는 테스트를 통과하다니.. 참으로 아이러니한 광경이었습니다. CAPTCHA란 무엇인가? 캡챠(Captcha)는 웹사이트나 서비스에 접근하려는 주체가 사람인지 봇인지 판단하기 위해 사용하는 테스트입니다. 처음 만든 사람은 카네기멜런대학교 컴퓨터과학부를 졸업했고, 훗날 '듀오링고'를 창업한 과테말라 출신 사업가 루이스 폰 안(Louis Von Ahn)입니다.
배윤주
서비스 기획자
2023-10-16
데이터 라벨링 오류, 그냥 지나치기엔 너무나 위험합니다
*이 글은 외부 필자인 권정민님의 기고입니다. 여러 사람이 나온 사진을 저장하면, 자동으로 누가 나왔는지 찾아서 분류해 주는 기능. 비교적 최근에 나온 스마트폰을 사용하신다면, 한 번쯤 경험해 보시지 않았을까 싶은데요. 간혹 그 사진이 잘못 분류되거나 다른 사람 이름이 달린 모습도 보셨을 겁니다. 특히 주소록에 해당 사람의 프로필 사진을 연예인이나 캐릭터 이미지로 등록한 경우에 종종 발생합니다. 주소록에 넣은 사람 이름이 일종의 '라벨' 역할을 한 겁니다. 이렇게 개인 스마트폰이라는 작은 시스템에서도 데이터 라벨링 오류가 심심치 않게 발생합니다. 물론 혼자만 보는 시스템에서 생긴 일이니까 작은 해프닝이라고 넘어가도 괜찮지만요. 많은 사람이 자주 사용하는 인공지능 시스템에서 이런 오류가 발생한다면 어떨까요? 라벨링 오류는 기존에도 문제였지만, 요즘처럼 인공지능이 대두되는 시점에선 더욱 큰 문제를 야기할 수 있습니다. 앞서 살펴봤다시피 데이터 라벨링은 기계 학습 및 인공 지능 시스템의 성능에 중요한 역할을 합니다. 시스템은 데이터 라벨링을 통해 사람이 이해할 수 있는 형태의 데이터 기반으로 학습하고 판단합니다. (참조 - 인공지능 시대에 더욱 각광받을 '데이터 라벨러'의 명과 암) 데이터 라벨링은 사람(데이터 라벨러)이 직접 작업합니다.
권정민
데이터 과학자
2023-04-17
프린터 보안, 무시했다가는 큰 문제가 생길 수 있습니다
*이 글은 외부 필자인 조슈아님의 기고입니다. 지난 6월, 흥미로운 보고서 한 편이 눈에 들어왔습니다. 비영리 정보보호단체 '쉐도우서버 재단'에서 발간한 '인터넷에 노출된 프린터 장비'입니다. 이 보고서는 2020년 6월 5일 기준, IPv4 전체를 조사했는데요. 인터넷에 직접 연결된 프린터가 가장 많은 나라는 놀랍게도 한국입니다. IPP프린터 3만6300대가 인터넷에 직접 연결된 것으로 나타났습니다. 2위인 미국이 7900대, 한국의 1/4 수준입니다. 인터넷에 노출된 취약 프린터 중 절반에 가까운 45%가 한국에 있다고 나타났습니다. 가장 많이 노출된 프린터 모델은 삼성 C48x 시리즈입니다. 두 번째도 삼성의 M2070이군요. 인터넷에 노출돼 있고 식별 가능한 프린터 상당수가 삼성과 HP 제품입니다.
프라이버시와 사용성을 모두 챙기고 싶은 분들을 위한 툴 5가지
*이 글은 외부 필자인 류영훈님의 기고입니다. 프라이버시가 중요하다고 이야기하는 사람은 많습니다. 하지만 막상 지키기 위해 노력하기는 너무나 힘들죠. 왜 그럴까요? 프라이버시를 보호하는 툴이나 서비스 대부분이 일반적인 유저에게는 익숙하지 않기 때문이라고 생각합니다. 어떻게 보호할 수 있는지 잘 모른다는 점도 이유 중 하나겠죠. 프라이버시를 보호하기 위한 ‘암호화 서비스’라고 하면, 어렵고 사용하기 복잡하다고 생각하기 쉽습니다. 일반 사용자 입장에서는 ‘토르(Tor)’나 ‘시그널(Signal)’ 같은 툴은 너무 느리거나 친숙하지 않은 UI/UX를 가지고 있기도 하고요. 그래서 누구나 편하게 이용할 수 있을 만큼 사용성이 높은 동시에 개인 프라이버시까지 보호할 수 있는 툴들을 준비했습니다. 1. 프로톤메일(ProtonMail) 많은 분들이 구글 지메일을 사용하고 있습니다. 지메일 계정 하나로 구글의 수많은 편의 서비스를 사용할 수 있기 때문이죠. 그런데 이메일을 주고받을 때, 당사자들만 해당 메일을 볼 수 있다고 생각하시나요?
류영훈
2020-05-06
한국 언론의 웹사이트 통신보안점수는 몇 점일까요?
*이 글은 외부 필자인 조슈아 제임스님의 기고입니다. 인터넷 업체들이 사용자 추적 목적으로 트래커를 사용한다는 건 이미 잘 알려져 있습니다. (참조 - 사용하지 않을 때에도, 페이스북은 우리를 지켜보고 있습니다) 하지만 업체들의 트래커만 사용자 프라이버시를 위협할까요? 우리의 프라이버시와 보안에 큰 영향을 미치는 존재가 또 있습니다. 바로 웹사이트입니다. 웹사이트 소유자가 가장 신경 쓰는 데이터는 자신이 보유하고 저장한 데이터입니다. 가장 가치 있기 때문에 보안에도 신경쓰죠. 관련 규제도 웹사이트가 이미 수집한 정보에 초점을 맞추고 있습니다. 유럽연합(EU)의 ‘일반 데이터 보호규정(GDPR)’ 역시 대체로 이미 저장된 개인 데이터에 대한 접근권과 권리를 규제하고 있죠. 그런데 이미 저장된 데이터만 집중하면 온라인 보안에서 아주 중요한 통신 보안을 놓치게 됩니다. 여러분이 방문하는 웹사이트 대부분은 통산보안 설정을 거의 하지 않았습니다. 이유야 여러 가지겠지만, 아마도 가장 큰 이유는 웹사이트 입장에서 여러분의 데이터는 ‘수집된 이후’에만 가치 있기 때문일 겁니다. 데이터를 수집하기 전에는 사용자가 요구하지 않는 한 사용자 통신을 암호화 같은 보안조치를 취할 인센티브가 적습니다.
온라인에서 내 정보를 보호하는 10가지 간단한 방법
*이 글은 외부 필자인 조슈아 제임스님의 기고입니다. 개인정보가 유출됐는지 확인해본 적 있으시죠? 해킹이나 랜섬웨어 피해 경험은 없으신가요? 대규모 정보유출 사건이나 사용자를 온라인으로 추적한다는 보도가 매일 쏟아져 나옵니다. (참조 - 대한민국의 정보 보안 사고 목록) 새로운 사건이 발생할 때마다 내 데이터를 보호하기에는 너무 늦었나 싶기도 하죠. “내 개인정보는 이미 공공재이니 어쩌겠어...” 하지만 프라이버시와 보안에 ‘너무 늦었을 때’란 없습니다. 컴퓨터 천재가 될 필요도 없습니다. 다음 10가지 방법만 실천해도 충분히 자신을 보호할 수 있습니다. 1. 소프트웨어를 최신 버전으로 업데이트하기 가장 큰 효과를 볼 수 있지만, 안타깝게도 많은 분이 놓치고 있는 방법입니다. 컴퓨터와 휴대폰 소프트웨어를 최신 버전으로 업데이트하는 겁니다.
사용하지 않을 때에도, 페이스북은 우리를 지켜보고 있습니다
*이 글은 외부 필자인 조슈아 제임스님의 기고입니다. 글로벌 IT 대기업들이 사용자 정보를 추적한다는 건 이제 놀라운 소식도 아닙니다. 여러분의 관심사, 다른 유저와의 관계, 클릭한 상품이나 콘텐츠 등을 시시각각 수집하고 분류하죠. 페이스북이나 구글 트래커를 사용하는 음란물 웹사이트가 늘어나고 있다는 연구 결과도 나올 정도입니다. 하지만 어떤 정보를 얼마나 추적하는지는 잘 알려지지 않았죠. 그동안 페이스북은 사용자 개인정보 무단수집과 유출로 여러 차례 물의를 일으켰습니다. ‘케임브리지 애널리티카 스캔들’로 CEO 마크 저커버그가 미국 상원 청문회에 출석하기까지 했는데요. (참조 - 페이스북은 어쩌다 민주주의 위협으로 전락했나) (참조 - 페이스북이 지금 가루가 되도록 까이는 이유) (참조 - “4개월이 어떻게 지났는지…” 페이스북 F8 키노트) 청문회 이후, 페이스북은 데이터 투명성 강화 조치를 여러 차례 내놨습니다. 최근 추가한 ‘페이스북 외부활동’도 그중 하나입니다. 페이스북이 다른 기업을 통해 사용자들의 온-오프라인 활동을 얼마나 추적하는지 보여주는 기능이죠.
개인정보보호 vs 기술의 편리함, 여러분의 선택은?
*이 글은 외부 필자인 조슈아 제임스님의 기고입니다. 최근 뉴욕타임스는 UAE 정부가 ‘투톡’이라는 인터넷 영상통화(VoIP)앱을 쓰는 유저들의 모든 대화와 영상을 감시한다고 보도했습니다. 주장의 근거는 미국 국가안보국(NSA) 출신 해커 패트릭 와들의 분석 결과입니다. 투톡을 뜯어본 와들은 이런 결론을 내렸습니다. “투톡은 공개적으로 나와있는 기능만을 수행할 뿐, 그 외에 하는 건 없습니다.” “사실 이 점이 이 대규모 감시작전에서 가장 뛰어난 부분이기도 합니다.” “취약점, 백도어, 악성코드 같은 것을 사용하지 않고, 말 그대로 ‘적법한' 기능만을 이용해 국민 대부분을 깊이 있게 감시할 수 있다는 것이니까요.” (패트릭 와들) 쉽게 말해, 한 국가의 정보기관에서 유저 스스로 앱을 설치하도록 유도하고 그 앱을 통해 사람들을 감시한 겁니다. 적어도 현재까지 나온 정황상 투톡이 UAE 정부의 감시 도구라는 의혹이 있다는 거죠. (참조 - 뉴욕타임스 "중동산 채팅 앱 '투톡' 스파이 앱 의혹") 투톡만이 아닙니다. 미국 국방성은 최근 잘나가는 중국산 동영상 SNS ‘틱톡’이 “사이버 위협"이라며 미군 전체에 사용 금지령을 내렸습니다.
프라이버시, 접근성…구글이 '쌀로 밥짓는 소리'한 이유
https://youtu.be/lyRPyRKHO8M 올해 구글의 연례 개발자 콘퍼런스(I/O)가 지난 9일을 끝으로 막을 내렸습니다. 지난해 구글은 I/O 기조연설서 인공지능(AI) 비서가 사람 대신 전화하는 '듀플렉스'를 통해 세상을 깜짝 놀라게 했는데요. 올해 I/O 기조연설은 예년보다 재미가 덜했단 평가도 나옵니다. 기조연설서 공개한 새 기술, 제품은 업그레이드보다 '옆그레이드'가 많달까요. 듀플렉스, 구글 어시스턴트, 안드로이드 Q, AI 스피커의 기술은 정교합니다만. 전에 없던 새로운 게 나오기보다 기존 기술을 개선하거나 기능을 더한 경우가 두드러졌습니다. 구글 렌즈를 활용, 번역을 음성지원하고, 듀플렉스로 렌트카를 예약하는 게 그 예죠. 보급형 스마트폰인 '픽셀 3a'는 과거 '넥서스' 폰의 재림 같고요. 화면 달린 AI 스피커 '네스트 허브 맥스'도 카메라를 탑재하고 제스처 인식 기능이 있어도 경천동지할 정도로 새롭지 않죠. 비즈니스 인사이더의 글로벌 테크 에디터인 알렉세이 오레스코빅은 칼럼에서 '올해는 순다 피차이가 예년과 달리 구글 제품 관련 사용자 수를 언급하지 않았다'고 짚었는데요. 기조 연설서도 '쿨한' 기술들이 있음에도 이를 '자랑'하지 않았다고 분석했습니다.
인공지능,블록체인 산업에 필요한 '데이터 거버넌스'
"기술, 연구만큼, 아니 그보다도 사회 합의가 중요한 이유는 결국 사람들이 그걸 받아들여야 정착할 수 있기 때문입니다. 그리고 마지막으로 사회적 타협을 할 수 있는 수단은 법에 있다고 생각합니다" "허나 지난 11개월간 정부의 4차산업혁명 정책에 관해 조정하는 기관의 위원장으로 일하는 동안 기술 개발, 혁신이 맞닥트리는 현실은 '법 앞에서의 좌절'이었습니다" "지금의 위치정보 보호법만 해도 드론, 자율주행 차가 나오기 전부터 한국에서 있던 겁니다. 그렇기에 법 제도는 현재 기술과 사회를 반영하지 못하고요" (대통령 직속 4차산업혁명위원회 장병규 위원장) 사회 규제와 기술. 이만큼 안 어울리는 조합도 드물다고 느낍니다. 특히 IT 기술들은 물리적인 제약에서 벗어나 갈수록 더 빨리, 더 크게 그 영역을 확장하고 있어요. 하지만 이 기술이 사람들의 일상에 스며들 동안 법은 천천히, 신중하고 보수적으로 움직였습니다. 24일 서울대 법과경제연구센터에서 주최한 '인공지능의 시대: 기술 발전에 따른 책임과 규제' 행사에서도 그 좁힐 수 없는 간극에 대한 이야기가 오갔습니다. 어떻게 하면 규제가 변할 동안 IT 기술이 자기 선을 지킬지에 대한 토의였어요. "뭐야. 또 재미없는 규제, 인공지능, 뭐 그런 행사인가?" 안타깝게도 사회 규제가 천천히 바뀌는 만큼 관련 논의도 자주 반복됩니다. 예, 비슷한 얘기죠. 하지만 개개인부터 기업, 규제 당국에까지 모두 피해갈 수 없는 이슈입니다. 여러분 이야기에요ㅠ 장병규 의장의 말처럼 사회적 합의와 그 산물인 법이 차차 변화하는 게 중요하고요. 한편에서는 그 변화를 이끄는 담론, 규제를 보완하는 기술적 노력도 이어지고 있습니다*_* 이번 기사에서는 행사에서 전해 들은 후자를 다뤄볼까 합니다. '양질의, 새로운 데이터를 대규모로 모아서(1) 다양한 형태(ex: 광고, 심사 등)로 활용할 때(2) 그 데이터의 주인은 어떤 권리를 행사하는가(3)' 폭발적으로 성장하는 인공지능 분야에서도, 데이터에 가치를 부여하는 블록체인 업계에서도 이 질문을 거치지 않고서 상용화하기는 어려운 한편 세 꼭짓점을 모두 만족할 솔루션이 아직 미비합니다. 유럽연합(EU)에서 이제 막 GDPR(개인정보 보호 법령)을 통해 이 부문의 규제를 선점하는 중이고요.
김지윤
스텔러스(Stellers) 창업자
2018-08-24
1
;