본문 바로가기

사진강좌

[기사] 인공지능, 사람의 '눈' 대체한다… 구글 포토의 마법

수억장 사진서 '페르시안 고양이' 콕!… 컴퓨터가 집어낸다
입력 : 2015.11.11 03:08

출처: 이곳을 클릭..

구글포토: 이곳을 클릭..

 

[오늘의 세상]
인공지능, 사람의 '눈' 대체한다… 구글 포토의 마법

- 컴퓨터가 알아서 판독한다
스마트폰 속 수천장의 사진, 맥주·자동차 등 사물별 분류
사진 찍었던 장소까지 파악… 검색어 치면 수초만에 찾아내

- 구글 슈밋 회장이 말하는 미래
"사람처럼 학습 '머신 러닝'으로 기계가 좀 더 인간친화적 될것"

 
스마트폰 속에 담긴 사진 수백~수천 장 속에서 '내 아들이 한 살일 때 사진'만 찾으려면 어떻게 해야 할까.
아니면 '대전에서 찍은 사진'만 골라내거나 '페르시안 고양이' 사진만 콕 찍어서 찾으려면? 사진을 한 장씩
넘기면서 일일이 찾으려면 수십 분은 족히 걸릴 일이다. 아예 '페르시안 고양이'가 뭔지 모르는 사람도

지기수일 것이다.


그런데 이 일을 스마트폰이나 컴퓨터에 맡기면 불과 몇 초 만에 끝낼 수 있다. 스마트폰에 '구글 포토'(photo)
앱을 깔고, 당신이 가진 사진을 모두 저장하면 된다. 그리고 검색창에 '아들 2014(태어난 연도)' '대전'
'페르시안 고양이'라고 쳐 넣기만 하면 된다.


구글은 이용자가 찍은 모든 사진을 사람처럼 일일이 들여다보며 세밀하게 분류하기 때문이다. '맥주'
'자동차'와 같은 사물은 물론, '서울' '대전' '런던' 등 시키지 않아도 장소별로 나눠 놓는다. 사진 속 얼굴을
분석해 같은 사람 사진을 모아놓는 기능(한국에는 미적용)까지 있다. 컴퓨터가 '눈(目)'을 뜬 것이다.


도대체 컴퓨터는 어떻게 사진 속 고양이를 '고양이'라고 판단하고, 강아지를 '강아지'로 구별할 수 있을까.
그것도 품종까지 정확하게 말이다. 이는 인공지능 중에서도 '머신 러닝(Machine Learning·키워드)'이란
기술을 활용하기 때문이다.


구글이 10일 일본 도쿄에서 개최한 아태 지역 간담회는 사람의 눈을 대체하기 시작한 컴퓨터의 능력과
가능성을 설명하는 자리였다. 행사 주제는 '더 매직 인 더 머신(The Magic in the Machine)'. 말 그대로
 '기계가 부리는 마법'의 비밀을 공개했다. 올 5월 출시된 구글 포토의 현재 월 이용자는 1억명, 이들이
등록한 사진은 500억장 이상이다. 구글 컴퓨터는 양이 엄청난 이 사진들을 학습해 사진 속 각 사물의
특징을 익히고, 다음에 특정한 사진을 주면 이것이 무엇인지 파악해낸다. 구글 머신 러닝 전문가인
그레그 코라도(Corrado) 선임 연구원은 "컴퓨터가 학습을 거듭할수록 사진 판독은 정확해진다"고 했다.


사진을 찍었던 장소도 정확히 읽어낸다. 스마트폰의 '위치 정보(GPS·위치 위성 확인 시스템)' 기능이
꺼져 있어도 문제없다. 사진에 찍힌 건물, 배경 등을 바탕으로 위치를 추정하는 것이다. 예를 들어 사진
끄트머리에 에펠탑 모습이 보인다면, 알아서 '프랑스 파리' 범주로 사진을 분류한다. 구글은 "현재
에펠탑·후지산 등 수천 가지의 장소 정보를 구축했고 지속적으로 늘리는 중"이라고 했다.


머신 러닝 기술의 핵심은 분석 층(layer) 22개이다. 스마트폰에 어떤 사진이 찍히면 22단계의 정밀한
과정을 거쳐서 최종 분석에 이른다. 예를 들어 고양이라면 처음에는 피사체의 선(線), 색깔을 인식하고
다음엔 눈과 귀, 그다음엔 얼굴의 무늬 등을 인식해서 차츰 범위를 좁혀나가는 것이다. 22번째 최종
단계에선 '페르시안 고양이'라는 결론을 내놓는다.


숱한 학습을 통해 이용자가 찍은 사진의 맥락도 분석한다. 예를 들어 촛불 꽂힌 케이크가 찍혔다면 다른
정보가 없어도 곧바로 '생일' 범주로 분류한다. 또한 10월에 만화 캐릭터 옷을 입은 사진은 아무런 추가
정보 없이도 '핼러윈(매년 10월 31일 특이한 복장을 하는 서양 축제)'이라고 인식한다. 하지만 흑인 여성
사진을 '고릴라'로 오독(誤讀)했다가 항의를 받은 적이 있는 등 아직 완벽한 것은 아니다.


구글의 눈은 현실을 넘어 '가상 세계'까지 보고 있다. 예를 들면 인터넷에 올라온 남산타워(N서울타워)
사진을 수만 장 수집한다. 찍은 위치와 관점(觀點), 거리, 남산타워의 크기도 제각각이지만 컴퓨터가
보정 작업을 거친 뒤 합성해 360도로 빙 돌려볼 수 있는 '3D(3차원) 남산타워' 사진을 만들어내는 것이다.
시간대별로 연결해 '한 장소에서 마치 30년간 남산타워를 지켜본 듯한' 사진 연작도 만들어낼 수 있다.


이날 화상 회의를 통해 간담회에 참여한 에릭 슈밋 알파벳(구글 지주회사) 회장은 "머신 러닝을 통해 기계가
좀 더 인간 친화적으로 발전할 것"이라며 "앞으로 타이핑, 스팸메일 삭제와 같은 잡무는 컴퓨터가 모두 하게
될 것"이라고 예측했다. 이어 "1950년대를 돌아보면 기계 덕분에 우리가 지금 하지 않는 일이 많듯, 2050년에
오늘을 돌아보면 마찬가지 기분이 들 것"이라고 했다.


☞머신 러닝(Machine Learning)

컴퓨터를 비롯한 기계를 마치 사람처럼 학습시켜 인지·판단·예측 능력을 키우는 일종의 인공지능 기술.
예를 들어 컴퓨터에 고양이 사진을 자주 보여주면 각각의 특징을 포착해 다음번에는 고양이의 종(種)까지
구별해낸다.


[그래픽] 구글포토, 어떻게 사진을 읽나