본문 바로가기

일러스트=이철원

업그레이드 된 AI챗봇 등장에… “구글 검색의 시대 끝났다”

임경업 기자
입력 2022.12.08 03:00

/일러스트=이철원

테크 관계자들 소셜미디어에
세계 최대 AI 연구소가 개발한
‘챗GPT’와의 대화 계속 올라와

“지금 인터넷은 인공지능(AI)이 쓴 대본, 대학 리포트를 보고 폭풍에 휩싸였다.”

지난 3일 블룸버그는 최근 테크 업계에서 벌어지고 있는 ‘AI와의 대화 공유’ 소동을 이같이 보도했다. 실제로 트위터, 페이스북 등 소셜미디어에는 AI와의 대화를 캡처한 글이 끊임없이 올라오고 있다.

이달 초 세계 최대 AI 연구소 ‘오픈 AI’가 공개한 AI챗봇 ‘챗GPT’와 대화한 기록이다. 사람들이 놀란 것은 AI가 마치 사람처럼 똑똑하게 답을 하기 때문이다. 네이버 AI 클로바 개발 조직의 성낙호 책임리더는 챗GPT에 “이선희 노래 ‘J에게’를 IT 개발자의 삶에 맞춰 개사해달라”고 입력했다. 그러자 AI는 “J 스치는 기술들에, J 그대 코드 보이면…” 식으로 개발자들이 쓰는 단어를 넣어 뚝딱 가사를 만들어 냈다.

챗GPT는 오픈 AI가 개발한 ‘GPT-3.5′라는 AI 대규모 언어 모델을 이용자들이 쓰기 쉽게 변형한 것이다. GPT(Generative Pre-trained Transformer)는 구글 ‘알파고’처럼 AI의 한 종류이자 이름이다. 딥러닝(심층학습)을 통해 마치 인간이 대화할 때처럼, 다음 텍스트를 예측하고 만들어낸다, 국내 스타트업 스캐터랩이 만든 ‘이루다’와 같은 수많은 챗봇 AI가 GPT를 기반으로 제작됐다. AI 개발자 출신인 남세동 보이저엑스 대표는 GPT 등장에 대해 “20여 년 이어져 온 구글 검색의 시대가 끝나가는 것이 느껴진다”고 페이스북에 적었다. 구글 검색은 검색어와 관련된 문서를 보여주지만, 챗GPT는 원하는 답을 대화체로 곧바로 알려준다.

 

◇매개변수 2 년 새 1500배 늘어

오픈 AI는 테슬라 창업자인 일론 머스크와 실리콘밸리 유명 투자자 샘 알트먼이 2015년 세웠다. GPT 첫 버전을 공개한 것은 2018년. 당시 1억1700만개의 매개변수를 썼다. 매개변수는 AI가 학습할 수 있는 데이터 양을 추정할 수 있는 단위로, 보통 매개변수가 많으면 AI가 높은 성능을 가진 것으로 본다. 이듬해 공개한 GPT-2는 15억개, 2020년 나온 GPT-3의 매개변수는 1750억개로 늘었다. 2년 새 1500배 늘어난 것이다. 개발자들이 AI에게 더 많은 학습 데이터를 입력하고, AI가 데이터를 빠르게 처리할 수 있는 GPU(그래픽 처리장치) 같은 하드웨어 역시 발전하고 있기 때문이다.

매개변수 증가와 함께 GPT의 능력도 무섭게 향상되고 있다. GPT-3 모델부터는 사람처럼 글을 쓰는 수준에 도달했다. 지난 10월 유명 역사학자 유발 하라리가 본인의 저서 ‘사피엔스’의 10주년 서문을 GPT-3에게 맡겼다가, 그 결과물을 보고 “충격으로 할 말을 잃었다”고 밝혔을 정도다. AI가 쓴 서문은 “2011년 여름 ‘사피엔스’ 집필을 마무리하면서 이 이야기로 다시 돌아올 일은 없을 거라고 확신했다”는 문장으로 시작한다. 오픈 AI는 이번에 공개한 GPT-3.5에 어떤 업데이트를 했는지 밝히지 않았다. 다만 AI가 랩을 하거나, 난센스 퀴즈를 맞히는 등 전작보다 좀 더 사람처럼 상황, 맥락에 따라 반응한다는 것이 차이점이다. AI 업계에선 내년 출시 예정인 GPT-4에 매개변수 1조개 이상이 사용될 것으로 추정하고 있다.

◇GPT와 대화해보니… 인간적이지만, 허점도 많아

실제로 챗GPT와 대화를 해보니, 그럴듯한 답변을 척척 내놓았다. 영어뿐 아니라 한국어로도 대화가 가능하다. AI에게 영어로 ‘너는 누구냐’고 묻자, “사람이 아니라, 다양한 주제의 정보를 제공하거나 질문에 답하도록 설계된 컴퓨터 프로그램”이라며 “내 생각이나 의견이 없고, 오직 정보를 제공하고 의사 결정을 돕기 위해 존재한다”고 답했다. 구글 검색과 차이점을 묻는 질문엔 “질문에 더 인간적인 방식으로 이해하고 응답할 수 있다”고 했다. 미국의 링컨 전 대통령에 대한 평가를 묻자 “나는 AI라 개인적 의견이나 신념이 없다”며 논쟁을 피해가는 모습도 보였다.

하지만 사실관계가 틀리는 허점이 꽤 많았고, 학습 데이터 대부분이 영어인 탓에 한국어 답변은 수준이 상대적으로 떨어졌다. 실제로 “여자 친구와 헤어졌을 때 위로가 될 만한 음악을 추천해달라”고 했더니, AI는 크리스 스테이플턴의 ‘The Healing(치유)’을 추천했다. 크리스 스테이플턴이란 가수는 실존하지만, 이 가수는 이런 노래를 낸 적이 없다.

“한국은 어떤 나라야?”라고 한국어로 묻자, AI는 답변에 “전통적으로 일본의 영향을 받았다”는 내용을 담았다. 학습 데이터가 제대로 업데이트되지 않아 “한국 대통령이 누구야?”라고 묻자 “문재인 대통령”이라고 잘못 답하기도 했다.

원글: https://www.chosun.com/economy/tech_it/2022/12/08/PF66T7D56JBILMKTZL5TT2CRGQ/