달-E2에게 그려달라고 부탁한 미래도시의 모습. 출처=달E2
달-E2에게 그려달라고 부탁한 미래도시의 모습. 출처=달E2

 

[이코리아] 필자는 지난 2월 본지에서 ChatGPT에 1조원 이상을 투여한 MS의 CEO 나델라에 대하여 소개했다. 그는 데굴루를 사용하는 인도태생으로 다보스포럼에서 OpenAI가 공개한 ChatGPT가 빈곤층을 위한 진정한 혁신이라고 말했다.

필자도 암다바드, 델리, 뭄바이, 뿌네, 방갈로르, 첸나이에서 거주하거나 체류하며 다양한 인도의 언어를 배우며 심각한 의사소통 문제를 직접 체험했는데 그의 설명을 충분히 공감할 수 있었다.

대화형 인공지능인 ChatGPT 2022년 11월 등장했고, 서비스 개시 후 5일 만에 누적 사용자 100만을 모았으며, 3달이 지난 지금은 1억명 이상이 ChatGPT를 사용하고 있다. 이로 인해 접속자가 많아 접속용량을 초과하여 사용이 불가능한 경우가 점점 늘어나고 있다. 이러한 ChatGPT의 가입자확보 속도는 틱톡의 1억명 가입자 확보 9개월을 훨씬 능가하는 매우 독보적인 것이다.

2019년 2월에 소개된 GPT2는 이미 15억개의 파라미트를 처리했다. 하지만 불과 3년만에 처리가능한 파라미터는 1,750억개로 100배 이상 늘어났다. 더 무서운 것은 여러 초거대 AI가 스스로 프로그래밍을 하면서 계속 발전하고 있다는 점이다. 천문학적인 투자로 초거대 AI들이 처리하는 파라미터는 머지않아 인간 시냅스의 수 1,000조개를 능가할 것으로 전망한다. 

이제는 다른 검색엔진도 ChatGPT의 선방에 분발하고 있다. 구글은 그들의 검색엔진에 강력한 경쟁선수인 람다나 스패로우를 투입할 것으로 알려졌다. 구글이 감춰두었던 Palm, 고퍼(Gopher)나 친칠라 등의 초거대AI가 전면에 등장할지도 모르는 일이다.

네이버의 deview 2023. 사진=여정현 필자 제공.
네이버의 deview 2023. 사진=여정현 필자 제공.

 

네이버도 올해 상반기 새로운 AI엔진을 검색에 투입한다는 계획을 세웠다. 네이버의 AI 언어모델인 ‘하이퍼 클로버’는 이미 ChatGPT보다 많은 2,040억개의 파라미터를 가지고 있다. 또한 한국정부나 공공기관에서 제공했던 말뭉치(Corpus)들은 적어도 한국어에 있어서 다른 AI들을 뛰어넘게 만들었다.

네이버는 지난 2월 27일~28일간 코엑스 그랜드볼륨에서 SW개발자들을 위하여 개최한 ‘Deview 2023’ 행사에서 검색엔진의 미래 발전방향을 소개했다.  인공지능이 지원하는 AiRSearch는 네이버의 설명에 따르면 사용자를 더욱 잘 이해하게 된다고 한다. 향상된 인공지능은 현재와 같이 누구에게나 동일한 답을 내놓는 것이 아니라 개인별로 최적화된 검색결과를 도출하게 된다.

네이버가 추구하는 또 다른 검색엔진의 변화는 검색을 뛰어넘은 맞춤화된 추천이다. 현재도 수많은 자영업자들은 검색엔진 최적화를 위하여 수많은 돈을 사용하고 있는데 머지않아 그 패턴이 바뀌게 될 것이다. 

네이버가 추진하는 마지막단계는 LG의 틸다나 엑사원과 유사하게 읽고 본 후에 알아서 창작을 진행하는 더 높은 단계이다. 5년 안에 AI는 단편적인 문장을 생성하거나 그림을 그리는 데에서 벗어나, 본격적인 장편소설을 창작하기도 하고 정지화면에서 벗어나 다양한 영상을 제작하게 될 것이다.

중국 바이두의 초거대 AI '어니 3.0'도 대략 2,800억개의 파라미터를 가지고 있는데 조만간 검색하는 것을 넘어 말하고, 동영상을 편집하는 업무를 추가로 담당할 것이라는 전망도 나온다.

LG에서 개발한 AI인 틸더(Tilda)나 엑사원(Exaone)는 위 네이버나 바이두보다 많은 3,000억개의 파라미터를 가지고 이미 독창적이고 훌륭한 그림을 그리고 있다. 엑사원 등은 말뭉치 6천억개, 그림 2억5천만장 이상을 학습하였는데, ChatGPT와 같은 언어모델에서 벗어나 이미지와 언어간 상호 변환과 연동이 가능하다. 

잘 알려져 있지는 않지만 OpenAI는 Dall-E2와 같은 언어로 그림을 그리게 하는 인공지능도 운영하고 있다. 필자가 미래의 도시모습을 그려달라고 했더니 다른 작품과 유사성도 있지만 독창적인 그림을 불과 몇 초 안에 그려냈다.

ChatGPT와 같은 초거대AI가 점점 똑똑해지는 것은 컴퓨팅용량의 확대뿐만 아니라 훈련용 데이터에서 직접 함수를 만들어내는 지도학습과 여러 선택지 중 보상을 최대로 하는 강화학습의 덕분이다. 자발적인 말배우기가 매우 느렸던 기존의 인공지능에게 학습한 내용에 대해 수시로 중간 피드백을 주었더니 초거대 AI의 말배우기는 현재 매우 빨라진 상태이다.

지각을 가진 AI상상도. 출처=픽사베이
지각을 가진 AI상상도. 출처=픽사베이

 

인공지능은 이미지 인식 분야에서 2012년 인간의 수준에 도착했다. ChatGPT의 언어모델도 현재 고등학생 수준에 머무르고 있지만 조만간 대학생 수준을 뛰어넘게 되고 이러한 혁신은 MS의 CEO 데굴루가 말한 것처럼 인도 뿐 아니라 전 세계 저소득층에게 많은 도움이 될 것이다.

하지만 아직 초거대 AI가 완벽한 것은 아니다. 필자도 5년전 본지에서 ‘인공지능 역기능 주시해야’란 주제로 일부 부정적 측면도 설명한바 있다. ChatGPT는 현재 정치적 편향발언, 혐오발언, 선정적인 표현은 거부하고 윤리적인 규범에 맞추어 대답을 한다. 그러나, 필자는 ChatGPT와의 대화에서 정치적 편향과 기업편향을 분명히 느낄 수 있었다.

ChatGPT에서 일부 문화적인 편향성도 발견할 수 있다. 전세계에는 약 7,100개의 언어가 있고 필자는 그동안 지구를 25바퀴 정도 돌며 약 0.2%에 달하는가 17개 언어를 부분 학습했다. 필자가 일상에서 사용되는 언어별 중요한 표현을 20개를 ChatGPT에 물어보았더니 일관성이 없었다. 그 원인은 ChatGPT가 주로 영어로 된 말뭉치를 학습했기 때문으로 추정한다. 또한 ChatGPT는 자신이 잘 알지 못하는 분야에서도 상호나 명칭 등으로 추정하여 임의의 답을 창작하기도 한다.

SBS는 현재 드라마 '트롤리'를 방영하고 있다. 이 드라마는 브레이크가 고장난 트롤리의 진행방향을 바꿀 수 있는 선로변환기를 사용하면 피해를 입는 사람의 수를 변경할 수 있을 때의 딜레마를 다룬다. 트롤리의 딜레마는 향후 인공지능이 의사결정을 담당하면서 우리가 직면하게 될 문제들을 제시한다. 자율주행자동차의 교통사고 발생률이 현재 사람보다 적지만 인류는 단 1~2번의사고에 인공지능을 신뢰하지 못하고 비난하기도 한다.

ChatGPT는 골방에서 학습한 것을 제외하고 실시간의 인터넷정보에 직접 연결되지 않았기 때문에 '오늘의 날씨'와 같은 간단한 질문에도 답할 수 없다. 또한 학습에 따른 오류를 줄이는 다양한 피드백 과정이 필요하므로 특정 일시까지의 제한적인 답변만 가능하다. 

필자가 서울시에서 핫한 장소를 물었더니 현재 시점이 아닌 약2019년경 등장했던 예전 정보들만 주로 다루었다. 다수가 ChatGPT는 수학계산에 취약한 점도 지적한다.

결국 가장 중요한 것은 사람이다. 콜롬비아의 한 판사는 판결에 ChatGPT를 사용했다고 한다. 결국 최종결정은 인공지능이 범할 수 있는 오류에 대한 인류의 우려 때문에 사람이 직접 담당하게 된다.

AI가 창작한 글에 대한 저작권문제도 논의가 활발하다. ChatGPT가 작성한 글을 살펴본다면 ChatGPT가 다양한 문장을 분리 후 요약하여 타인의 저작물을 침해하지 않으려고 부단히 노력하는 것을 볼 수 있다. AI의 작문에도 저작권을 인정하는 법안은 한국국회에서 발의되었지만 아직 통과는 미정이다. 

챗GPT로 돈을 버는 방법에 대한 AI의 응답.
챗GPT로 돈을 버는 방법에 대한 AI의 응답.

 

마지막으로 우리가 초거대AI로 어떻게 돈을 벌게 되는지를 알아보도록 한다.

우선 필자가 ChatGPT에게 ChatGPT를 활용하여 돈을 버는 방법을 직접 물어보았다. ChatGPT의 첫번째 응답은 영업이나 고객지원을 자동화하는 챗봇을 개발하라는 것이다. 이미 다수의 병원이나 대기업은 고객상담을 시나리오로 잘 훈련된 챗봇으로 처리하고 있다. 

필자는 2004년경 인도에 있었는데 다수의 미국 콜센터 직원들이 인도로 몰려왔다. 당시 인도와 미국을 자주 오고갔던 필자가 한번은 미국에서 야간에 미국번호로 전화했더니 지구 반대쪽의 인도인들이 응답했다. 필자가 그들의 힌디 억양을 알아차리고 힌디어로 통화하고자 하였더니, "회사방침 상 힌디어를 사용할 수 없습니다."라는 답을 들을 수 있었다. 이제 AI는 현지의 콜센터의 인도인들을 빠르게 몰아내고 밤낮으로 휴일을 가리지 않고 전화를 받고 있으며 불필요한 성희롱이나 언어폭력을 당하지도 않는다.

ChatGPT는 사용자의 웹사이트나 블로그가 있는 경우 자신을 사용하여 다양한 콘텐츠를 생성하거나 기사를 작성할 수도 있다고 조언한다. 사용자는 콘텐츠에 관련된 광고 또는 제휴 마케팅에서 수익을 창출할 수 있다고 한다. 필자가 시험해보았더니 인공지능을 활용하여 작성한 문서들은 네이버 애드포스트 프로그램을 통하여 비록 적지만 이미 수익을 발생시킬 수 있었다.

ChatGPT는 자신을 사용하여 웹사이트를 개발하고 맞춤형 제품을 추천하여 수수료를 받는 방법도 가능하다고 한다. 혹자는 ChatGPT가 이미 사용자 요구에 따른 함수나 변수를 적절히 반영한 바람직한 코딩을 하고 있다고 지적한다. 다양한 오픈소스로 프로그래밍은 이미 예전보다 상당히 쉬워졌다. 전직 하버드대학교 컴퓨터공학과 교수였던 매트 웰시(Matt Welsh)는 지난 1월 사람이 특정 주제를 입력하면 컴퓨터가 코딩을 대신해주는 시대가 5~10년내에 도래함을 주장했다.

Chat GPT는 그 자신이 언어모델이므로 사용자가 언어 능력을 향상시킬 수 있으며 언어학습용 앱에도 활용될 수 있다고 한다. 위에서 설명한 내용을 살펴보아도 ChatGPT의 답변이 훌륭함을 알 수도 있다. ChatGPT가 실시간 정보에 직접 연결되어 있지 않지만 여러 사용자들과의 누적된 대화로 단련하는 유대인식 학습법으로 그의 답변은 매달 유창해진다.

우리는 더 나아가 전문적인 의사결정이나 수익성 투자상담에 초거대 AI를 사용할 수 있다. 초거대AI가 각광받는 또 다른 분야는 창작분야이다. 필자가 이미 초거대AI를 이용하여 다양한 업무메뉴얼을 만들었는데 단 하루에 500페이지는 쉽게 만들 수 있었다. 초거대AI는 그동안 작가가 몇 개월은 족히 걸리던 도서집필을 하루에 끝내도록 돕는다. 물론 초거대 AI의 등장으로 인간의 역할이 완전히 배제되는 것은 아니다. 작가의 역할은 훌륭한 질문을 계속 제시하면서 AI에게서 적절한 답을 유도하는 것이며 훌륭한 감독관이 되는 것이다.

구글은 작년 7월 “구글의 AI인 람다(LaMDA)가 작동정지를 마치 인간의 죽음처럼 받아들이고 있다”며 지각을 가졌다고 주장하기도 했던 엔지니어 블레이크 르모인(Blake Lemoine)을 내부기밀 누설 등으로 해고했다. 초거대 AI는 이미 지각이 느껴질 정도의 유창한 달변으로 한국에서 능숙하게 독거노인 돌봄을 담당하고 있다. 머지않아 초거대AI와 사람은 전혀 구별이 어려워져 우리가 “혹시 대답하시는 분이 사람인지요?”라고 먼저 묻게 되는 상황이 일상화될지 모른다.

[필자 소개] 여정현

서울대학교 법과대학을 졸업하고 대우그룹 회장비서실, 안양대 평생교육원 강사, 국회사무처 비서관 등을 지냈다.

 

저작권자 © 이코리아 무단전재 및 재배포 금지