윤영찬 더불어민주당 의원의 ‘카카오 문자’ 논란이 인공지능 뉴스 편집의 공정성 논란으로 번지고 있다. 

앞서 윤 의원은 지난 8일 보좌관에게 포털사이트 ‘다음’의 모바일 메인화면을 문제 삼으며 카카오 관계자를 국회로 부르라고 지시하는 내용의 문자메시지를 보내 물의를 빚은 바 있다.

이후 포털 뉴스를 통제하려 한다는 비판이 이어지자 윤 의원은 9일 페이스북을 통해 “여야 대표연설의 포털 노출 과정의 형평성에 의문을 가졌던 것”이라며 “비록 보좌진과의 대화라 해도 엄밀한 자세와 적절한 언어를 사용하지 못했다. 질책을 달게 받겠다”고 사과했다. 

윤 의원의 사과로 사태가 일단락됐지만, 정작 논란은 다른 방향으로 번지고 있다. 다음 창업자인 이재웅 전 쏘카 대표가 포털 뉴스의 해명이 충분하지 않다고 지적하고 나섰기 때문. 이 전 대표는 9일 페이스북을 통해 “윤 의원의 문제 제기에 대한 포털의  “AI가 했으니까 우리는 중립적이다”라는 이야기도 윤 의원의 항의만큼이나 무책임한 답변“이라고 지적했다. 

네이버·카카오는 인공지능(AI) 알고리즘을 통해 뉴스를 편집하며 인위적 개입은 하지 않고 있다는 입장이다. 반면 이 전 대표는 “많은 사람들이 AI는 가치중립적이라고 생각하지만 그렇지 않다. 규칙 기반의 AI는 그 시스템을 설계하는 사람의 생각이 반영될 수밖에 없다”며 “그래서 AI시스템이 차별하지 않는지 정치적으로 중립적인지 판단하기 위한 감사 시스템이 필요하다”고 강조했다. 

포털사이트 '다음'의 창업자 이재웅 전 쏘카 대표가 AI 알고리즘 뉴스 편집의 신뢰성 문제를 제기했다. 사진=이재웅 전 쏘카 대표 페이스북 갈무리
포털사이트 '다음'의 창업자 이재웅 전 쏘카 대표가 AI를 통한 뉴스 편집의 신뢰성 문제를 제기했다. 사진=이재웅 전 쏘카 대표 페이스북 갈무리

◇ 네이버·카카오, “뉴스 편집은 AI 몫, 사람 개입 없다”

현재 네이버와 카카오는 모두 AI 뉴스 알고리즘을 사용 중이다. 카카오는 지난 2015년 6월 자체 개발한 알고리즘 ‘루빅스(RUBICS)’를 도입해 뉴스를 편집·배치하고 있으며, 네이버 또한 2018년 9월부터 ‘에어스(AiRS)’라는 알고리즘을 활용하고 있다. 양사는 뉴스 편집의 공정성을 검증하기 위해 외부 전문가로 구성된 위원회를 구성해 매년 알고리즘을 검토받고 있다.

두 포털은 모두 천재지변이나 재해재난 등 반드시 알려야 하는 특수한 사건이 아닌 한 뉴스 편집에 사람이 개입하지 않는다는 입장이다. 하지만 이를 믿는다고 해도 문제는 남는다. AI 알고리즘을 통해 뉴스를 편집·배열하는 것이 과연 ‘공정성’을 보장할 수 있을까? 

AI 알고리즘은 사용자의 정보를 바탕으로 최적화된 뉴스를 전달한다. 하지만 이런 알고리즘을 통해 접할 수 있는 기사는 대부분 사용자의 관심사에 속하거나, 사용자의 관점과 동일한 것뿐이다. 자칫 알고리즘 설계로 인해 사용자가 편향된 정보만을 접하게 될 수 있다는 것. AI 알고리즘이 사용자 정보에 맞게 필터링된 정보를 제공하면서 발생하는 ‘필터 버블(Filter Bubble)’의 문제다.

포털은 기사의 품질을 검증해 더 좋은 기사를 추천하는 알고리즘을 설계함으로서 이러한 문제를 극복할 수 있다고 주장한다. 실제 네이버 알고리즘 검토위원회는 지난 2018년 네이버의 ‘에어스’ 알고리즘의 사용자의 기사 소비성향뿐만 아니라 기사의 품질까지 함께 고려해 작동한다고 밝힌 바 있다. 

하지만 당시 검토위에서는 알고리즘 검증에 초점을 맞췄기 때문에 기사의 품질을 검증하는 과정에 대해서는 조사가 제대로 이뤄지지 않았다. 또한 무엇이 공정한 편집이고 어떤 기사가 저널리즘적 가치에 충실한 기사인지에 대해서도 포털 스스로 분명한 기준을 세우지 못하고 있다.

뉴스를 편집하는 것은 AI 알고리즘이지만 이를 설계하는 것은 사람이다. 설계자에게 명확한 기준이 없다면 AI라고 해도 무작정 신뢰할 수 없다는 것이다.

애플뉴스는 구독자에게 AI가 선별한 뉴스와 인간 편집자가 선별한 뉴스를 함께 제공한다. 사진=애플뉴스 갈무리
애플뉴스는 구독자에게 AI가 선별한 뉴스(트렌딩 스토리)와 인간 편집자가 선별한 뉴스(톱 스토리)를 함께 제공한다. 사진=애플뉴스 갈무리

◇ AI 대 인간, 뉴스 편집 연구 사례

그렇다면 실제로 AI와 인간 중 누가 더 공정하게 뉴스를 편집하는지 비교한 연구는 없을까? 지난 6월 열린 미국 인공지능학회(AAAI)의 제14회 웹 및 소셜미디어 국제학회(ICWSM 2020)에는 흥미로운 논문 한 편이 발표됐다. 미국 노스웨스턴 대학교 행동과학센터의 잭 반디(Jack Bandy) 연구원이 작성한 이 논문은 ‘애플뉴스(Apple News)’의 뉴스 알고리즘을 2개월간 분석한 내용을 담고 있다. 

애플뉴스는 구독자에게 AI 알고리즘이 선정하는 ‘트렌딩 스토리(Trending Stories)’와 인간 편집자가 선별하는 ‘톱 스토리(Top Stories)’를 함께 제공한다. 반디 연구원은 5분마다 애플뉴스에 올라온 기사를 검색·저장하는 프로그램을 통해 지난해 3월부터 5월까지 2개월간 애플뉴스에 노출된 톱 스토리 1268건과 트렌딩 스토리 3144건을 수집했다. 

AI와 인간의 편집 경향을 비교한 결과, 인간 편집자가 AI보다 더 다양한 매체의 뉴스를 더 공평하게 노출시켰다. AI의 경우 상위 4개 매체의 뉴스가 차지하는 비중이 53.4%였던 반면, 인간 편집자의 경우 30.4%에 불과했다. 상위 10개 매체로 범위를 넓혀도 AI 74.9%, 인간 56.7%로 차이가 컸다. AI 알고리즘이 특정 매체의 뉴스를 선별적으로 보여주는 경향이 있다면, 인간 편집자는 좀 더 다양한 매체의 뉴스를 노출시키고 있다는 뜻이다.

애플뉴스 분석 결과 AI와 인간이 선호하는 매체의 종류나 비중이 전혀 다른 것으로 나타났다. 자료=미국 인공지능학회(AAAI)
애플뉴스 분석 결과 AI(왼쪽)와 인간이 선호하는 매체의 종류나 비중이 전혀 다른 것으로 나타났다. 자료=미국 인공지능학회(AAAI)

선호하는 매체나 뉴스의 특성도 달랐다. AI 알고리즘은 버즈피드, 허핑턴포스트, 배너티 페어 등 트렌드를 잘 반영하고 연예기사나 유명인 소식이 자주 보도되는 매체의 기사를 선호했다. 반면 인간 편집자는 워싱턴포스트, NBC, 뉴욕타임스, 월스트리트저널 등 시사이슈를 다루는 전통적인 매체를 선호했다. 상위 10개 매체 중 인간 편집자와 AI 알고리즘이 모두 선호한 매체는 CNN 뿐이었다.

이는 AI가 스포츠·연예 이슈 등 많은 사람들이 관심을 가질 수 있는 가벼운 가십성 기사를 구독자에게 더 자주 노출시킨다는 것을 의미한다. 반디 연구원는 “트렌딩 스토리 섹션에는 ‘시체로 발견되다’ 같은 문구가 포함된 충격적이고 선정적인 뉴스가 더 많이 올라왔다”며 “반면 톱 스토리 섹션에는 ‘건강보험개혁법’, ‘이민자 보호도시’ 등 실질적인 정책 이슈와 관련된 핵심 용어들이 더 많이 등장했다”고 설명했다. 

실제 AI 알고리즘과 선정한 뉴스에는 케이트 미들턴, 메건 마클, 킴 카다시안, 윌리엄 왕자, 저스틴 비버 등 유명인의 이름이 빈번하게 등장한다. 반면 인간 편집자가 고른 뉴스에 자주 등장한 단어는 법무장관, 2020 대선, 국경 장벽, 브렉시트 등으로 정치·경제 이슈와 관련된 것이 많았다.

도널드 트럼프 미국 대통령을 다루는 방식도 달랐다. AI가 고른 뉴스에는 ‘도널드 트럼프’, ‘이방카 트럼프’, ‘트럼프 주니어’ 등 대통령 일가의 본명이 자주 등장했지만, 인간이 고른 뉴스에는 대통령의 본명보다는 ‘트럼프 세금 환급’처럼 정책과 관련된 단어가 주로 등장했다

◇ '카카오 문자' 논란, AI 알고리즘 공개 논의로 이어질까

이 연구는 AI 알고리즘이 저널리즘적 가치와 공정성을 보장하는 것은 아니라는 사실을 잘 보여준다. 설계자가 ‘필터 버블’에 대한 고민 없이 알고리즘을 만들 경우, 사용자가 접하는 정보는 심각하게 편향될 위험이 있다.

전문가들도 같은 우려를 제기하고 있다. 송경재 경희대 인류사회재건연구원 교수는 지난해 11월 열린 토론회에서 “포털뉴스에 인공지능이 도입된 것은 그동안 논란이 되었던 편집 편파성, 또는 정파성 문제에서 벗어나고 객관적인 기준으로 뉴스를 서비스하겠다는 의도”라면서도 “뉴스처럼 사회적 영향력이 큰 정보전달에서 인공지능이 완전히 사람을 대체한다는 것은 가능할까”라고 의문을 제기했다. 

이 때문에 일각에서는 대형 포털이 뉴스 편집 알고리즘 소스를 외부에 공개해야 한다는 목소리도 나온다. 카카오의 경우 지난 2017년 루빅스 개발과정을 정리해 논문으로 발표한 바 있지만, 세부적인 내용까지는 공개하지 않고 있다. 네이버 또한 에어스의 세부 알고리즘을 공개한 적이 없다.

다만 알고리즘은 각 포털의 영업 노하우로 공개하기 쉽지 않은 데다, 자칫 공개했다가 어뷰징 목적으로 악용될 우려가 있다는 반론도 나온다. 윤 의원이 의도치않게 촉발한 AI 편집자의 공정성 논란이 어떤 방향으로 흐르게 될지 귀추가 주목된다.

저작권자 © 이코리아 무단전재 및 재배포 금지