= 오픈 AI 누리집
= 오픈 AI 누리집

[이코리아] 오픈 AI가 자사의 대화형 AI '챗 GPT'에 새로운 이미지 기능과 음성 기능을 추가하며 AI 음성 비서 경쟁에 뛰어들었다. 오픈 AI는 25일 누리집에 올린 “챗 GPT는 이제 보고 듣고 말할 수 있습니다.”라는 게시물을 통해 챗 GPT의 새로운 음성 및 이미지 기능을 발표했다. 

챗 GPT의 음성 기능은 이용자가 한 말을 음성 인식 시스템 ‘위스퍼’를 사용해 텍스트로 변환하고, 이에 대해 챗 GPT가 내놓은 답변을 다시 음성으로 변환시켜 이용자에게 제공한다. 이용자는 이를 통해 기존의 프롬프트 채팅 방식을 사용하는 대신 챗 GPT와 직접 목소리로 대화할 수 있게 된다. 챗 GPT는 일종의 인격인 5개의 ‘페르소나’ 중 하나를 통해 사용자의 질문에 응답할 수 있다.

이미지 기능은 멀티모달 GPT-3.5 및 GPT-4를 기반으로 한다. 이 모델들은 사진, 스크린샷, 텍스트와 이미지가 함께 있는 문서 등 다양한 이미지의 세부 내용을 추론할 수 있다. 오픈 AI는 이용자가 해당 기능을 활용해 여행 중 찍은 사진에 대해 대화하고, 냉장고의 사진을 찍어 식사 메뉴를 구상하고, 자녀의 수학 숙제를 찍어 도움을 받을 수 있다고 밝혔다.

= 오픈 AI 누리집
= 오픈 AI 누리집

오픈 AI는 이미지 기능의 시연 영상도 함께 공개했다. 시연에서는 이용자가 자전거의 사진을 챗 GPT에게 보여주며 자전거 안장을 낮추는 방법을 질문하자 챗 GPT는 자전거 안장 정비방법에 대해 설명한다. 또 자전거의 안장 부분을 확대해 그리기 도구로 동그라미를 쳐 특정 부품에 대해 질문하자, 챗 GPT는 해당 부품이 볼트이며 이를 정비하기 위해서는 육각 렌치가 필요하다고 설명해준다. 마지막으로 이용자가 공구 상자와 설명서를 촬영해 적합한 도구가 있는지 질문하자 챗 GPT는 육각 렌치의 위치를 이용자에게 알려준다.

챗 GPT의 새로운 음성과 이미지 기능은 앞으로 2주에 걸쳐 챗 GPT의 유료 서비스 ‘챗 GPT 플러스’와 기업용 서비스 ‘챗 GPT 엔터프라이즈’ 고객에게 출시된다. 음성 기능은 모바일에서 사용 가능하며, 이미지 기능은 모든 플랫폼에서 사용할 수 있다. 오픈 AI는 음성 및 이미지 기능의 추가를 통해 이제 챗 GPT는 세상을 보고 듣고 음성으로 응답할 수 있는 챗봇인 진정한 ‘멀티모달’ 모델로 한 걸음 더 나아갈 수 있게 되었다고 밝혔다.

= 아마존 누리집
= 아마존 누리집

음성 기능의 추가로 이제 챗 GPT는 아마존의 '알렉사'와 애플의 '시리' 등 다른 기술 기업들의 AI 음성 비서들과 직접 경쟁하게 되었다. 특히 아마존은 자사의 음성 비서 플랫폼 ‘알렉사’에 생성 AI 기술이 적용된 것을 20일에 발표했는데 이에 따라 챗 GPT와 알렉사의 정면 대결이 예고된다. 

아마존에 따르면 AI 기술이 적용된 새로운 알렉사는 웨이크 워드(가동 명령어) 없이 대화를 재개하고, 더 빠르게 응답하고, 사용자 선호도를 학습하고, 후속 질문을 받고, 주제에 따라 어조를 변경할 수 있게 된다. 시연 영상에 따르면 알렉사는 스포츠에서 날씨까지 다양한 주제로 이용자와 대화를 나눌 수 있으며, 이전에 했던 대화를 기억하고 맥락을 유지하는 능력 또한 보여준다. 데이비드 림프 아마존 제품 담당 수석부사장은 “이제 알렉사는 거의 사람과 같은 상호작용을 할 수 있다.”라고 밝혔다. 

알렉사의 또 다른 강점은 스마트홈 등 기존의 아마존 서비스와 연동되어 있다는 점이다. 이용자는 알렉사에게 “거실 조명을 더 밝게 해줘” “로봇 청소기로 거실을 청소해 줘”와 같은 명령을 내려 집의 각종 기기를 관리할 수 있다. 

= 픽사베이
= 픽사베이

구글 역시 구글의 AI 비서 서비스 ‘구글 어시스턴트’에 생성 AI 기술을 도입하는 작업에 들어갔다. 지난 7월 외신에 따르면 구글은 직원들에게 보낸 이메일을 통해 구글 어시스턴트를 정비해 생성 AI 기술에 집중할 계획이라고 밝혔다. 해당 메일을 작성한 피유쉬 란잔 구글 부사장은 “구글은 여전히 어시스턴트의 개발에 전념하고 있으며, 앞으로 밝은 미래를 낙관한다.”라고 밝혔다.

저작권자 © 이코리아 무단전재 및 재배포 금지