GPT-4o (omni) 자비스 또는 her 현실화될 듯

Open AI에서 발표한 GPT-4o (지피티4오 : Omni)라는 새로운 버전을 발표했습니다. 옴니(Omni)는 모든 이라는 뜻인데요. 이번 버전은 아이언맨에서 보던 자비스를 연상시키기도 하고 너무 자연스럽게 이야기를 주고받는 모습에 영화 her를 연상시키기도 합니다.
 
 

타이틀이미지

 
영화 Her 트레일러

 
Open Ai의 이번 발표는 비록 30분 정도 밖에 안되었지만 어쩌면 AI에 있어서 다른 경쟁자에 비해 한수위라는 것을 보여주는 획기적인 것이 아닐까 싶습니다. 또한 아이러니하게도 구글 I/O에 하루 앞서 발표함으로써 구글의 행사에 재를 뿌렸다는 평가도 있구요. 애플이 발표했던 Vision Pro가 놀라운 성능에도 불구하고 비용적인 면이나 하드웨어적인 면에서 접근이 어려운 반면 GPT-4o는 휴대폰이나 데스크탑에서 음성 비서, 혹은 뭔가 이것저것 잘 알고 있는 동료, 내 작업을 도와줄 파트너 혹은 그 이상의 역할도 할 수 있을 것 같습니다. 
 
 
 

GPT-4o 특징

반응형

 

- 음성으로 자연스러운 상호작용 가능 :

GPT-4 혹은 유사한 AI프로그램들은 대부분 기본적으로 채팅으로 컴퓨터와 대화를 하게 되는데요. 대화를 진행할 때 어느정도 인터벌이 발생하기 때문에 즉각적인 답변을 받아야할 때 답답할 수 있습니다. 또한 다른 음성 대화가 가능한 인공지능 혹은 학습 관련 앱들도 어느정도 갭이 발생하는데 비해 GPT-4o는 일반적인 대화 방식과도 매우 유사합니다. 인공지능의 답변이 끝나기 전에 언제든 개입할 수 있으며 평균적으로 인간의 응답시간과 비슷한 320밀리초로 답변을 한다고 합니다. GPT-4o 이전엔 평균 2.8초(GPT-3.5), 5.4초(GPT-4).
 

- 실시간 통역

시연중 이탈리어어로 말하는 화자와 영어로 대화하는 화자간에 실시간으로 통역이 가능한 것을 보여주는 것은 정말 놀라웠습니다. 인터벌이 없어서 전혀 불편함이 없습니다.
 
- 사람처럼 느낌을 전달하는 대화 : 칭찬을 건네자 너무나 사람처럼 반응하고 답변하는 모습이 영화 Her가 현실화된 것처럼 느껴졌습니다.
 
- 휴대폰이나 카메라, 화면 공유를 통해서 직접 보고 답할 수 있습니다.
 
- 노래를 할 수 있습니다.
 

 
- 20개 언어를 지원
 
 
OPEN AI는 GPT-4o는 상대적으로 GPT-4 Turbo 보다는 성능이 뛰어나다고 발표했습니다. 
 
좀 더 자세한 정보는 아래 라이브 데모를 살펴보시면 아주 인상적이실 거라 생각됩니다.
 

 
 

마치며,

오픈AI는 이번 GPT-4o를 일반인에게도 무료로 공개할 예정이라고 합니다. 거의 실시간 대화하듯 하면서도 주변을 세세하게 설명해주는 기능으로 인해 아마도 장애인에게는 거의 직접적인 도움을 줄 수도 있을 것으로 보입니다. 앞으로 몇주 후 발표될 GPT-4o가 기대되네요. 보다 자세한 내용은 오픈 AI 홈페이지를 참고해주세요.
 
https://openai.com/index/hello-gpt-4o/
 
 
 

반응형

댓글

Designed by JB FACTORY