GPT-4 출시 언어 능력 수준이 사람을 능가 / GPT-4 체험할 수 있는 곳

오픈 AI가 GPT-4 출시를 밝혔습니다. 이미 Chat GPT를 사용해본 분들은 일부 데이터의 한계와 오류가 있지만 간단히 채팅으로 명쾌한 답을 내놓는다거나 심지어 프로그램 코드도 짜는 GPT-3의 능력을 체감하고 환호와 우려를 하기도 했는데요. 이제 생성형 인공지능의 대규모 언어모델(LLM) GPT-4를 내놓았습니다. 현지시간 3월 14일입니다. 현재 chat GPT는 GPT-4가 아니지만 사용할 수 있는 곳이 있습니다.

 

 

 

OpenAI

Introducing GPT-4, OpenAI’s most advanced system

openai.com

 

GPT-4는?

구글을 위협한다는 GPT-4는 그동안 수많은 사람들이 경험한 GPT 3.5의 업그레이드 판입니다. Chat GPT는 지금 글을 쓰고 있는 현재엔 아직 업그레이드 되지 않았습니다. 조만간 Chat GPT도 4로 업그레이드가 될텐데요. 

 

 

Chat GPT 바로가기

 

지금 GPT 4는 발표와 더불어 여러가지 전문시험을 치르는 테스트를 거쳐 "사람의 수준 이상의 능력"을 보여주고 있다고 알려져 있습니다.

 

반응형

 

GPT-3.5 가 미국 변호사시험에서 하위 10%를 기록한 것에 비해 GPT-4는 같은 시험에서 상위 10%의 성적을 거뒀다고 합니다. 이전 버전에 비해 GPT-4는 "훨씬 더 창의적이고 신뢰할 수 있으며 더 미묘하고 복잡한 명령 처리가 가능"하다고 합니다. 미국 변호사시험은 400점 만점인데요 이전 버전은 213점 획득, GPT-4는 298점을 받았습니다. 법률 지식이 그만큼 늘어난 것이구요. 

 

미국 수학 능력 시험인 SAT의 읽기, 쓰기 테스트에서 GPT-4가 800점 만점에 710점을 받았고 (3.5 는 670점), 수학의 경우 3.5버전의 약점으로 지적되었으나(590점) 700점으로 크게 향상되었습니다. 또한 의학지식은 정답률이 75%로 향상되었다고 합니다.(종전 53%)

 

GPT-4의 매개 변수 규모는?

GPT-4의 매개 변수 규모는 아직 알려져 있지 않습니다.  GPT-3가 약 1천 750억 개의 매개변수를 사용했다고 하는데요. 종전에 알려진 바로는 GPT-4가 약 100조개까지 매개변수를 사용하게 될 것이라고 예측되었었죠. 

한번에 처리할 수 있는 단어량이  영어를 기준으로 GPT-3.5버전에서는 3000개, GPT-4는 무려 25,000개로 8배 이상 늘어납니다. 

 

 

위험한 답변을 할 가능성은?

GPT-3.5 도 여러가지 반복되는 질문과 연쇄적인 질문을 받는 과정에서 대단히 위험한 답변을 내놓거나 엉뚱한 답을 하는 경우가 발견되어서 AI에 대한 우려를 낳기도 했는데요. GPT-4는 여러가지 보정과정과 의학, 사회 안정, 사이버 보안 등 여러가지 전문 분야의 전문가들 50여명이 안전을 강화한 필터를 만들었다고 합니다. 그로 인해 위험한 답변을 하지 않도록 적용하였으며 허용되지 않는 답을 하는 경우는 20% 이하라고 합니다. 또한  GPT4는 사실이 아닌 것을 강한 확신으로 답변하는 환각오류가 비율이 이전 버전보다 획기적으로 줄어 40% 더 높은 점수를 얻었다고 합니다.

 

 

GPT-4 체험할 수 있는 곳

Chat GPT에서는 GPT-3.5만 적용되어 있지만 마이크로소프트 Bing에는 이미 초기 버전의 GPT-4가 반영되어 있다고 합니다. 어떤 결과를 얻을 수 있는지 테스트해보시면 좋을 것 같습니다. 

 

 

Info

This magnificent bird’s-eye image of a maze of bus

www.bing.com

다만 제가 테스트를 해보니 GPT-3.5인 것 같고 빙에서 검색을 해보면 GPT-3.5에서 업그레이드된 프로메테우스 모델을 기반으로 한다고 합니다. 그래서 기사에서는 빙에 GPT-4 가 탑재되었다던데 어떻게 된 것인지 물어보니까 다음과 같이 답변했습니다.

 

 

 

마치며,

GPT-4가 출시됨으로써 또한번 AI의 능력이 세상을 놀라게 할 것으로 기대와 우려가 동시에 존재하는데요. 오픈 AI는 여전히 해결해야할 많은 한계가 있다고 밝혔고 여전히 옳지 않은 것을 확신에 차 말하는 경향도 존재합니다. 또한 사람의 일자리를 위협하는 AI에 대해서 우려의 목소리도 높고 걱정도 되죠. 어떻게 하면 우리가 GPT-4를 지배하고 사용할 수 있을 것인지 고민이 필요할 것 같습니다.

 

 

 

반응형

댓글

Designed by JB FACTORY