빠르게 알아보는 GPT-4 (feat. ChatGPT)

GPT-3.5가 적용된 ChatGPT의 충격이 채 가시기도 전에 GPT-4가 발표되었습니다. OpenAI에서 발표한 내용과 직접 활용해 본 경험을 녹여서 중요한 내용만 빠르게 짚어보도록 하겠습니다. # 주요 특징 GPT-4의 가장 큰 특징은 텍스트뿐만 아니라 이미지도 이해하는 멀티모달AI가 적용됐다는 점입니다. 최근 업스테이지에서 출시한 ChatGPT 'AskUp'은 이미지 내 텍스트를 인식할 수 있는 OCR 기술이 접목되어 화제가 되었습니다. GPT-4는 한발 더 나아가 단순 텍스트 뿐 아니라 이미지 내 특징까지 인식하여 더욱 높은 수준의 대화와 답변이 가능할 것으로 예상됩니다. (현재 이미지 입력 기능은 아직 리서치 프리뷰라 사용이 제한되어 있습니다.) # 업그레이드 멀티모달 기능뿐 아니라, 기존 GPT-3.5보다 모든 면에서 업그레이드 된 면모를 보이고 있습니다. 발표된 것들 중 수치화할 수 있는 것들을 몇 개 나열해보면, 1) 단어 처리 수 8배 증가 2) 약 50페이 분량의 명령어 입력 가능 3) 언어 지원 수 26개 국어 4) 할루시네이션(거짓말) 40% 개선 특히 할루시네이션은 신뢰도 측면에서 반드시 잡아야 과제로 손꼽혔는데, 많은 개선이 있었던 것으로 보입니다. # 파장은? 이렇게 모든 면에서 업그레이드 되었지만, 감히 예상컨데 ChatGPT(GPT-3.5)가 출시되었을 때 만큼의 충격파는 없을 것으로 예상됩니다. 이미 GPT-3.5만으로도 충분히 큰 충격을 받아 역치가 높아졌기 때문입니다. 성능이 높아졌다고는 하나 일반인이 체감하기는 어려울 것으로 보이고, 동작 방식이나 인터페이스에 큰 변화가 없기 때문에 GPT-3.5와 큰 차이를 느끼기 쉽지 않을 것 같습니다. 거기에 더해 OCR 기능이 추가된 'AskUp' 까지 나온 상황이다보니 ChatGPT가 첫 출시되었을 때보다 더 큰 충격을 주기는 어려울 것 같습니다. 다만, 이미지 입력 기능 제한이 풀린다면 활용폭은 대폭 증가할 것으로 보입니다. # OCR 기본적으로 OCR 기능이 탑재되어 있기 때문에 텍스트가 포함된 책을 사진 찍어 업로드하거나, 컴퓨터 화면 속의 코드 등을 캡쳐 후 업로드하여 필요한 답변을 받거나, 요약 등의 업무에 활용할 수 있을 것으로 보입니다. # 이미지 인식 그와 더불어 이미지 인식 기능을 다양하게 활용할 수 있습니다. 예컨대, 어떠한 요리 사진을 보여주면서 "이 음식은 어떤 음식이며, 칼로리는 얼마인지, 레시피는 무엇인가요" 등을 물어볼 수 있고, 특정 상황을 보여주면서 "지금 무슨 상황이 벌어지고 있으며, 앞으로는 어떤 상황이 예상되나요?" 등을 물어볼 수도 있습니다. # 앞으로는? 충격파가 적을 뿐 사용량은 꾸준히 늘어날 것으로 보입니다. 어느정도 ChatGPT(3.5)에 대한 사용법이 적응된 상태이지만, 이미지 인식 등을 통해 활용폭이 넓어졌기 때문에 더 다양한 산업과 분야에서 사용 방법이 더 활발히 연구되고 적용될 것으로 기대됩니다. # 마치며 뜬금없지만 제 개인적인 얘기로 마무리 해보려고 합니다. 사실 저는 ChatGPT가 나오고 나서 글쓰기에 대한 자신감이 많이 떨어진 상태였습니다. 저보다 글을 더 잘 쓰는 AI가 등장했기 때문입니다. 그렇게 좌절하고 있을 때, 예전 알쓸인잡에 김상욱 교수님이 하신 말씀이 기억났습니다. "사진기가 발명됐을 때 그림을 그리는 사람은 다 망할 것이라고 했지만 그렇지 않았다. 사람보다 훨씬 빠른 자동차가 개발됐음에도 아직까지 육상시합을 보며 열광을 한다. 이렇듯 기계와 경쟁하는 시대에 우리가 살아남는 방법은 인간의 상상과 의미 부여를 통해 인간이 하는 일을 더 가치있게 여기면 된다" 저보다 기계가 글을 더 잘 쓸 수는 있더라도, 기계보다 더 가치있고, 더 의미있는 글을 쓸 수 있도록 노력해보려고 합니다. 긴 글 읽어주셔서 감사합니다.