안녕하세요! 행복한 잡러입니다!

이번에는 OpenAI의 LLM 모델인 ChatGPT의 새로운 버전인 o3에 대한 소식이 나와
이에 대해 알아보도록 하겠습니다!
최근에는 OpenAI의 ChatGPT나 Anthropic의 Claude 등
추론형 LLM을 다양한 용도로 사용하는 사람들이 굉장히 많습니다!
저 또한 이를 업무에 다양하게 사용하며, 이를 통해 업무 효율이 굉장히 상승되고 있습니다.
ChatGPT에서 현재 접근가능한 모델에는 4o, o1, o1 mini, o1 pro가 대표적입니다.
이 중 o1은 고난도 코딩, 고등 수학 등과 같은 복잡한 문제에 특화된
추론형 멀티 모달 모델입니다.
(여기서 멀티 모달이란 텍스트, 이미지, 오디오 등 다양한 입력 처리가 복합적으로 가능하다는 뜻입니다!)
o1 모델은 CoT (Chain of Thought)라는 기법을 통해 논리적인 추론을 진행하고 있습니다.
CoT는 복잡한 문제를 해결할 때, 모델이 중간 단계를 명시적으로 거치며 논리적으로 추론하도록 유도하는 기법입니다.
아래 예시를 통해 쉽게 알아봅시다.
문제
사과는 3개에 6000원, 바나나는 2개에 4000원이다. 사과 9개와 바나나 6개는 총 얼마인가?
CoT를 통한 추론 :
- 사과 3개의 가격은 6,000원이므로, 사과 1개의 가격은 6,000÷3=2,0006,000 ÷ 3 = 2,000원입니다.
- 사과 9개의 가격은 2,000×9=18,0002,000 × 9 = 18,000원입니다.
- 바나나 2개의 가격은 4,000원이므로, 바나나 1개의 가격은 4,000÷2=2,0004,000 ÷ 2 = 2,000원입니다.
- 바나나 6개의 가격은 2,000×6=12,0002,000 × 6 = 12,000원입니다.
- 사과 9개와 바나나 6개의 총합은 18,000+12,000=30,00018,000 + 12,000 = 30,000원입니다.
답변: 총합은 30,000원입니다.
이와 같이 LLM이 답변을 바로 출력으로 내는 것이 아니라,
내부에서 의도적으로 중간 과정에 대한 답변을 냄으로써,
논리적으로 추론할 수 있도록 유도하는 기법입니다.
실제로 이러한 기법은 추론 문제에 있어 LLM 모델의 정확도 증가에 기여한다고 알려져 있습니다.
o1 mini는 이러한 추론형 모델인 o1의 경량화 모델이며,
성능이 살짝 떨어지지만 그만큼 모델이 가볍고, 답변도 빠릅니다.
o1 pro는 현재 200달러를 통해 사용 가능한 ChatGPT pro 버전에서 사용가능하며,
o1 모델 10개를 동시에 돌려, 가장 좋은 응답을 내놓는 원리라 생각하시면 편합니다.
이번에 새로 공개된 o3 모델은 o1 모델의 후속 모델입니다.
o3 모델은 2025년 초에 공개 예정이라고 합니다.
(참고로 o2가 아닌 이유는 영국의 통신사 o2와 분쟁이 생길까봐라고 하네요 ㅎㅎ)
o3 모델은 코딩 능력을 보는 SWE-bench에서 o1 모델에 비해 월등히 성능이 올랐으며,
미국 수학 경시대회 AIME에서 o1보다 13.4점 높은 점수를 받았으며,
박사 수준 과학 문제에서 o1에 비해 9.7점 높은 점수를 받았습니다.
추가적으로 o3 mini 역시,
위 그래프와 같이, 코딩 문제 및 여러 지표에서 o1을 압도하는 성능을 보여주었습니다.
그러면서 o1보다 적은 비용을 소모하기에 후에 o1을 대체할 모델로 기대를 받고 있습니다.
(x축이 사용되는 cost입니다.)
다만 o3모델의 경우, 성능이 매우 좋기는 하지만,
그 문제를 푸는 데에 필요한 비용이 현실적으로 너무 큰 수준이라
상용화까지는 시간이 좀 걸릴 것으로 보입니다.
예시를 통해 그 수준을 보여드리면,
인간에게는 어렵지 않지만 AI에게는 어려운 문제들로 구성된 ARC-AGI에서
o3는 87.5점으로 85점 기준을 넘어 인간 전문가 수준을 넘겼지만,
해당 점수를 얻기 위해 한 문제에만 약 500만원 정도를 소요했다고 합니다.
확실히 이를 일반인이 사용하기에는 너무 비용이 큰 것 같습니다...
오늘은 LLM이 어떠한 방식으로 추론 문제를 풀 수 있는지,
현재 2025년 공개 예정인 최신 모델 o3는 어떠한 모델인지,
그 성능과 이전 모델과 다른 점은 어떠한 지에 대해 알아보았습니다!
다음에 또 재미있는 뉴스가 있다면 찾아오도록 하겠습니다!
감사합니다!

'시사 정보' 카테고리의 다른 글
티스토리 5분만에 네이버 애널리틱스 등록하기! (0) | 2025.01.02 |
---|---|
티스토리 5분만에 구글 애널리틱스 적용 방법! (0) | 2024.12.31 |
티스토리 블로그가 구글에 검색이 안될 때! 해결 방법 (4) | 2024.12.27 |
겨울 제철 과일 딸기! 어떻게 하면 오래 보관할까? 딸기 오래 보관하는 법, 딸기 제철 (1) | 2024.12.24 |
삼성 전자 언제까지 떨어질까..? 삼성 전자 주가 하락 원인은? (2) | 2024.12.22 |