2022년 11월 30일 오후 (PST). OpenAI가 한 챗봇을 조용히 공개했다. 회사 내부에서도 큰 기대 없이 — 누군가는 "research preview"라고 불렀다. 그러나 5일 후, 사용자가 100만 명을 넘었다. 2개월 후엔 1억 명. 인터넷 역사상 가장 빠르게 큰 제품이 됐다.
2017년 Google의 Transformer 논문(EP03)이 나온 후, 한 가지 질문이 떠올랐다 — "Transformer를 거대한 텍스트 데이터로 사전 학습(pre-train)시키면 어떻게 될까?"
2018년에 두 곳이 거의 동시에 답을 냈다. Google은 2018년 10월 BERT를 발표 (Jacob Devlin 외). 양방향 학습 — 한 단어의 좌우 맥락을 동시에 본다. OpenAI는 그보다 4개월 앞선 6월에 GPT-1을 발표 (Radford 외). 단방향 — 다음 단어를 예측하는 방식.
OpenAI 연구진이 2020년에 발표한 한 논문 — "Scaling Laws for Neural Language Models". 핵심 주장: 모델 크기 × 데이터 × 연산을 늘리면, 성능이 예측 가능하게 좋아진다.
이 가설을 증명하기 위해 그들은 같은 해 5월 GPT-3를 공개했다. 파라미터 1,750억 개(175B). GPT-2 대비 100배. 학습에 든 GPU 컴퓨트 비용은 외부 분석 기준 약 460만 달러로 추산됐다 (Lambda Labs 추정).
GPT-3는 충격이었다. 누구도 가르치지 않은 번역, 요약, 코드 작성, 시 쓰기를 그냥 했다. "few-shot learning" — 예시 몇 개만 보여주면 새 task를 한다. 이걸 보고 OpenAI 내부에서 "이거 정말로 뭔가 일어난다"는 느낌이 굳어졌다.
OpenAI는 GPT-3.5를 가져와서 한 가지를 추가했다 — RLHF (Reinforcement Learning from Human Feedback). 사람이 직접 모델 답변을 평가하고, 그 평가를 강화학습으로 모델에 반영한다. 그렇게 만든 게 InstructGPT, 그리고 그것의 대화 버전이 ChatGPT.
Sam Altman(CEO, Y Combinator 전 대표), Ilya Sutskever(Chief Scientist, Hinton 제자, EP01·02·03 모두 등장한 그 사람), Greg Brockman(President, ex-Stripe CTO). 이 셋이 공개를 결정했다. 회사 내부에서도 "research preview"로 가볍게 다뤘는데 — 결과는 그렇지 않았다.
2023년 3월 14일. OpenAI는 GPT-4를 공개했다. 기술 사양은 비공개. 미국 변호사 자격 시험(UBAR) 상위 10% 통과, AP Calc BC 4점/5점, AP 화학 5점/5점 등 다수의 표준 시험에서 인간 상위권을 기록했다. 모델 크기에 대한 추정(1.8조 파라미터, MoE 구조)이 떠돌지만 OpenAI는 공식 확인하지 않았다.
그리고 — GPT-4 공개 약 2년 전인 2021년, OpenAI에서 떠난 한 그룹이 새 회사를 세웠다.
OpenAI에서 "AI 안전(alignment)"을 더 중요하게 다뤄야 한다고 주장한 그룹. 2020년 말 OpenAI를 떠나 2021년 초 Anthropic을 세웠다. 2023년 3월 Claude 1, 2024년 6월 Claude 3.5 Sonnet — 코딩 능력에서 GPT-4를 능가했다고 평가받았다.
그리고 2024-2025년, 중국에서 또 하나의 충격이 왔다.
DeepSeek-R1을 OpenAI o1과 비슷한 추론 성능으로, 학습 비용 1/30로 만들었다. 모든 코드와 weights를 오픈소스 공개. 미국 빅테크의 GPU 군비 경쟁 가설 자체에 의문이 제기됐다 — "진짜 이렇게 비싸야 하는가?"
2026년 5월 현재. ChatGPT 주간 활성 사용자 5억 명 이상. Claude·Gemini·Llama·Grok 합치면 10억 명에 가깝다. 인터넷 자체가 이 모델들 위에서 다시 만들어지고 있다. Google 검색은 LLM 답변으로 바뀌고, IDE는 Copilot으로 바뀌고, 사내 ERP는 RAG(EP08에서 다룰 예정)로 바뀌고 있다.
다음 편(EP05)에선 2014년 Ian Goodfellow가 술집에서 떠올린 GAN, 그리고 2020년 DDPM(Diffusion)으로 시작된 이미지·영상 생성 AI 12년사를 다룬다. ChatGPT가 언어를 정복했다면, Stable Diffusion·Sora·Veo는 시각을 정복하고 있다.