AI 진화사 · EP 04

5일 만에 100만 명.
그게 어떻게 가능했나.

2022년 11월 30일 오후 (PST). OpenAI가 한 챗봇을 조용히 공개했다. 회사 내부에서도 큰 기대 없이 — 누군가는 "research preview"라고 불렀다. 그러나 5일 후, 사용자가 100만 명을 넘었다. 2개월 후엔 1억 명. 인터넷 역사상 가장 빠르게 큰 제품이 됐다.

6분 read 2026.05.04 2018 → 2026

012018년, 두 회사가 같은 답을 찾았다

2017년 Google의 Transformer 논문(EP03)이 나온 후, 한 가지 질문이 떠올랐다 — "Transformer를 거대한 텍스트 데이터로 사전 학습(pre-train)시키면 어떻게 될까?"

2018년에 두 곳이 거의 동시에 답을 냈다. Google은 2018년 10월 BERT를 발표 (Jacob Devlin 외). 양방향 학습 — 한 단어의 좌우 맥락을 동시에 본다. OpenAI는 그보다 4개월 앞선 6월에 GPT-1을 발표 (Radford 외). 단방향 — 다음 단어를 예측하는 방식.

🎯 두 갈래의 갈림길
BERT는 이해(understand) 태스크에 강하다 — 분류, 검색, 질의응답. GPT는 생성(generate)에 강하다 — 글쓰기, 번역, 대화. 2018-2022년엔 BERT가 산업에서 더 많이 쓰였다. 그런데 2022년 이후, 모든 게 생성으로 기울었다.

022020년, OpenAI가 한 가설을 증명했다

OpenAI 연구진이 2020년에 발표한 한 논문 — "Scaling Laws for Neural Language Models". 핵심 주장: 모델 크기 × 데이터 × 연산을 늘리면, 성능이 예측 가능하게 좋아진다.

이 가설을 증명하기 위해 그들은 같은 해 5월 GPT-3를 공개했다. 파라미터 1,750억 개(175B). GPT-2 대비 100배. 학습에 든 GPU 컴퓨트 비용은 외부 분석 기준 약 460만 달러로 추산됐다 (Lambda Labs 추정).

2018GPT-1
117M
2019GPT-2
1.5B
2020GPT-3
175B
2023GPT-4
~1.8T

GPT-3는 충격이었다. 누구도 가르치지 않은 번역, 요약, 코드 작성, 시 쓰기를 그냥 했다. "few-shot learning" — 예시 몇 개만 보여주면 새 task를 한다. 이걸 보고 OpenAI 내부에서 "이거 정말로 뭔가 일어난다"는 느낌이 굳어졌다.

032022년 11월 30일, 그날의 사람들

OpenAI는 GPT-3.5를 가져와서 한 가지를 추가했다 — RLHF (Reinforcement Learning from Human Feedback). 사람이 직접 모델 답변을 평가하고, 그 평가를 강화학습으로 모델에 반영한다. 그렇게 만든 게 InstructGPT, 그리고 그것의 대화 버전이 ChatGPT.

🚀
Sam Altman · Ilya Sutskever · Greg Brockman
OpenAI 공동 창업자 · 2015 - · ChatGPT 출시 책임

Sam Altman(CEO, Y Combinator 전 대표), Ilya Sutskever(Chief Scientist, Hinton 제자, EP01·02·03 모두 등장한 그 사람), Greg Brockman(President, ex-Stripe CTO). 이 셋이 공개를 결정했다. 회사 내부에서도 "research preview"로 가볍게 다뤘는데 — 결과는 그렇지 않았다.

5일
사용자 100만 명까지
걸린 시간
2개월
사용자 1억 명까지
걸린 시간
$80B+
2024년 OpenAI
기업가치 평가
$157B
2024년 10월 OpenAI
기업가치 (Series F)
📌 OpenAI 내부도 예상 못 했던 폭발
Sam Altman은 ChatGPT 공개 며칠 후 "5일 만에 100만 명 사용자"를 X(트위터)에 직접 알렸다. OpenAI 내부에서도 처음엔 "low-key research preview"라고 부른 작은 출시였다 — 출시 전 회의에서 누구도 이 정도 트래픽을 예상하지 못했다는 것이 이후 여러 인터뷰에서 확인됐다.

042023년, 그리고 다른 회사들

2023년 3월 14일. OpenAI는 GPT-4를 공개했다. 기술 사양은 비공개. 미국 변호사 자격 시험(UBAR) 상위 10% 통과, AP Calc BC 4점/5점, AP 화학 5점/5점 등 다수의 표준 시험에서 인간 상위권을 기록했다. 모델 크기에 대한 추정(1.8조 파라미터, MoE 구조)이 떠돌지만 OpenAI는 공식 확인하지 않았다.

그리고 — GPT-4 공개 약 2년 전인 2021년, OpenAI에서 떠난 한 그룹이 새 회사를 세웠다.

🛡️
Dario & Daniela Amodei
Anthropic 공동 창업자 · ex-OpenAI 부사장 · Claude 시리즈

OpenAI에서 "AI 안전(alignment)"을 더 중요하게 다뤄야 한다고 주장한 그룹. 2020년 말 OpenAI를 떠나 2021년 초 Anthropic을 세웠다. 2023년 3월 Claude 1, 2024년 6월 Claude 3.5 Sonnet — 코딩 능력에서 GPT-4를 능가했다고 평가받았다.

그리고 2024-2025년, 중국에서 또 하나의 충격이 왔다.

🇨🇳
Liang Wenfeng (양원펑)
DeepSeek 창업자 · 양적 헤지펀드 출신 · DeepSeek-R1 (2025.01)

DeepSeek-R1을 OpenAI o1과 비슷한 추론 성능으로, 학습 비용 1/30로 만들었다. 모든 코드와 weights를 오픈소스 공개. 미국 빅테크의 GPU 군비 경쟁 가설 자체에 의문이 제기됐다 — "진짜 이렇게 비싸야 하는가?"

05그래서 ChatGPT 시대의 의미는

2026년 5월 현재. ChatGPT 주간 활성 사용자 5억 명 이상. Claude·Gemini·Llama·Grok 합치면 10억 명에 가깝다. 인터넷 자체가 이 모델들 위에서 다시 만들어지고 있다. Google 검색은 LLM 답변으로 바뀌고, IDE는 Copilot으로 바뀌고, 사내 ERP는 RAG(EP08에서 다룰 예정)로 바뀌고 있다.

🔑 한 줄 요약
ChatGPT의 진짜 충격은 모델이 똑똑해진 것이 아니라 — "누구나 자연어로 컴퓨터에 명령할 수 있게 된 것"이다. 1958년 Rosenblatt 퍼셉트론(EP01)이 "기계가 배운다"의 시작이었다면, 2022년 ChatGPT는 "기계와 인간이 대화한다"의 시작이다.

다음 편(EP05)에선 2014년 Ian Goodfellow가 술집에서 떠올린 GAN, 그리고 2020년 DDPM(Diffusion)으로 시작된 이미지·영상 생성 AI 12년사를 다룬다. ChatGPT가 언어를 정복했다면, Stable Diffusion·Sora·Veo는 시각을 정복하고 있다.

🧪
직접 해보기 · AI Lab
한 문장이 GPT 토큰으로 어떻게 잘리나 →
"Hello world"는 토큰 2개. "안녕하세요"는 토큰 6-8개. 이모지는 1-2개. 문장을 입력해서 GPT가 어떻게 자르는지, 한국어가 영어보다 왜 더 비싼지 직접 확인.
AI 진화사 · 시리즈 네비게이션