AI 진화사 · EP 07

AI를 만드는 공장도
이미 AI로 굴러간다

GPT-4를 학습시키는 NVIDIA H100 GPU는 — TSMC와 Samsung 공장에서 만들어진다. 그 공장은 14주에 걸쳐 200개 이상의 공정을 거쳐 한 wafer를 완성한다. 매 단계마다 사람이 지켜본다고? 아니다. 그 안에서도 AI가 굴러가고 있다.

6분 read 2026.05.05 Industry · 산업 적용

01먼저 — 반도체 fab의 진짜 병목

한 장의 wafer에는 수백 개의 layer가 쌓인다. 각 layer마다 두께·CD(critical dimension)·저항·결함 검사. 만약 모든 wafer를 모든 단계에서 측정한다면 — 측정에만 14주가 더 걸린다. 처리량이 절반 이하로 떨어진다.

그래서 현실은 "표본 측정"이다. 25장 중 1장만 측정. 운 나쁘면 — 측정 안 한 24장 중에 결함이 있어도 한참 후에 발견된다. 이미 다음 단계까지 진행된 후. 손실이 누적된다.

⚠️ 표본 측정의 두 가지 손실
① 검출 지연 — 첫 fail이 발생한 시점과 발견 시점 사이에 처리된 wafer가 모두 위험. 평균 12-25장이 "이미 흘러간 상태"로 적발됨.
② 무측정의 무지 — 96% wafer는 영원히 측정되지 않음. 통계적으로 정상이라 가정하지만, 분포 끝에 있는 outlier는 그대로 출하될 수 있음.

여기에 AI가 들어왔다. "센서 데이터는 어차피 모든 wafer에서 다 수집된다. 그 데이터로 측정값을 예측할 수 없을까?" 이게 가상 계측 (Virtual Metrology, VM)의 출발점이다. 그리고 이 분야의 글로벌 첫 양산 시스템이 한국에서 나왔다.

02SK hynix Panoptes — 한국에서 시작된 글로벌 첫 양산 VM

🇰🇷
SK hynix × Gauss Labs · Panoptes
2018 시작 · 2020 본격 배포 · DRAM/NAND fab 양산 적용 · SPIE 2024

이름은 그리스 신화의 100개 눈을 가진 거인 'Argus Panoptes'에서 따왔다. "모든 wafer를 100% 본다"는 의미. SK하이닉스 자회사 Gauss Labs가 개발했고, 핵심 알고리즘은 Patch + Channel Independent Time-series Transformer (PatchTST 패턴). 각 센서를 독립 채널로 patch화해서 학습.

SK하이닉스 이천·청주 fab의 일부 layer에서 양산 적용. 2024 SPIE에서 발표된 후속 — Cross-Tool Attention: 같은 종류 챔버 여러 대 사이의 공통 패턴과 도구별 특이성을 동시에 학습. 한 도구에서 학습한 모델이 다른 도구로 transfer 가능해짐.

현장 검증 · 양산 적용

03NVIDIA cuLitho — GPU 회사가 fab에 들어간 이유

🇺🇸
NVIDIA cuLitho × TSMC · Samsung · ASML
2023.03 GTC 발표 · 2024 TSMC 본격 도입 · 2025 Samsung 합류

EUV 리소그래피의 핵심 단계 중 하나가 OPC(Optical Proximity Correction). 마스크 패턴을 빛이 회절하는 효과를 보정해서 그릴 — 한 마스크당 CPU 클러스터로 2주가 걸리는 작업. NVIDIA가 2023년 3월 GTC에서 발표한 cuLitho — 500대의 NVIDIA DGX H100 시스템이 4만 대의 CPU 서버 작업량을 대체하며 한 마스크 OPC를 2주 → 약 8시간으로 단축. 약 40× 가속.

2023년 GTC 발표 당시 TSMC, Samsung, ASML이 도입 협업 파트너로 공식 공개됐다. 2024-25년 TSMC가 cuLitho를 양산 OPC 흐름에 통합하기 시작했고, Samsung·ASML도 같은 방향으로 작업 중. GPU가 AI를 만든 후, 이제 그 AI 칩 자체를 만드는 단계의 속도까지 GPU가 결정한다.

2주 → 8시간 (40× 가속)
📌 왜 cuLitho가 필수가 됐나
반도체 노드가 작아질수록(2nm·1.4nm) OPC 계산량이 지수적으로 증가한다. 기존 CPU 클러스터로는 한 마스크 OPC가 2주를 넘어가는 경우가 생긴다 — 그러면 칩 설계 일정 전체가 미뤄진다. cuLitho의 GPU 가속이 없다면 차세대 노드의 양산 일정 자체가 흔들린다는 것이 업계 공통 인식이다.

04Samsung Hyper-Auto Fab + Omniverse Twin

🇰🇷
Samsung Semiconductor × NVIDIA Omniverse
2023 NVIDIA-Samsung 협력 발표 · 디지털 트윈 기반 fab 시뮬레이션

한 fab을 통째로 디지털 트윈으로 만든다는 발상. 라인의 장비·배관·로봇 동선을 가상 공간에서 시뮬레이션. 새 wafer가 들어오면 어느 도구를 통해 어떤 순서로 가는지 — 가상에서 미리 시뮬레이션 → 가장 효율적인 경로 선택 → 실제 fab에 반영하는 방향. Samsung은 NVIDIA Omniverse를 활용해 이런 시도를 공개적으로 진행 중.

이상 상황 시뮬레이션도 가능. 한 EUV 노광기가 서비스로 빠지면 fab 전체 처리량이 어떻게 변하는지 — 1초 만에 계산. 인간이 일정을 다시 짜기 전에 AI가 먼저 차선을 제시한다.

디지털 트윈 + 실시간 최적화

05그리고 다른 회사들도 — 모두가 뛰어들었다

🇺🇸
Applied Materials ExtractAI
2022~ · Optical ↔ SEM active learning

광학 검사(빠르지만 정확도 낮음)와 SEM(느리지만 정밀) 사이의 격차를 메우는 active learning loop. 모델이 불확실하다고 판단한 결함만 SEM으로 검증 → 모델 재학습. 정확도는 SEM 수준, 속도는 광학 수준.

🇹🇼
TSMC · Heterogeneous Graph 기반 수율 RCA
학술 발표 다수 · Graph Neural Network 기반 yield analysis

한 lot의 수율이 떨어지면 — chamber·tool·recipe·lot 같은 여러 종류의 노드로 그래프를 만들고, 각 타입별로 다른 attention/embedding을 두고 학습. 어느 챔버 × 어떤 lot 조합에서 결함이 누적됐는지를 자동으로 찾아낼 수 있다. 인간이 사후 분석으로 며칠 걸리던 RCA(root cause analysis)를 짧게 단축하는 방향성으로 학계·산업 모두 활발히 연구.

🇺🇸
KLA Multi-Perspective DL Inspection
2023~ · 회절·편광·각도 다채널 입력

한 결함을 찾을 때 단일 RGB 이미지가 아니라 여러 각도의 회절·편광 채널을 동시에 입력. CNN이 4-7개 채널을 같이 처리. 자세한 알고리즘은 비공개지만 — Multi-Perspective DL이라는 명칭은 KLA 공식 마케팅 자료에 등장.

06그래서 결국 무슨 의미인가

이 시리즈를 EP01부터 따라온 사람은 알아챘을 거다. 모든 알고리즘이 여기에 모인다. EP01 backprop, EP02 CNN(검사), EP03 Transformer(VM·RCA), EP04 LLM(공장 코파일럿), EP05 Diffusion(결함 데이터 합성), EP06 GPU/CUDA(cuLitho).

한 가지 더 — 이 모든 적용은 학술 SOTA가 아니다. 2017년 Transformer 논문 → 2024년 SK하이닉스 양산 적용까지 7년. 학술 → 산업 양산까지 평균 3-5년의 격차가 있다. 지금 학계에서 화제인 모델(Mamba, FlashAttention 3)은 — 2027-2030년쯤 fab에 들어갈 거다.

🔑 한 줄 요약
AI를 굴리기 위한 GPU를 만드는 fab은, 그 fab 자체가 AI로 굴러간다. EP01의 Hinton 논문이 EP02의 AlexNet을 거쳐 EP06의 GPU 칩으로 가는 동안 — 그 칩을 만드는 공정의 모든 단계에 같은 알고리즘이 들어가 있다. 자기 자신을 만드는 도구가 자기 자신으로 작동하는 폐쇄 루프.

다음 편(EP08, 마지막 편)에선 이 모든 모델을 일반 회사가 자기 데이터에 적용하는 방법 — RAG (Retrieval-Augmented Generation)를 다룬다. 2020년 Patrick Lewis 논문에서 시작된 한 아이디어가, 2026년 모든 회사의 사내 코파일럿의 표준이 된 이야기.

🧪
직접 해보기 · AI Lab
가상 계측 — 센서값으로 두께 예측해보기 →
4개 센서(온도·압력·가스·RF)를 슬라이더로 조정 → 실시간 두께 예측. 50장 wafer 처리해서 예측 정확도 산점도까지 그려보세요.
AI 진화사 · 시리즈 네비게이션