반도체 공정 한 step에서 — wafer를 직접 측정 안 하고도 온도·압력·가스 유량·RF 파워 4가지 센서값으로 두께를 추정합니다. 이게 SK하이닉스 Panoptes의 핵심. 슬라이더로 4개 센서를 조정해서 예측이 어떻게 변하는지 직접 보세요.
예측 두께 = w₁·온도 + w₂·압력 + w₃·가스 + w₄·RF + b의 단순한 형태부터 시작해서 — 실제 양산 시스템은 시계열 Transformer까지 갑니다. 이 랩은 학습된 모델이 어떻게 예측하는지의 가장 단순한 형태입니다. 목표 두께 100 nm. 슬라이더로 센서를 조정하면 예측값이 실시간으로 변합니다.
실제 SK하이닉스 fab은 한 챔버에서 wafer 한 장이 움직이는 동안 — 약 5,000개의 센서가 1초당 10-100 샘플씩 데이터를 수집합니다. 그러니까 한 wafer당 ~20만 개의 시계열 데이터 포인트. 이걸 입력으로 받아서 두께·CD·저항 같은 측정값을 예측.
모델이 발전하면서 — 처음엔 단순 선형 회귀(2010년대 초), 그 다음 GBT(XGBoost, 2014~), 그 후 LSTM(2017~), 지금은 Patch + Channel Independent Time-series Transformer(PatchTST 패턴, 2023~). 이 시리즈를 EP01부터 따라오신 분이라면 — 익숙한 흐름일 겁니다. 같은 알고리즘 진화가 학계에서 산업 양산까지 약 5년 시차로 따라옵니다.
가장 큰 난점은 신뢰도 보정 (calibration)입니다. 모델이 "100 nm ± 0.5 nm 자신함"이라고 하면 — 진짜 정확도가 0.5 nm여야 합니다. 과신(overconfidence)하면 outlier를 놓치고, 너무 보수적이면 모델 가치가 없어집니다. 양산 VM의 80%가 이 보정 단계에서 시간을 씁니다.