2020년 Patrick Lewis의 RAG 논문이 만든 메커니즘을 직접 시뮬레이션합니다. 가상의 사내 문서 6개에서 — 질문을 입력하면 ① 가장 관련 있는 문서 검색 → ② 상위 3개 추출 → ③ 그것을 컨텍스트로 LLM이 답변 생성. 이게 Microsoft 365 Copilot, GitHub Copilot, 삼성 GAUSS의 작동 원리입니다.
📌 이게 뭐 하는 랩인가
6개의 가상 사내 문서(출장비 규정·휴가 정책·보안 가이드·복리후생·재택근무·교육비 지원)가 미리 준비돼 있습니다. 질문을 입력하면 — 의미적 유사도(simulated embedding similarity)로 가장 관련 있는 문서들을 찾고, 상위 3개를 LLM 컨텍스트로 사용해서 답변을 생성. 실제 RAG는 OpenAI text-embedding-3 같은 임베딩 모델을 쓰지만, 이 데모는 키워드 + 의미적 가중치의 단순 매칭으로 그 흐름을 보여줍니다.
📋 사용법
아래 질문창에 질문을 입력 (또는 예시 버튼 클릭).
RAG 실행 버튼 → ① 6개 문서 모두 점수 매김 → ② 상위 3개 표시 → ③ 답변 생성.
매칭된 키워드는 노란 강조, 답변에서 인용된 부분은 초록 강조.
예시 질문들을 차례로 눌러보고 — 같은 단어라도 어떤 문서가 매칭되는지 확인.
📂 가상 사내 문서 데이터베이스 (6 docs)
① Stage 1 · 의미 유사도 검색 (모든 문서 점수)
③ Stage 3 · LLM 답변 생성 (상위 3개 문서를 컨텍스트로)
🤖 사내 코파일럿 답변
이게 왜 중요한가
실제 회사의 RAG 시스템은 — 문서가 6개가 아니라 수십만~수백만 개입니다. 임베딩도 단순 키워드 매칭이 아니라 OpenAI text-embedding-3-large 같은 1024차원 벡터. 검색은 Pinecone·Weaviate 같은 vector DB에서 ms 단위로 처리. 답변 생성은 GPT-4 또는 Claude 3.5 Sonnet으로.
그러나 메커니즘은 — 이 4단계 그대로입니다. ① 질문 임베딩 → ② 벡터 DB 검색 → ③ 상위 k개 추출 → ④ LLM에 컨텍스트 주입 후 답변 생성. 이게 2026년 거의 모든 사내 코파일럿의 표준 아키텍처. 한 번 이 흐름을 이해하면 — Microsoft 365 Copilot도, GitHub Copilot도, 삼성 GAUSS도, LG GenAI도 같은 골격으로 돌아간다는 것이 보입니다.