# 🧠 LLM 기초 이해하기

## 💡 LLM이란?

**LLM(Large Language Model)** 은 '대규모 언어 모델'이라는 뜻으로, 방대한 텍스트 데이터를 학습해서 사람처럼 언어를 이해하고 생성할 수 있는 AI입니다.

## 🎯 실생활 비유

매우 똑똑한 사람이 수많은 책, 기사, 대화를 읽고 공부한 후, 여러분의 질문에 답변해주는 것을 상상해보세요. 바로 그게 LLM입니다.

**대표적인 LLM**: ChatGPT, Claude, Gemini 등 🤖

## ⚙️ LLM은 어떻게 동작할까?

LLM의 동작 원리를 3단계로 이해할 수 있습니다.

### 1️⃣ 학습 (Training)

**비유**: 학생이 교과서를 읽고 공부하는 과정 📚

- 인터넷의 방대한 텍스트 데이터(책, 기사, 웹사이트, 코드 등)를 읽음
- 단어들의 패턴과 관계를 학습
- "이 단어 다음에는 어떤 단어가 올 확률이 높은가?"를 수백억 번 반복해서 배움

**예시**:

```
학습 데이터: "서울은 대한민국의 수도이다"
→ LLM 학습: "수도" 다음에 "이다"가 올 확률 높음
→ "대한민국"과 "서울"이 함께 나타날 확률 높음
```

### 2️⃣ 이해 (Understanding)

**비유**: 질문을 듣고 무슨 뜻인지 파악하는 과정 🤔

사용자가 입력한 문장을 단어 단위로 쪼개고, 각 단어의 의미와 맥락을 이해합니다.

**예시**:

```
입력: "사과가 맛있어"
→ LLM 분석: 
  - "사과" = 과일 (아니면 사과하다? 문맥상 과일!)
  - "맛있어" = 긍정적 표현
  - 전체 의미: 과일 사과의 맛에 대한 긍정적 평가
```

### 3️⃣ 생성 (Generation)

**비유**: 답안을 한 글자씩 써 내려가는 과정 ✍️

학습한 패턴을 바탕으로 가장 적절한 다음 단어를 하나씩 예측하며 답변을 생성합니다.

**예시**:

```
질문: "대한민국의 수도는?"

생성 과정:
1. "대한민국" → 다음 단어 예측 → "의" (확률 높음)
2. "의" → 다음 단어 예측 → "수도는" (확률 높음)  
3. "수도는" → 다음 단어 예측 → "서울" (확률 매우 높음)
4. "서울" → 다음 단어 예측 → "입니다" (확률 높음)

최종 답변: "대한민국의 수도는 서울입니다"
```

## 🎲 LLM 동작의 핵심: 확률과 패턴

LLM은 정답을 "암기"한 것이 아니라, 수많은 데이터에서 발견한 **패턴과 확률**을 바탕으로 답변합니다.

**좋은 점**: 유연하고 창의적인 답변 가능 ✨  
**나쁜 점**: 때때로 그럴듯하지만 틀린 답변 생성 (환각) ⚠️

## 📊 시각적 이해

```
[사용자 입력] 
    ↓
[토큰화] → "대한민국" + "의" + "수도" + "는" + "?"
    ↓
[LLM 신경망 처리]
  - 수십억 개의 파라미터(가중치)
  - 각 단어 간 관계 분석
  - 맥락 이해
    ↓
[다음 단어 예측]
  - "서울" (확률 85%)
  - "부산" (확률 3%)
  - "도쿄" (확률 0.1%)
    ↓
[가장 확률 높은 단어 선택] → "서울"
    ↓
[반복] → "입니다" → "." 
    ↓
[최종 출력] "서울입니다."
```

## 🎭 LLM의 특징

### ✅ 강점

- 자연스러운 대화 가능
- 다양한 주제에 대한 일반 지식 보유
- 텍스트 생성, 요약, 번역 등 다재다능
- 맥락을 이해하고 창의적인 답변 생성

### ⚠️ 한계

- 학습된 데이터까지만 알고 있음 (예: 2024년에 학습했다면 2025년 정보는 모름)
- 회사 내부 정보나 개인 정보는 모름
- 가끔 틀린 정보를 그럴듯하게 말함 (환각, Hallucination)
- 외부 도구나 시스템을 직접 사용할 수 없음
- 확률 기반이라 매번 조금씩 다른 답변 생성 가능

## 🚀 다음은?

LLM의 한계를 극복하기 위해 **RAG**와 **MCP**라는 기술이 등장했습니다. 다음 문서에서 이 기술들을 알아보겠습니다.