Skip to main content

🧠 LLM 기초 μ΄ν•΄ν•˜κΈ°

πŸ’‘ LLMμ΄λž€?

LLM(Large Language Model) 은 'λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ'μ΄λΌλŠ” 뜻으둜, λ°©λŒ€ν•œ ν…μŠ€νŠΈ 데이터λ₯Ό ν•™μŠ΅ν•΄μ„œ μ‚¬λžŒμ²˜λŸΌ μ–Έμ–΄λ₯Ό μ΄ν•΄ν•˜κ³  생성할 수 μžˆλŠ” AIμž…λ‹ˆλ‹€.

🎯 μ‹€μƒν™œ λΉ„μœ 

맀우 λ˜‘λ˜‘ν•œ μ‚¬λžŒμ΄ μˆ˜λ§Žμ€ μ±…, 기사, λŒ€ν™”λ₯Ό 읽고 κ³΅λΆ€ν•œ ν›„, μ—¬λŸ¬λΆ„μ˜ μ§ˆλ¬Έμ— λ‹΅λ³€ν•΄μ£ΌλŠ” 것을 μƒμƒν•΄λ³΄μ„Έμš”. λ°”λ‘œ 그게 LLMμž…λ‹ˆλ‹€.

λŒ€ν‘œμ μΈ LLM: ChatGPT, Claude, Gemini λ“± πŸ€–

βš™οΈ LLM은 μ–΄λ–»κ²Œ λ™μž‘ν• κΉŒ?

LLM의 λ™μž‘ 원리λ₯Ό 3λ‹¨κ³„λ‘œ 이해할 수 μžˆμŠ΅λ‹ˆλ‹€.

1️⃣ ν•™μŠ΅ (Training)

λΉ„μœ : 학생이 κ΅κ³Όμ„œλ₯Ό 읽고 κ³΅λΆ€ν•˜λŠ” κ³Όμ • πŸ“š

  • μΈν„°λ„·μ˜ λ°©λŒ€ν•œ ν…μŠ€νŠΈ 데이터(μ±…, 기사, μ›Ήμ‚¬μ΄νŠΈ, μ½”λ“œ λ“±)λ₯Ό 읽음
  • λ‹¨μ–΄λ“€μ˜ νŒ¨ν„΄κ³Ό 관계λ₯Ό ν•™μŠ΅
  • "이 단어 λ‹€μŒμ—λŠ” μ–΄λ–€ 단어가 올 ν™•λ₯ μ΄ 높은가?"λ₯Ό μˆ˜λ°±μ–΅ 번 λ°˜λ³΅ν•΄μ„œ 배움

μ˜ˆμ‹œ:

ν•™μŠ΅ 데이터: "μ„œμšΈμ€ λŒ€ν•œλ―Όκ΅­μ˜ μˆ˜λ„μ΄λ‹€"
β†’ LLM ν•™μŠ΅: "μˆ˜λ„" λ‹€μŒμ— "이닀"κ°€ 올 ν™•λ₯  λ†’μŒ
β†’ "λŒ€ν•œλ―Όκ΅­"κ³Ό "μ„œμšΈ"이 ν•¨κ»˜ λ‚˜νƒ€λ‚  ν™•λ₯  λ†’μŒ

2️⃣ 이해 (Understanding)

λΉ„μœ : μ§ˆλ¬Έμ„ λ“£κ³  무슨 λœ»μΈμ§€ νŒŒμ•…ν•˜λŠ” κ³Όμ • πŸ€”

μ‚¬μš©μžκ°€ μž…λ ₯ν•œ λ¬Έμž₯을 단어 λ‹¨μœ„λ‘œ μͺΌκ°œκ³ , 각 λ‹¨μ–΄μ˜ μ˜λ―Έμ™€ λ§₯락을 μ΄ν•΄ν•©λ‹ˆλ‹€.

μ˜ˆμ‹œ:

μž…λ ₯: "사과가 λ§›μžˆμ–΄"
β†’ LLM 뢄석: 
  - "사과" = 과일 (μ•„λ‹ˆλ©΄ μ‚¬κ³Όν•˜λ‹€? λ¬Έλ§₯상 과일!)
  - "λ§›μžˆμ–΄" = 긍정적 ν‘œν˜„
  - 전체 의미: 과일 μ‚¬κ³Όμ˜ 맛에 λŒ€ν•œ 긍정적 평가

3️⃣ 생성 (Generation)

λΉ„μœ : λ‹΅μ•ˆμ„ ν•œ κΈ€μžμ”© 써 λ‚΄λ €κ°€λŠ” κ³Όμ • ✍️

ν•™μŠ΅ν•œ νŒ¨ν„΄μ„ λ°”νƒ•μœΌλ‘œ κ°€μž₯ μ μ ˆν•œ λ‹€μŒ 단어λ₯Ό ν•˜λ‚˜μ”© μ˜ˆμΈ‘ν•˜λ©° 닡변을 μƒμ„±ν•©λ‹ˆλ‹€.

μ˜ˆμ‹œ:

질문: "λŒ€ν•œλ―Όκ΅­μ˜ μˆ˜λ„λŠ”?"

생성 κ³Όμ •:
1. "λŒ€ν•œλ―Όκ΅­" β†’ λ‹€μŒ 단어 예츑 β†’ "의" (ν™•λ₯  λ†’μŒ)
2. "의" β†’ λ‹€μŒ 단어 예츑 β†’ "μˆ˜λ„λŠ”" (ν™•λ₯  λ†’μŒ)  
3. "μˆ˜λ„λŠ”" β†’ λ‹€μŒ 단어 예츑 β†’ "μ„œμšΈ" (ν™•λ₯  맀우 λ†’μŒ)
4. "μ„œμšΈ" β†’ λ‹€μŒ 단어 예츑 β†’ "μž…λ‹ˆλ‹€" (ν™•λ₯  λ†’μŒ)

μ΅œμ’… λ‹΅λ³€: "λŒ€ν•œλ―Όκ΅­μ˜ μˆ˜λ„λŠ” μ„œμšΈμž…λ‹ˆλ‹€"

🎲 LLM λ™μž‘μ˜ 핡심: ν™•λ₯ κ³Ό νŒ¨ν„΄

LLM은 정닡을 "μ•”κΈ°"ν•œ 것이 μ•„λ‹ˆλΌ, μˆ˜λ§Žμ€ λ°μ΄ν„°μ—μ„œ λ°œκ²¬ν•œ νŒ¨ν„΄κ³Ό ν™•λ₯ μ„ λ°”νƒ•μœΌλ‘œ λ‹΅λ³€ν•©λ‹ˆλ‹€.

쒋은 점: μœ μ—°ν•˜κ³  창의적인 λ‹΅λ³€ κ°€λŠ₯ ✨
λ‚˜μœ 점: λ•Œλ•Œλ‘œ κ·ΈλŸ΄λ“―ν•˜μ§€λ§Œ ν‹€λ¦° λ‹΅λ³€ 생성 (ν™˜κ°) ⚠️

πŸ“Š μ‹œκ°μ  이해

[μ‚¬μš©μž μž…λ ₯] 
    ↓
[토큰화] β†’ "λŒ€ν•œλ―Όκ΅­" + "의" + "μˆ˜λ„" + "λŠ”" + "?"
    ↓
[LLM 신경망 처리]
  - μˆ˜μ‹­μ–΅ 개의 νŒŒλΌλ―Έν„°(κ°€μ€‘μΉ˜)
  - 각 단어 κ°„ 관계 뢄석
  - λ§₯락 이해
    ↓
[λ‹€μŒ 단어 예츑]
  - "μ„œμšΈ" (ν™•λ₯  85%)
  - "λΆ€μ‚°" (ν™•λ₯  3%)
  - "도쿄" (ν™•λ₯  0.1%)
    ↓
[κ°€μž₯ ν™•λ₯  높은 단어 선택] β†’ "μ„œμšΈ"
    ↓
[반볡] β†’ "μž…λ‹ˆλ‹€" β†’ "." 
    ↓
[μ΅œμ’… 좜λ ₯] "μ„œμšΈμž…λ‹ˆλ‹€."

🎭 LLM의 νŠΉμ§•

βœ… 강점

  • μžμ—°μŠ€λŸ¬μš΄ λŒ€ν™” κ°€λŠ₯
  • λ‹€μ–‘ν•œ μ£Όμ œμ— λŒ€ν•œ 일반 지식 보유
  • ν…μŠ€νŠΈ 생성, μš”μ•½, λ²ˆμ—­ λ“± λ‹€μž¬λ‹€λŠ₯
  • λ§₯락을 μ΄ν•΄ν•˜κ³  창의적인 λ‹΅λ³€ 생성

⚠️ ν•œκ³„

  • ν•™μŠ΅λœ λ°μ΄ν„°κΉŒμ§€λ§Œ μ•Œκ³  있음 (예: 2024년에 ν•™μŠ΅ν–ˆλ‹€λ©΄ 2025λ…„ μ •λ³΄λŠ” λͺ¨λ¦„)
  • νšŒμ‚¬ λ‚΄λΆ€ μ •λ³΄λ‚˜ 개인 μ •λ³΄λŠ” λͺ¨λ¦„
  • 가끔 ν‹€λ¦° 정보λ₯Ό κ·ΈλŸ΄λ“―ν•˜κ²Œ 말함 (ν™˜κ°, Hallucination)
  • μ™ΈλΆ€ λ„κ΅¬λ‚˜ μ‹œμŠ€ν…œμ„ 직접 μ‚¬μš©ν•  수 μ—†μŒ
  • ν™•λ₯  기반이라 맀번 μ‘°κΈˆμ”© λ‹€λ₯Έ λ‹΅λ³€ 생성 κ°€λŠ₯

πŸš€ λ‹€μŒμ€?

LLM의 ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄ RAG와 MCPλΌλŠ” 기술이 λ“±μž₯ν–ˆμŠ΅λ‹ˆλ‹€. λ‹€μŒ λ¬Έμ„œμ—μ„œ 이 κΈ°μˆ λ“€μ„ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.