Rescale λ―ΈνŒ… μ˜ˆμ•½

검색 증강 μƒμ„±μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

인곡지λŠ₯

검색 증강 μƒμ„±μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

mm
검색 증강 μƒμ„±μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

LLM(λŒ€ν˜• μ–Έμ–΄ λͺ¨λΈ)은 μžμ—°μ–΄ 처리(NLP) μ˜μ—­μ„ λ°œμ „μ‹œν‚€λŠ” 데 κΈ°μ—¬ν•΄ μ™”μ§€λ§Œ 상황별 μ΄ν•΄μ—λŠ” μ—¬μ „νžˆ 격차가 남아 μžˆμŠ΅λ‹ˆλ‹€. LLM은 λ•Œλ•Œλ‘œ λ‹€μŒμ„ 생산할 수 μžˆμŠ΅λ‹ˆλ‹€. λΆ€μ •ν™•ν•˜κ±°λ‚˜ μ‹ λ’°ν•  수 μ—†λŠ” 응닡, ν˜„μƒ "ν™˜κ°.” 

예λ₯Ό λ“€μ–΄ ChatGPTλ₯Ό μ‚¬μš©ν•˜λ©΄ ν™˜κ° λ°œμƒμ΄ λŒ€λž΅μ μœΌλ‘œ λ°œμƒν•©λ‹ˆλ‹€. 15의 % 20 %둜 μ•½ 80%의 μ‹œκ°„.

검색 증강 생성(RAG)은 LLM의 좜λ ₯을 μ΅œμ ν™”ν•˜μ—¬ μ»¨ν…μŠ€νŠΈ 격차λ₯Ό ν•΄κ²°ν•˜λ„λ‘ μ„€κ³„λœ κ°•λ ₯ν•œ 인곡 μ§€λŠ₯(AI) ν”„λ ˆμž„μ›Œν¬μž…λ‹ˆλ‹€. RAGλŠ” ​​검색을 톡해 λ°©λŒ€ν•œ μ™ΈλΆ€ 지식을 ν™œμš©ν•˜μ—¬ μ •ν™•ν•˜κ³  μ •ν™•ν•˜λ©° 상황에 맞게 ν’λΆ€ν•œ 응닡을 μƒμ„±ν•˜λŠ” LLM의 λŠ₯λ ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.  

AI μ‹œμŠ€ν…œμ—μ„œ RAG의 μ€‘μš”μ„±μ„ μ•Œμ•„λ³΄κ³ , μ–Έμ–΄ 이해와 생성에 혁λͺ…을 μΌμœΌν‚¬ 수 μžˆλŠ” 잠재λ ₯을 μ‚΄νŽ΄λ³΄κ² μŠ΅λ‹ˆλ‹€.

검색 증강 생성(RAG)μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

ν•˜μ΄λΈŒλ¦¬λ“œ ν”„λ ˆμž„μ›Œν¬λ‘œμ„œ, RAG 생성 λͺ¨λΈκ³Ό 검색 λͺ¨λΈμ˜ μž₯점을 κ²°ν•©ν•©λ‹ˆλ‹€. 이 쑰합은 타사 지식 μ†ŒμŠ€λ₯Ό ν™œμš©ν•˜μ—¬ λ‚΄λΆ€ ν‘œν˜„μ„ μ§€μ›ν•˜κ³  보닀 μ •ν™•ν•˜κ³  μ‹ λ’°ν•  수 μžˆλŠ” 닡변을 μƒμ„±ν•©λ‹ˆλ‹€. 

RAG의 μ•„ν‚€ν…μ²˜λŠ” μ‹œν€€μŠ€ κ°„ 검색(seq2seq) λͺ¨λΈκ³Ό DPR(Dense Passage Retrieval) ꡬ성 μš”μ†Œλ₯Ό ν˜Όν•©ν•œ λ…νŠΉν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ΅ν•©μ„ 톡해 λͺ¨λΈμ€ μ •ν™•ν•œ 정보λ₯Ό λ°”νƒ•μœΌλ‘œ 상황에 λ§žλŠ” 응닡을 생성할 수 μžˆμŠ΅λ‹ˆλ‹€. 

RAGλŠ” ​​신뒰성과 정확성을 보μž₯ν•˜κΈ° μœ„ν•΄ 사싀 확인 및 검증을 μœ„ν•œ κ°•λ ₯ν•œ λ©”μ»€λ‹ˆμ¦˜μ„ 톡해 투λͺ…성을 ν™•λ¦½ν•©λ‹ˆλ‹€. 

검색 증강 생성은 μ–΄λ–»κ²Œ μž‘λ™ν•©λ‹ˆκΉŒ? 

2020년에 MetaλŠ” RAG ν”„λ ˆμž„μ›Œν¬ ν›ˆλ ¨ 데이터 μ΄μƒμœΌλ‘œ LLM을 ν™•μž₯ν•©λ‹ˆλ‹€. μ˜€ν”ˆλΆ μ‹œν—˜κ³Ό λ§ˆμ°¬κ°€μ§€λ‘œ RAGλ₯Ό 톡해 LLM은 μ•”κΈ°λœ μ‚¬μ‹€μ—λ§Œ μ˜μ‘΄ν•˜κΈ°λ³΄λ‹€λŠ” μ§ˆλ¬Έμ— λŒ€ν•œ μ‘λ‹΅μœΌλ‘œ μ‹€μ œ 정보에 μ•‘μ„ΈμŠ€ν•˜μ—¬ 보닀 μ •ν™•ν•œ 응닡을 μœ„ν•΄ μ „λ¬Έ 지식을 ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

Meta의 Original RAG λͺ¨λΈ λ‹€μ΄μ–΄κ·Έλž¨

Meta의 원본 RAG λͺ¨λΈ(이미지 μ†ŒμŠ€)

이 ν˜μ‹ μ μΈ κΈ°μˆ μ€ 데이터 쀑심 μ ‘κ·Ό λ°©μ‹μ—μ„œ λ²—μ–΄λ‚˜ 지식 쀑심 ꡬ성 μš”μ†Œλ₯Ό ν†΅ν•©ν•˜μ—¬ μ–Έμ–΄ λͺ¨λΈμ˜ μ •ν™•μ„±, μ •λ°€μ„± 및 λ¬Έλ§₯적 이해λ₯Ό ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

λ˜ν•œ RAGλŠ” μ„Έ λ‹¨κ³„λ‘œ κΈ°λŠ₯ν•˜μ—¬ μ–Έμ–΄ λͺ¨λΈμ˜ κΈ°λŠ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

RAG ꡬ성 μš”μ†Œμ˜ λΆ„λ₯˜

RAG의 핡심 κ΅¬μ„±μš”μ†Œ(이미지 μ†ŒμŠ€)

  • 검색: 검색 λͺ¨λΈμ€ μ–Έμ–΄ λͺ¨λΈμ˜ 응닡을 ν–₯μƒμ‹œν‚€κΈ° μœ„ν•΄ μ‚¬μš©μž ν”„λ‘¬ν”„νŠΈμ™€ κ΄€λ ¨λœ 정보λ₯Ό μ°ΎμŠ΅λ‹ˆλ‹€. μ—¬κΈ°μ—λŠ” μ‚¬μš©μž μž…λ ₯을 κ΄€λ ¨ λ¬Έμ„œμ™€ μΌμΉ˜μ‹œμΌœ μ •ν™•ν•˜κ³  μ΅œμ‹  정보에 λŒ€ν•œ 접근을 보μž₯ν•˜λŠ” 것이 ν¬ν•¨λ©λ‹ˆλ‹€. λ‹€μŒκ³Ό 같은 기법이 μžˆμŠ΅λ‹ˆλ‹€. μ‘°λ°€ν•œ ν†΅λ‘œ 검색 (λΆν•œλ―Όμ£Όλ‹Ή) 그리고 코사인 μœ μ‚¬μ„± RAG의 효과적인 검색에 κΈ°μ—¬ν•˜κ³  검색 λ²”μœ„λ₯Ό μ’ν˜€ κ²°κ³Όλ₯Ό λ”μš± κ΅¬μ²΄ν™”ν•©λ‹ˆλ‹€. 
  • 증가: 검색 ν›„ RAG λͺ¨λΈμ€ 핡심 문ꡬ μΆ”μΆœ λ“±κ³Ό 같은 μ‹ μ†ν•œ μ—”μ§€λ‹ˆμ–΄λ§ κΈ°μˆ μ„ μ‚¬μš©ν•˜μ—¬ μ‚¬μš©μž 쿼리λ₯Ό κ΄€λ ¨ 검색 데이터와 ν†΅ν•©ν•©λ‹ˆλ‹€. 이 λ‹¨κ³„λŠ” 정보와 μ»¨ν…μŠ€νŠΈλ₯Ό 효과적으둜 μ „λ‹¬ν•©λ‹ˆλ‹€. LLM, μ •ν™•ν•œ 좜λ ₯ 생성을 μœ„ν•œ 포괄적인 이해λ₯Ό 보μž₯ν•©λ‹ˆλ‹€.
  • μ„ΈλŒ€: 이 λ‹¨κ³„μ—μ„œλŠ” μ‹œν€€μŠ€-투-μ‹œν€€μŠ€(sequence-to-sequence)와 같은 μ ν•©ν•œ λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ μ¦κ°•λœ 정보λ₯Ό λ””μ½”λ”©ν•˜μ—¬ μ΅œμ’…μ μΈ 응닡을 μƒμ„±ν•©λ‹ˆλ‹€. 생성 λ‹¨κ³„λŠ” λͺ¨λΈμ˜ 좜λ ₯이 μΌκ΄€λ˜κ³  μ •ν™•ν•˜λ©° μ‚¬μš©μžμ˜ ν”„λ‘¬ν”„νŠΈμ— 따라 λ§žμΆ€ν™”λ˜λ„λ‘ 보μž₯ν•©λ‹ˆλ‹€.

RAG의 이점은 λ¬΄μ—‡μž…λ‹ˆκΉŒ?

RAGλŠ” ​​뢀정확성 μ™„ν™”, 정적 데이터 μ„ΈνŠΈμ— λŒ€ν•œ μ˜μ‘΄λ„ κ°μ†Œ, 보닀 μ„Έλ ¨λ˜κ³  μ •ν™•ν•œ μ–Έμ–΄ 생성을 μœ„ν•œ 상황별 이해 κ°•ν™” λ“± NLP의 μ€‘μš”ν•œ 과제λ₯Ό ν•΄κ²°ν•©λ‹ˆλ‹€.

RAG의 ν˜μ‹ μ μΈ ν”„λ ˆμž„μ›Œν¬λŠ” μƒμ„±λœ μ½˜ν…μΈ μ˜ μ •ν™•μ„±κ³Ό 신뒰성을 ν–₯μƒμ‹œμΌœ AI μ‹œμŠ€ν…œμ˜ νš¨μœ¨μ„±κ³Ό 적응성을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

1. LLM ν™˜κ° κ°μ†Œ

μ™ΈλΆ€ 지식 μ†ŒμŠ€λ₯Ό ν†΅ν•©ν•¨μœΌλ‘œμ¨ μ‹ μ†ν•œ RAGλŠ” ​​AI 생성 κ³Όμ •μ—μ„œ 응닡이 μ •ν™•ν•˜κ³  λ§₯락적으둜 κ΄€λ ¨μ„± μžˆλŠ” 정보에 κΈ°λ°˜ν•˜λ„λ‘ 보μž₯ν•©λ‹ˆλ‹€. μ‘λ‹΅μ—λŠ” μΈμš©μ΄λ‚˜ μ°Έμ‘°κ°€ 포함될 수 μžˆμœΌλ―€λ‘œ μ‚¬μš©μžκ°€ 정보λ₯Ό λ…λ¦½μ μœΌλ‘œ 검증할 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μ ‘κ·Ό 방식은 AI 생성 μ½˜ν…μΈ μ˜ 신뒰성을 크게 ν–₯μƒμ‹œν‚€κ³  ν™˜κ° ν˜„μƒμ„ μ€„μž…λ‹ˆλ‹€.

2. μ΅œμ‹ μ˜ μ •ν™•ν•œ λ‹΅λ³€ 

RAGλŠ” β€‹β€‹μ‹€μ‹œκ°„ 정보λ₯Ό μ§€μ†μ μœΌλ‘œ κ²€μƒ‰ν•˜μ—¬ ν›ˆλ ¨ λ°μ΄ν„°μ˜ μ‹œκ°„ μ œν•œμ΄λ‚˜ 잘λͺ»λœ μ½˜ν…μΈ λ₯Ό μ™„ν™”ν•©λ‹ˆλ‹€. κ°œλ°œμžλŠ” μ΅œμ‹  연ꡬ, 톡계 λ˜λŠ” λ‰΄μŠ€λ₯Ό 생성 λͺ¨λΈμ— 직접 μ›ν™œν•˜κ²Œ 톡합할 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ LLM을 라이브 μ†Œμ…œ λ―Έλ””μ–΄ ν”Όλ“œ, λ‰΄μŠ€ μ‚¬μ΄νŠΈ 및 동적 정보 μ†ŒμŠ€μ— μ—°κ²°ν•©λ‹ˆλ‹€. 이 κΈ°λŠ₯을 톡해 RAGλŠ” μ‹€μ‹œκ°„ 및 μ •ν™•ν•œ 정보λ₯Ό μš”κ΅¬ν•˜λŠ” μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ„ μœ„ν•œ κ·€μ€‘ν•œ 도ꡬ가 λ©λ‹ˆλ‹€.

3. λΉ„μš© νš¨μœ¨μ„± 

Chatbot κ°œλ°œμ—λŠ” κ΄‘λ²”μœ„ν•œ κ΅μœ‘μ„ 톡해 API에 μ•‘μ„ΈμŠ€ν•  수 μžˆλŠ” LLM인 기초 λͺ¨λΈμ„ ν™œμš©ν•˜λŠ” κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ 도메인별 데이터에 λŒ€ν•΄ μ΄λŸ¬ν•œ FM을 μž¬κ΅μœ‘ν•˜λ©΄ 높은 계산 및 μž¬μ •μ  λΉ„μš©μ΄ λ°œμƒν•©λ‹ˆλ‹€. RAGλŠ” β€‹β€‹λ¦¬μ†ŒμŠ€ ν™œμš©λ„λ₯Ό μ΅œμ ν™”ν•˜κ³  ν•„μš”μ— 따라 μ„ νƒμ μœΌλ‘œ 정보λ₯Ό κ°€μ Έμ˜€λ―€λ‘œ λΆˆν•„μš”ν•œ 계산을 쀄이고 μ „λ°˜μ μΈ νš¨μœ¨μ„±μ„ ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. μ΄λŠ” RAG κ΅¬ν˜„μ˜ 경제적 μ‹€ν–‰ κ°€λŠ₯성을 ν–₯μƒμ‹œν‚€κ³  AI μ‹œμŠ€ν…œμ˜ 지속 κ°€λŠ₯성에 κΈ°μ—¬ν•©λ‹ˆλ‹€.

4. 합성정보

RAGλŠ” β€‹β€‹κ²€μƒ‰λœ 지식과 생성 κΈ°λŠ₯을 μ™„λ²½ν•˜κ²Œ κ²°ν•©ν•˜μ—¬ 포괄적이고 κ΄€λ ¨μ„± μžˆλŠ” 닡변을 μƒμ„±ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ 정보 좜처λ₯Ό μ’…ν•©ν•¨μœΌλ‘œμ¨ λͺ¨λΈμ— λŒ€ν•œ μ΄ν•΄μ˜ 깊이λ₯Ό 높이고 λ”μš± μ •ν™•ν•œ κ²°κ³Όλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

5. ν›ˆλ ¨μ˜ μš©μ΄μ„± 

RAG의 μ‚¬μš©μž μΉœν™”μ μΈ νŠΉμ§•μ€ ν•™μŠ΅μ˜ μš©μ΄μ„±μ—μ„œ λ“œλŸ¬λ‚©λ‹ˆλ‹€. κ°œλ°œμžλŠ” λͺ¨λΈμ„ μ†μ‰½κ²Œ λ―Έμ„Έ μ‘°μ •ν•˜μ—¬ νŠΉμ • λ„λ©”μΈμ΄λ‚˜ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— 맞게 μ‘°μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ ν•™μŠ΅μ˜ λ‹¨μˆœμ„± 덕뢄에 RAGλŠ” λ‹€μ–‘ν•œ AI μ‹œμŠ€ν…œμ— μ›ν™œν•˜κ²Œ 톡합될 수 있으며, μ–Έμ–΄ 이해 및 생성을 ν–₯μƒμ‹œν‚€λŠ” λ‹€μž¬λ‹€λŠ₯ν•˜κ³  μ‚¬μš©ν•˜κΈ° μ‰¬μš΄ μ†”λ£¨μ…˜μž…λ‹ˆλ‹€.

RAG의 ν•΄κ²° λŠ₯λ ₯ LLM ν™˜κ° 데이터 신선도 λ¬Έμ œλŠ” AI μ‹œμŠ€ν…œμ˜ μ •ν™•μ„±κ³Ό 신뒰성을 ν–₯μƒμ‹œν‚€λ €λŠ” κΈ°μ—…μ—κ²Œ μ€‘μš”ν•œ λ„κ΅¬μž…λ‹ˆλ‹€.

RAG μ‚¬μš© 사둀

RAG의 적응성은 지식 μ—”μ§„λΆ€ν„° 검색 κΈ°λŠ₯ ν–₯상에 이λ₯΄κΈ°κΉŒμ§€ μ‹€μ œ 세계에 영ν–₯을 λ―ΈμΉ˜λŠ” ν˜μ‹ μ μΈ μ†”λ£¨μ…˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€. 

1. 지식 μ—”μ§„

RAGλŠ” ​​기쑴 μ–Έμ–΄ λͺ¨λΈμ„ μ΅œμ‹ μ˜ μ§„μ •ν•œ μ½˜ν…μΈ  생성을 μœ„ν•œ 포괄적인 지식 μ—”μ§„μœΌλ‘œ λ³€ν™˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” ꡐ윑 ν”Œλž«νΌ, 연ꡬ ν™˜κ²½ λ˜λŠ” 정보 집약적 μ‚°μ—…κ³Ό 같이 μ΅œμ‹  정보가 ν•„μš”ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ 특히 μœ μš©ν•©λ‹ˆλ‹€.

2. 검색 κ°•ν™”

LLM을 검색 μ—”μ§„κ³Ό ν†΅ν•©ν•¨μœΌλ‘œμ¨ LLMμ—μ„œ μƒμ„±λœ λ‹΅λ³€μœΌλ‘œ 검색 κ²°κ³Όλ₯Ό κ°•ν™”ν•˜λ©΄ 정보 쿼리에 λŒ€ν•œ μ‘λ‹΅μ˜ 정확성이 ν–₯μƒλ©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ‚¬μš©μž κ²½ν—˜μ΄ ν–₯μƒλ˜κ³  μ›Œν¬ν”Œλ‘œκ°€ κ°„μ†Œν™”λ˜μ–΄ μž‘μ—…μ— ν•„μš”ν•œ 정보에 더 μ‰½κ²Œ μ•‘μ„ΈμŠ€ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 

3. ν…μŠ€νŠΈ μš”μ•½

RAGλŠ” β€‹β€‹λŒ€λŸ‰μ˜ ν…μŠ€νŠΈμ— λŒ€ν•΄ κ°„κ²°ν•˜κ³  μœ μ΅ν•œ μš”μ•½μ„ 생성할 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ RAGλŠ” μ •ν™•ν•˜κ³  μ² μ €ν•œ κ°œλ°œμ„ κ°€λŠ₯ν•˜κ²Œ ν•˜μ—¬ μ‚¬μš©μžμ˜ μ‹œκ°„κ³Ό λ…Έλ ₯을 μ ˆμ•½ν•΄ μ€λ‹ˆλ‹€. ν…μŠ€νŠΈ μš”μ•½ 제3자 μ†ŒμŠ€λ‘œλΆ€ν„° κ΄€λ ¨ 데이터λ₯Ό μ–»μŠ΅λ‹ˆλ‹€. 

4. μ§ˆμ˜μ‘λ‹΅ 챗봇

LLM을 챗봇에 ν†΅ν•©ν•˜λ©΄ νšŒμ‚¬ λ¬Έμ„œ 및 지식 κΈ°λ°˜μ—μ„œ μ •ν™•ν•œ 정보λ₯Ό μžλ™μœΌλ‘œ μΆ”μΆœν•  수 μžˆμ–΄ 후속 ν”„λ‘œμ„ΈμŠ€κ°€ λ³€ν™”λ©λ‹ˆλ‹€. 이λ₯Ό 톡해 고객 문의 사항을 μ •ν™•ν•˜κ³  μ‹ μ†ν•˜κ²Œ ν•΄κ²°ν•˜λŠ” μ±—λ΄‡μ˜ νš¨μœ¨μ„±μ΄ λ†’μ•„μ§‘λ‹ˆλ‹€. 

RAG의 미래 전망과 ν˜μ‹ 

κ°œμΈν™”λœ 응닡, μ‹€μ‹œκ°„ 정보 ν•©μ„± 및 지속적인 μž¬κ΅μœ‘μ— λŒ€ν•œ μ˜μ‘΄λ„ κ°μ†Œμ— 점점 더 쀑점을 두고 μžˆλŠ” RAGλŠ” 역동적이고 상황에 λ§žλŠ” AI μƒν˜Έ μž‘μš©μ„ μ΄‰μ§„ν•˜λŠ” μ–Έμ–΄ λͺ¨λΈμ˜ ν˜μ‹ μ μΈ κ°œλ°œμ„ μ•½μ†ν•©λ‹ˆλ‹€.

RAGκ°€ μ„±μˆ™ν•΄μ§μ— 따라 ν–₯μƒλœ μ •ν™•λ„λ‘œ λ‹€μ–‘ν•œ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— μ›ν™œν•˜κ²Œ ν†΅ν•©λ˜μ–΄ μ‚¬μš©μžμ—κ²Œ μ„Έλ ¨λ˜κ³  μ•ˆμ •μ μΈ μƒν˜Έ μž‘μš© κ²½ν—˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

λ°©λ¬Έ Unite.ai AI ν˜μ‹ μ— λŒ€ν•œ 더 λ‚˜μ€ 톡찰λ ₯κ³Ό 기술.