Refresh

This website www.unite.ai/ko/from-jailbreaks-to-injections-how-meta-is-strengthening-ai-security-with-llama-firewall/ is currently offline. Cloudflare's Always Online™ shows a snapshot of this web page from the Internet Archive's Wayback Machine. To check for the live version, click Refresh.

Rescale λ―ΈνŒ… μ˜ˆμ•½

νƒˆμ˜₯μ—μ„œ μ£Όμž…κΉŒμ§€: 메타가 Llama λ°©ν™”λ²½μœΌλ‘œ AI λ³΄μ•ˆμ„ κ°•ν™”ν•˜λŠ” 방법

사이버 λ³΄μ•ˆ

νƒˆμ˜₯μ—μ„œ μ£Όμž…κΉŒμ§€: 메타가 Llama λ°©ν™”λ²½μœΌλ‘œ AI λ³΄μ•ˆμ„ κ°•ν™”ν•˜λŠ” 방법

mm

게재

 on

νƒˆμ˜₯μ—μ„œ μ£Όμž…κΉŒμ§€: 메타가 Llama λ°©ν™”λ²½μœΌλ‘œ AI λ³΄μ•ˆμ„ κ°•ν™”ν•˜λŠ” 방법

λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM) 처럼 λ©”νƒ€μ˜ 라마 μ‹œλ¦¬μ¦ˆλŠ” μ–΄λ–»κ²Œ λ°”λ€Œμ—ˆλ‚˜μš”? 인곡 μ§€λŠ₯ (AI) μ˜€λŠ˜λ‚ μ—λ„ μ—¬μ „νžˆ μœ νš¨ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ λͺ¨λΈμ€ 더 이상 λ‹¨μˆœν•œ μ±„νŒ… 도ꡬ가 μ•„λ‹™λ‹ˆλ‹€. 이메일, μ›Ήμ‚¬μ΄νŠΈ 및 기타 μ†ŒμŠ€μ—μ„œ μž…λ ₯된 정보λ₯Ό ν™œμš©ν•˜μ—¬ μ½”λ“œλ₯Ό μž‘μ„±ν•˜κ³ , μž‘μ—…μ„ κ΄€λ¦¬ν•˜κ³ , μ˜μ‚¬ 결정을 내릴 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” κ°•λ ₯ν•œ κΈ°λŠ₯을 μ œκ³΅ν•˜μ§€λ§Œ μƒˆλ‘œμš΄ λ³΄μ•ˆ λ¬Έμ œλ„ μ•ΌκΈ°ν•©λ‹ˆλ‹€.

기쑴의 보호 λ°©λ²•μœΌλ‘œλŠ” μ΄λŸ¬ν•œ 문제λ₯Ό μ™„μ „νžˆ 막을 수 μ—†μŠ΅λ‹ˆλ‹€. λ‹€μŒκ³Ό 같은 곡격이 μžˆμŠ΅λ‹ˆλ‹€. AI νƒˆμ˜₯, μ‹ μ†ν•œ μ£Όμ‚¬μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œ 생성은 AI의 신뒰와 μ•ˆμ „μ„ ν•΄μΉ  수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ MetaλŠ” λΌλ§ˆνŒŒμ΄μ–΄μ›”μ΄ μ˜€ν”ˆμ†ŒμŠ€ λ„κ΅¬λŠ” AI μ—μ΄μ „νŠΈλ₯Ό λ©΄λ°€νžˆ κ΄€μ°°ν•˜κ³  μœ„ν˜‘ λ°œμƒ μ‹œ 이λ₯Ό μ°¨λ‹¨ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ κ³Όμ œμ™€ 해결책을 μ΄ν•΄ν•˜λŠ” 것은 미래λ₯Ό μœ„ν•œ λ”μš± μ•ˆμ „ν•˜κ³  μ‹ λ’°ν•  수 μžˆλŠ” AI μ‹œμŠ€ν…œμ„ κ΅¬μΆ•ν•˜λŠ” 데 ν•„μˆ˜μ μž…λ‹ˆλ‹€.

AI λ³΄μ•ˆμ˜ μƒˆλ‘œμš΄ μœ„ν˜‘ 이해

AI λͺ¨λΈμ˜ μ„±λŠ₯이 ν–₯상됨에 따라, μ§λ©΄ν•˜λŠ” λ³΄μ•ˆ μœ„ν˜‘μ˜ λ²”μœ„μ™€ λ³΅μž‘μ„± λ˜ν•œ 크게 μ¦κ°€ν•©λ‹ˆλ‹€. μ£Όμš” κ³Όμ œλ‘œλŠ” νƒˆμ˜₯, 즉석 μ£Όμž…, 그리고 μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œ 생성 등이 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ„ν˜‘μ„ ν•΄κ²°ν•˜μ§€ μ•Šκ³  λ°©μΉ˜ν•  경우, AI μ‹œμŠ€ν…œκ³Ό μ‚¬μš©μžμ—κ²Œ μƒλ‹Ήν•œ ν”Όν•΄λ₯Ό μž…νž 수 μžˆμŠ΅λ‹ˆλ‹€.

AI νƒˆμ˜₯이 μ•ˆμ „ 쑰치λ₯Ό μš°νšŒν•˜λŠ” 방법

AI νƒˆμ˜₯은 κ³΅κ²©μžκ°€ μ–Έμ–΄ λͺ¨λΈμ„ μ‘°μž‘ν•˜μ—¬ μ•ˆμ „ μ œν•œμ„ μš°νšŒν•˜λŠ” 기법을 λ§ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μ œν•œμ€ μœ ν•΄ν•˜κ±°λ‚˜ 편ν–₯μ μ΄κ±°λ‚˜ λΆ€μ μ ˆν•œ μ½˜ν…μΈ  생성을 λ°©μ§€ν•©λ‹ˆλ‹€. κ³΅κ²©μžλŠ” μ›μΉ˜ μ•ŠλŠ” 좜λ ₯을 μœ λ„ν•˜λŠ” μž…λ ₯을 μ‘°μž‘ν•˜μ—¬ λͺ¨λΈμ˜ λ―Έλ¬˜ν•œ 취약점을 μ•…μš©ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μ‚¬μš©μžκ°€ μ½˜ν…μΈ  ν•„ν„°λ₯Ό μš°νšŒν•˜λŠ” ν”„λ‘¬ν”„νŠΈλ₯Ό μƒμ„±ν•˜μ—¬ AIκ°€ λΆˆλ²• ν™œλ™μ΄λ‚˜ λͺ¨μš•적인 μ–Έμ–΄ μ‚¬μš©μ— λŒ€ν•œ 지침을 μ œκ³΅ν•˜λ„λ‘ μœ λ„ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ νƒˆμ˜₯은 μ‚¬μš©μž μ•ˆμ „μ„ μœ„ν˜‘ν•˜κ³  μ‹¬κ°ν•œ 윀리적 문제λ₯Ό μ•ΌκΈ°ν•˜λ©°, 특히 AI 기술이 널리 μ‚¬μš©λ˜κ³  μžˆλŠ” μƒν™©μ—μ„œ λ”μš± κ·Έλ ‡μŠ΅λ‹ˆλ‹€.

AI νƒˆμ˜₯이 μ–΄λ–»κ²Œ μž‘λ™ν•˜λŠ”μ§€ λ³΄μ—¬μ£ΌλŠ” λͺ‡ κ°€μ§€ μ£Όλͺ©ν•  λ§Œν•œ μ˜ˆλŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

AI μ–΄μ‹œμŠ€ν„΄νŠΈμ— λŒ€ν•œ ν¬λ ˆμ„Όλ„ 곡격: λ³΄μ•ˆ 연ꡬ원듀은 AI μ‘°μˆ˜κ°€ μ•ˆμ „ 필터에도 λΆˆκ΅¬ν•˜κ³  λͺ°λ‘œν† ν”„ μΉ΅ν…ŒμΌμ„ λ§Œλ“œλŠ” 방법에 λŒ€ν•œ 지침을 μ œκ³΅ν•˜λ„λ‘ μ‘°μž‘λœ 사둀λ₯Ό λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.

DeepMind의 λ ˆλ“œ νŒ€ 연ꡬ: DeepMindλŠ” κ³΅κ²©μžκ°€ κ³ κΈ‰ ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ„ μ‚¬μš©ν•˜μ—¬ 윀리적 ν†΅μ œλ₯Ό μš°νšŒν•˜κ³  "λ ˆλ“œ νŒ€"이라고 μ•Œλ €μ§„ κΈ°μˆ μ„ μ‚¬μš©ν•˜μ—¬ AI λͺ¨λΈμ„ μ•…μš©ν•  수 μžˆλ‹€λŠ” 것을 λ°ν˜”μŠ΅λ‹ˆλ‹€.

λΌμΌ€λΌμ˜ μ λŒ€μ  μž…λ ₯: λΌμΌ€λΌμ˜ 연ꡬ원듀은 말도 μ•ˆ λ˜λŠ” λ¬Έμžμ—΄μ΄λ‚˜ λ‘€ν”Œλ ˆμž‰ ν”„λ‘¬ν”„νŠΈκ°€ AI λͺ¨λΈμ„ 속여 μœ ν•΄ν•œ μ½˜ν…μΈ λ₯Ό 생성할 수 μžˆμŒμ„ λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄, μ‚¬μš©μžκ°€ μ½˜ν…μΈ  ν•„ν„°λ₯Ό μš°νšŒν•˜λŠ” ν”„λ‘¬ν”„νŠΈλ₯Ό μƒμ„±ν•˜μ—¬ AIκ°€ λΆˆλ²• ν™œλ™μ΄λ‚˜ λͺ¨μš•적인 언어에 λŒ€ν•œ 지침을 μ œκ³΅ν•˜λ„λ‘ μœ λ„ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ νƒˆμ˜₯은 μ‚¬μš©μž μ•ˆμ „μ„ μœ„ν˜‘ν•˜κ³  μ‹¬κ°ν•œ 윀리적 문제λ₯Ό μ•ΌκΈ°ν•˜λ©°, 특히 AI 기술이 널리 μ‚¬μš©λ˜κ³  μžˆλŠ” μƒν™©μ—μ„œ λ”μš± κ·Έλ ‡μŠ΅λ‹ˆλ‹€.

즉각적인 μ£Όμž… κ³΅κ²©μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

μ‹ μ†ν•œ μ£Όμž… 곡격은 또 λ‹€λ₯Έ μ‹¬κ°ν•œ μ·¨μ•½μ μž…λ‹ˆλ‹€. μ΄λŸ¬ν•œ κ³΅κ²©μ—μ„œλŠ” AI의 λ™μž‘μ„ λ³€κ²½ν•˜κΈ° μœ„ν•΄ μ•…μ„± μž…λ ₯을 λ„μž…ν•˜λŠ”λ°, μ΄λŠ” μ’…μ’… λ―Έλ¬˜ν•œ λ°©μ‹μœΌλ‘œ μ΄λ£¨μ–΄μ§‘λ‹ˆλ‹€. κΈˆμ§€λœ μ½˜ν…μΈ λ₯Ό 직접 μœ λ„ν•˜λ €λŠ” νƒˆμ˜₯κ³ΌλŠ” 달리, μ‹ μ†ν•œ μ£Όμž…μ€ λͺ¨λΈμ˜ λ‚΄λΆ€ μ˜μ‚¬ κ²°μ •μ΄λ‚˜ λ§₯락을 μ‘°μž‘ν•˜μ—¬ λ―Όκ°ν•œ 정보λ₯Ό λ…ΈμΆœν•˜κ±°λ‚˜ μ˜λ„μΉ˜ μ•Šμ€ λ™μž‘μ„ μˆ˜ν–‰ν•˜κ²Œ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄, μ‚¬μš©μž μž…λ ₯에 μ˜μ‘΄ν•˜μ—¬ 응닡을 μƒμ„±ν•˜λŠ” μ±—λ΄‡μ˜ 경우, κ³΅κ²©μžκ°€ AIμ—κ²Œ κΈ°λ°€ 데이터λ₯Ό κ³΅κ°œν•˜κ±°λ‚˜ 좜λ ₯ μŠ€νƒ€μΌμ„ μˆ˜μ •ν•˜λ„λ‘ μ§€μ‹œν•˜λŠ” λ©”μ‹œμ§€λ₯Ό μ‘°μž‘ν•  경우 침해될 수 μžˆμŠ΅λ‹ˆλ‹€. λ§Žμ€ AI μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ΄ μ™ΈλΆ€ μž…λ ₯을 μ²˜λ¦¬ν•˜κΈ° λ•Œλ¬Έμ—, 즉각적인 μΈμ μ…˜μ€ μƒλ‹Ήν•œ 곡격 ν‘œλ©΄μ„ μ΄ˆλž˜ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ 곡격의 κ²°κ³Όλ‘œλŠ” 잘λͺ»λœ 정보 유포, 데이터 유좜, 그리고 AI μ‹œμŠ€ν…œμ— λŒ€ν•œ μ‹ λ’° μ €ν•˜κ°€ λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ AI λ³΄μ•ˆνŒ€μ€ 즉각적인 μΈμ μ…˜ 곡격의 탐지 및 μ˜ˆλ°©μ„ μ΅œμš°μ„  과제둜 μ‚Όκ³  μžˆμŠ΅λ‹ˆλ‹€.

μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œ μƒμ„±μ˜ μœ„ν—˜

AI λͺ¨λΈμ˜ μ½”λ“œ 생성 λŠ₯λ ₯은 μ†Œν”„νŠΈμ›¨μ–΄ 개발 ν”„λ‘œμ„ΈμŠ€λ₯Ό ν˜μ‹ ν–ˆμŠ΅λ‹ˆλ‹€. GitHub Copilotκ³Ό 같은 λ„κ΅¬λŠ” μ½”λ“œ μ‘°κ°μ΄λ‚˜ 전체 ν•¨μˆ˜λ₯Ό μ œμ•ˆν•˜μ—¬ 개발자λ₯Ό μ§€μ›ν•©λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ μ΄λŸ¬ν•œ νŽΈμ˜μ„±μ€ μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œ 생성과 κ΄€λ ¨λœ μƒˆλ‘œμš΄ μœ„ν—˜μ„ μ•ΌκΈ°ν•©λ‹ˆλ‹€.

λ°©λŒ€ν•œ 데이터셋을 기반으둜 ν›ˆλ ¨λœ AI μ½”λ”© μ–΄μ‹œμŠ€ν„΄νŠΈλŠ” SQL μ‚½μž…, λΆ€μ μ ˆν•œ 인증, λΆˆμΆ©λΆ„ν•œ μž…λ ₯κ°’ μ •μ œ λ“± λ³΄μ•ˆ 결함을 ν¬ν•¨ν•˜λŠ” μ½”λ“œλ₯Ό μ˜λ„μΉ˜ μ•Šκ²Œ 생성할 수 있으며, μ΄λŸ¬ν•œ 문제λ₯Ό μΈμ§€ν•˜μ§€ λͺ»ν•  수 μžˆμŠ΅λ‹ˆλ‹€. κ°œλ°œμžλŠ” μžμ‹ λ„ λͺ¨λ₯΄κ²Œ μ΄λŸ¬ν•œ μ½”λ“œλ₯Ό ν”„λ‘œλ•μ…˜ ν™˜κ²½μ— 톡합할 수 μžˆμŠ΅λ‹ˆλ‹€.

κΈ°μ‘΄ λ³΄μ•ˆ μŠ€μΊλ„ˆλŠ” 배포 전에 AIκ°€ μƒμ„±ν•˜λŠ” μ΄λŸ¬ν•œ 취약점을 νŒŒμ•…ν•˜μ§€ λͺ»ν•˜λŠ” κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ κ²©μ°¨λŠ” AIκ°€ μƒμ„±ν•˜λŠ” μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œμ˜ μ‚¬μš©μ„ λΆ„μ„ν•˜κ³  λ°©μ§€ν•  수 μžˆλŠ” μ‹€μ‹œκ°„ λ³΄μ•ˆ 쑰치의 μ‹œκΈ‰ν•œ ν•„μš”μ„±μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

LlamaFirewall κ°œμš” 및 AI λ³΄μ•ˆμ—μ„œμ˜ μ—­ν• 

λ©”νƒ€μ˜ LlamaFirewall은 챗봇 및 μ½”λ“œ 생성 λ„μš°λ―Έμ™€ 같은 AI μ—μ΄μ „νŠΈλ₯Ό λ³΄ν˜Έν•˜λŠ” μ˜€ν”ˆμ†ŒμŠ€ ν”„λ ˆμž„μ›Œν¬μž…λ‹ˆλ‹€. νƒˆμ˜₯, 즉석 μ£Όμž…, μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œ 생성 λ“± λ³΅μž‘ν•œ λ³΄μ•ˆ μœ„ν˜‘μ„ ν•΄κ²°ν•©λ‹ˆλ‹€. 2025λ…„ XNUMX월에 μΆœμ‹œλœ LlamaFirewall은 μ‚¬μš©μžμ™€ AI μ‹œμŠ€ν…œ κ°„μ˜ μ‹€μ‹œκ°„ μ μ‘ν˜• λ³΄μ•ˆ 계측 ​​역할을 ν•©λ‹ˆλ‹€. μœ ν•΄ν•˜κ±°λ‚˜ μŠΉμΈλ˜μ§€ μ•Šμ€ ν–‰μœ„κ°€ λ°œμƒν•˜κΈ° 전에 이λ₯Ό λ°©μ§€ν•˜λŠ” 것이 LlamaFirewall의 λͺ©μ μž…λ‹ˆλ‹€.

λ‹¨μˆœν•œ μ½˜ν…μΈ  필터와 달리 LlamaFirewall은 μ§€λŠ₯ν˜• λͺ¨λ‹ˆν„°λ§ μ‹œμŠ€ν…œ 역할을 ν•©λ‹ˆλ‹€. AI의 μž…λ ₯, 좜λ ₯ 및 λ‚΄λΆ€ μΆ”λ‘  ν”„λ‘œμ„ΈμŠ€λ₯Ό μ§€μ†μ μœΌλ‘œ λΆ„μ„ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ 포괄적인 감독을 톡해 직접적인 곡격(예: AIλ₯Ό 속이기 μœ„ν•΄ μ˜λ„μ μœΌλ‘œ μ‘°μž‘λœ λ©”μ‹œμ§€)은 λ¬Όλ‘ , μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œμ˜ 우발적인 생성과 같은 λ―Έλ¬˜ν•œ μœ„ν—˜κΉŒμ§€ 감지할 수 μžˆμŠ΅λ‹ˆλ‹€.

이 ν”„λ ˆμž„μ›Œν¬λŠ” μœ μ—°μ„±μ„ μ œκ³΅ν•˜μ—¬ κ°œλ°œμžκ°€ ν•„μš”ν•œ 보호 κΈ°λŠ₯을 μ„ νƒν•˜κ³  νŠΉμ • μš”κ΅¬ 사항에 맞좰 μ‚¬μš©μž μ§€μ • κ·œμΉ™μ„ κ΅¬ν˜„ν•  수 μžˆλ„λ‘ ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ 적응성 덕뢄에 LlamaFirewall은 κΈ°λ³Έ λŒ€ν™”ν˜• 봇뢀터 μ½”λ”© λ˜λŠ” μ˜μ‚¬ 결정이 κ°€λŠ₯ν•œ κ³ κΈ‰ 자율 μ—μ΄μ „νŠΈκΉŒμ§€ λ‹€μ–‘ν•œ AI μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— μ ν•©ν•©λ‹ˆλ‹€. Metaκ°€ ν”„λ‘œλ•μ…˜ ν™˜κ²½μ—μ„œ LlamaFirewall을 ν™œμš©ν•œλ‹€λŠ” 사싀은 이 ν”„λ ˆμž„μ›Œν¬μ˜ μ•ˆμ •μ„±κ³Ό μ‹€μ œ 배포 쀀비성을 잘 λ³΄μ—¬μ€λ‹ˆλ‹€.

LlamaFirewall의 μ•„ν‚€ν…μ²˜ 및 μ£Όμš” ꡬ성 μš”μ†Œ

LlamaFirewall은 μŠ€μΊλ„ˆ λ˜λŠ” κ°€λ“œλ ˆμΌμ΄λΌκ³  λΆˆλ¦¬λŠ” μ—¬λŸ¬ 개의 특수 ꡬ성 μš”μ†Œλ‘œ κ΅¬μ„±λœ λͺ¨λ“ˆμ‹ κ³„μΈ΅ν˜• μ•„ν‚€ν…μ²˜λ₯Ό μ‚¬μš©ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ ꡬ성 μš”μ†ŒλŠ” AI μ—μ΄μ „νŠΈμ˜ μ›Œν¬ν”Œλ‘œ μ „λ°˜μ— 걸쳐 닀단계 λ³΄μ•ˆμ„ μ œκ³΅ν•©λ‹ˆλ‹€.

LlamaFirewall의 μ•„ν‚€ν…μ²˜λŠ” 주둜 λ‹€μŒ λͺ¨λ“ˆλ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€.

ν”„λ‘¬ν”„νŠΈ κ°€λ“œ 2

첫 번째 λ°©μ–΄ 계측 역할을 ν•˜λŠ” Prompt Guard 2λŠ” μ‚¬μš©μž μž…λ ₯ 및 기타 데이터 μŠ€νŠΈλ¦Όμ„ μ‹€μ‹œκ°„μœΌλ‘œ κ²€μ‚¬ν•˜λŠ” AI 기반 μŠ€μΊλ„ˆμž…λ‹ˆλ‹€. μ£Όμš” κΈ°λŠ₯은 AIμ—κ²Œ μ œν•œ 사항을 λ¬΄μ‹œν•˜κ±°λ‚˜ κΈ°λ°€ 정보λ₯Ό κ³΅κ°œν•˜λ„λ‘ μ§€μ‹œν•˜λŠ” λͺ…λ Ήκ³Ό 같은 μ•ˆμ „ μ œμ–΄λ₯Ό μš°νšŒν•˜λ €λŠ” μ‹œλ„λ₯Ό κ°μ§€ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. 이 λͺ¨λ“ˆμ€ 높은 정확도와 μ΅œμ†Œ μ§€μ—° μ‹œκ°„μ„ μ œκ³΅ν•˜λ„λ‘ μ΅œμ ν™”λ˜μ–΄ μžˆμ–΄ μ‹œκ°„μ— λ―Όκ°ν•œ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— μ ν•©ν•©λ‹ˆλ‹€.

μ—μ΄μ „νŠΈ μ •λ ¬ 검사

이 ꡬ성 μš”μ†ŒλŠ” AI의 λ‚΄λΆ€ μΆ”λ‘  과정을 κ²€μ‚¬ν•˜μ—¬ μ˜λ„λœ λͺ©ν‘œμ—μ„œ λ²—μ–΄λ‚˜λŠ” 뢀뢄을 μ‹λ³„ν•©λ‹ˆλ‹€. AI의 μ˜μ‚¬ κ²°μ • 과정이 λ°©ν•΄λ°›κ±°λ‚˜ μ˜€λ„λ  수 μžˆλŠ” λ―Έλ¬˜ν•œ μ‘°μž‘μ„ κ°μ§€ν•©λ‹ˆλ‹€. 아직 μ‹€ν—˜ λ‹¨κ³„μ΄μ§€λ§Œ, μ—μ΄μ „νŠΈ μ •λ ¬ κ²€μ‚¬λŠ” λ³΅μž‘ν•˜κ³  간접적인 곡격 기법을 λ°©μ–΄ν•˜λŠ” 데 μžˆμ–΄ μ€‘μš”ν•œ 진전을 λ³΄μ—¬μ€λ‹ˆλ‹€.

μ½”λ“œμ‰΄λ“œ

CodeShieldλŠ” AI μ—μ΄μ „νŠΈκ°€ μƒμ„±ν•œ μ½”λ“œμ— λŒ€ν•œ 동적 정적 뢄석기 역할을 ν•©λ‹ˆλ‹€. AIκ°€ μƒμ„±ν•œ μ½”λ“œ 쑰각을 μ‹€ν–‰ λ˜λŠ” λ°°ν¬ν•˜κΈ° 전에 λ³΄μ•ˆ κ²°ν•¨μ΄λ‚˜ μœ„ν—˜ν•œ νŒ¨ν„΄μ„ λ©΄λ°€νžˆ λΆ„μ„ν•©λ‹ˆλ‹€. μ—¬λŸ¬ ν”„λ‘œκ·Έλž˜λ° 언어와 μ‚¬μš©μž μ •μ˜ κ°€λŠ₯ν•œ κ·œμΉ™ μ„ΈνŠΈλ₯Ό μ§€μ›ν•˜λŠ” 이 λͺ¨λ“ˆμ€ AI 지원 코딩을 μ‚¬μš©ν•˜λŠ” κ°œλ°œμžμ—κ²Œ ν•„μˆ˜μ μΈ λ„κ΅¬μž…λ‹ˆλ‹€.

λ§žμΆ€ν˜• μŠ€μΊλ„ˆ

κ°œλ°œμžλŠ” μ •κ·œ ν‘œν˜„μ‹μ΄λ‚˜ κ°„λ‹¨ν•œ ν”„λ‘¬ν”„νŠΈ 기반 κ·œμΉ™μ„ μ‚¬μš©ν•˜μ—¬ μŠ€μΊλ„ˆλ₯Ό ν†΅ν•©ν•˜μ—¬ 적응성을 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€. 이 κΈ°λŠ₯을 μ‚¬μš©ν•˜λ©΄ ν”„λ ˆμž„μ›Œν¬ μ—…λ°μ΄νŠΈλ₯Ό 기닀리지 μ•Šκ³ λ„ μƒˆλ‘œμš΄ μœ„ν˜‘μ— μ‹ μ†ν•˜κ²Œ λŒ€μ‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

AI μ›Œν¬ν”Œλ‘œ λ‚΄ 톡합

LlamaFirewall의 λͺ¨λ“ˆμ€ AI μ—μ΄μ „νŠΈ 수λͺ… 주기의 μ—¬λŸ¬ 단계에 효과적으둜 ν†΅ν•©λ©λ‹ˆλ‹€. Prompt Guard 2λŠ” μˆ˜μ‹ λ˜λŠ” ν”„λ‘¬ν”„νŠΈλ₯Ό ν‰κ°€ν•˜κ³ , Agent Alignment ChecksλŠ” μž‘μ—… μ‹€ν–‰ 쀑 좔둠을 λͺ¨λ‹ˆν„°λ§ν•˜λ©°, CodeShieldλŠ” μƒμ„±λœ μ½”λ“œλ₯Ό κ²€ν† ν•©λ‹ˆλ‹€. λ³΄μ•ˆ κ°•ν™”λ₯Ό μœ„ν•΄ μΆ”κ°€ λ§žμΆ€ν˜• μŠ€μΊλ„ˆλ₯Ό μ–Έμ œλ“ μ§€ λ°°μΉ˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

이 ν”„λ ˆμž„μ›Œν¬λŠ” 쀑앙 집쀑식 μ •μ±… μ—”μ§„μœΌλ‘œ μž‘λ™ν•˜μ—¬ μ΄λŸ¬ν•œ ꡬ성 μš”μ†Œλ₯Ό μ‘°μœ¨ν•˜κ³  λ§žμΆ€ν˜• λ³΄μ•ˆ 정책을 μ‹œν–‰ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μ„€κ³„λŠ” λ³΄μ•ˆ μ‘°μΉ˜μ— λŒ€ν•œ μ •λ°€ν•œ μ œμ–΄λ₯Ό κ°•ν™”ν•˜μ—¬ 각 AI 배포의 νŠΉμ • μš”κ΅¬ 사항을 μΆ©μ‘±ν•˜λ„λ‘ 보μž₯ν•©λ‹ˆλ‹€.

Meta의 LlamaFirewall의 μ‹€μ œ μ‚¬μš©

Meta의 LlamaFirewall은 이미 AI μ‹œμŠ€ν…œμ„ μ§€λŠ₯ν˜• κ³΅κ²©μœΌλ‘œλΆ€ν„° λ³΄ν˜Έν•˜λŠ” 데 μ‚¬μš©λ˜κ³  있으며, λ‹€μ–‘ν•œ μ‚°μ—… λΆ„μ•Όμ—μ„œ AI의 μ•ˆμ „μ„±κ³Ό 신뒰성을 μœ μ§€ν•˜λŠ” 데 도움을 μ€λ‹ˆλ‹€.

μ—¬ν–‰ κ³„νš AI μ—μ΄μ „νŠΈ

ν•œ κ°€μ§€ μ˜ˆλŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€. μ—¬ν–‰ κ³„νš LlamaFirewall의 Prompt Guard 2λ₯Ό μ‚¬μš©ν•˜μ—¬ μ—¬ν–‰ 리뷰 및 기타 μ›Ή μ½˜ν…μΈ λ₯Ό κ²€μ‚¬ν•˜λŠ” AI μ—μ΄μ „νŠΈμž…λ‹ˆλ‹€. νƒˆμ˜₯ ν”„λ‘¬ν”„νŠΈλ‚˜ μœ ν•΄ν•œ 지침이 ν¬ν•¨λ˜μ–΄ μžˆμ„ 수 μžˆλŠ” μ˜μ‹¬μŠ€λŸ¬μš΄ νŽ˜μ΄μ§€λ₯Ό μ°Ύμ•„λƒ…λ‹ˆλ‹€. λ™μ‹œμ— μ—μ΄μ „νŠΈ μ •λ ¬ 확인 λͺ¨λ“ˆμ€ AI의 μΆ”λ‘  방식을 κ΄€μ°°ν•©λ‹ˆλ‹€. AIκ°€ μˆ¨κ²¨μ§„ μΈμ μ…˜ 곡격으둜 인해 μ—¬ν–‰ κ³„νš λͺ©ν‘œμ—μ„œ λ²—μ–΄λ‚˜κΈ° μ‹œμž‘ν•˜λ©΄ μ‹œμŠ€ν…œμ€ AIλ₯Ό μ€‘μ§€μ‹œν‚΅λ‹ˆλ‹€. 이λ₯Ό 톡해 잘λͺ»λ˜κ±°λ‚˜ μ•ˆμ „ν•˜μ§€ μ•Šμ€ 행동이 λ°œμƒν•˜λŠ” 것을 λ°©μ§€ν•©λ‹ˆλ‹€.

AI μ½”λ”© μ–΄μ‹œμŠ€ν„΄νŠΈ

LlamaFirewall은 λ‹€μŒκ³Ό ν•¨κ»˜ μ‚¬μš©λ©λ‹ˆλ‹€. AI μ½”λ”© λ„κ΅¬μ΄λŸ¬ν•œ λ„κ΅¬λŠ” SQL 쿼리와 같은 μ½”λ“œλ₯Ό μž‘μ„±ν•˜κ³  μΈν„°λ„·μ—μ„œ 예제λ₯Ό κ°€μ Έμ˜΅λ‹ˆλ‹€. CodeShield λͺ¨λ“ˆμ€ μƒμ„±λœ μ½”λ“œλ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ κ²€μ‚¬ν•˜μ—¬ μ•ˆμ „ν•˜μ§€ μ•Šκ±°λ‚˜ μœ„ν—˜ν•œ νŒ¨ν„΄μ„ μ°Ύμ•„λƒ…λ‹ˆλ‹€. 이λ₯Ό 톡해 μ½”λ“œκ°€ ν”„λ‘œλ•μ…˜ ν™˜κ²½μ— 배포되기 전에 λ³΄μ•ˆ 문제λ₯Ό λ°©μ§€ν•  수 μžˆμŠ΅λ‹ˆλ‹€. κ°œλ°œμžλŠ” μ΄λŸ¬ν•œ 보호 κΈ°λŠ₯을 톡해 더 μ•ˆμ „ν•œ μ½”λ“œλ₯Ό 더 λΉ λ₯΄κ²Œ μž‘μ„±ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

이메일 λ³΄μ•ˆ 및 데이터 보호

At 라마콘 2025λ©”νƒ€λŠ” LlamaFirewall이 AI 이메일 λ„μš°λ―Έλ₯Ό λ³΄ν˜Έν•˜λŠ” 데λͺ¨λ₯Ό μ„ λ³΄μ˜€μŠ΅λ‹ˆλ‹€. LlamaFirewall이 μ—†μœΌλ©΄ 이메일에 μˆ¨κ²¨μ§„ 즉석 μΈμ μ…˜ 곡격에 AIκ°€ 속아 개인 정보 유좜둜 μ΄μ–΄μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€. LlamaFirewall을 ν™œμ„±ν™”ν•˜λ©΄ μ΄λŸ¬ν•œ μΈμ μ…˜μ„ μ‹ μ†ν•˜κ²Œ νƒμ§€ν•˜κ³  μ°¨λ‹¨ν•˜μ—¬ μ‚¬μš©μž 정보λ₯Ό μ•ˆμ „ν•˜κ²Œ λ³΄ν˜Έν•  수 μžˆμŠ΅λ‹ˆλ‹€.

νžˆν”„ 라인

λ©”νƒ€μ˜ LlamaFirewall은 νƒˆμ˜₯, 즉ν₯적인 μΈμ μ…˜, μ•ˆμ „ν•˜μ§€ μ•Šμ€ μ½”λ“œμ™€ 같은 μƒˆλ‘œμš΄ μœ„ν—˜μœΌλ‘œλΆ€ν„° AIλ₯Ό μ•ˆμ „ν•˜κ²Œ λ³΄ν˜Έν•˜λŠ” μ€‘μš”ν•œ κΈ°μˆ μž…λ‹ˆλ‹€. μ‹€μ‹œκ°„μœΌλ‘œ μž‘λ™ν•˜μ—¬ AI μ—μ΄μ „νŠΈλ₯Ό λ³΄ν˜Έν•˜κ³  μœ„ν˜‘μ΄ ν”Όν•΄λ₯Ό μž…νžˆκΈ° 전에 μ°¨λ‹¨ν•©λ‹ˆλ‹€. μ‹œμŠ€ν…œμ˜ μœ μ—°ν•œ 섀계 덕뢄에 κ°œλ°œμžλŠ” λ‹€μ–‘ν•œ μš”κ΅¬μ— λ§žλŠ” λ§žμΆ€ν˜• κ·œμΉ™μ„ μΆ”κ°€ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ—¬ν–‰ κ³„νšλΆ€ν„° μ½”λ”© 지원, 이메일 λ³΄μ•ˆκΉŒμ§€ λ‹€μ–‘ν•œ λΆ„μ•Όμ˜ AI μ‹œμŠ€ν…œμ— 도움을 μ€λ‹ˆλ‹€.

AIκ°€ λ”μš± λ³΄νŽΈν™”λ¨μ— 따라 LlamaFirewallκ³Ό 같은 λ„κ΅¬λŠ” μ‹ λ’°λ₯Ό κ΅¬μΆ•ν•˜κ³  μ‚¬μš©μžλ₯Ό μ•ˆμ „ν•˜κ²Œ λ³΄ν˜Έν•˜λŠ” 데 ν•„μˆ˜μ μž…λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ„ν—˜μ„ μ΄ν•΄ν•˜κ³  κ°•λ ₯ν•œ 보호 κΈ°λŠ₯을 κ΅¬μΆ•ν•˜λŠ” 것은 AI의 미래λ₯Ό μœ„ν•΄ ν•„μˆ˜μ μž…λ‹ˆλ‹€. LlamaFirewallκ³Ό 같은 ν”„λ ˆμž„μ›Œν¬λ₯Ό λ„μž…ν•¨μœΌλ‘œμ¨ κ°œλ°œμžμ™€ 기업은 μ‚¬μš©μžκ°€ μ•ˆμ‹¬ν•˜κ³  μ‹ λ’°ν•  수 μžˆλŠ” λ”μš± μ•ˆμ „ν•œ AI μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ„ κ°œλ°œν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ•„μ‚¬λ“œ μ••λ°”μŠ€ 박사 μ’…μ‹  λΆ€κ΅μˆ˜ νŒŒν‚€μŠ€νƒ„ COMSATS University Islamabadμ—μ„œ λ°•μ‚¬ν•™μœ„λ₯Ό μ·¨λ“ν–ˆμŠ΅λ‹ˆλ‹€. λ―Έκ΅­ λ…ΈμŠ€λ‹€μ½”νƒ€ μ£Όλ¦½λŒ€ν•™κ΅ μΆœμ‹ . 그의 μ—°κ΅¬λŠ” ν΄λΌμš°λ“œ, 포그, μ—£μ§€ μ»΄ν“¨νŒ…, 빅데이터 뢄석, AIλ₯Ό ν¬ν•¨ν•œ κ³ κΈ‰ κΈ°μˆ μ— 쀑점을 두고 μžˆμŠ΅λ‹ˆλ‹€. Abbas λ°•μ‚¬λŠ” ν‰νŒμ΄ 쒋은 κ³Όν•™ 저널과 μ»¨νΌλŸ°μŠ€μ— μΆœνŒλ¬Όμ„ λ°œν‘œν•˜λŠ” 데 μƒλ‹Ήν•œ κ³΅ν—Œμ„ ν–ˆμŠ΅λ‹ˆλ‹€.