ปัญญาประดิษฐ์

เจาะลึกสู่รุ่นดึงข้อมูล-เสริมใน LLM

การตีพิมพ์

8 เดือนที่ผ่านมา

ตุลาคม 2, 2023

การดึงภาพประกอบการสร้างเสริมโดยใช้ Midjourney

ลองจินตนาการว่าคุณเป็นนักวิเคราะห์ และคุณสามารถเข้าถึงโมเดลภาษาขนาดใหญ่ได้ คุณรู้สึกตื่นเต้นกับโอกาสที่จะนำมาสู่ขั้นตอนการทำงานของคุณ แต่แล้วคุณถามเกี่ยวกับราคาหุ้นล่าสุดหรืออัตราเงินเฟ้อในปัจจุบัน และมันโดนใจคุณ:

“ขออภัย ฉันไม่สามารถให้ข้อมูลแบบเรียลไทม์หรือภายหลังการตัดออกได้ ข้อมูลการฝึกอบรมครั้งล่าสุดของฉันจนถึงเดือนมกราคม 2022 เท่านั้น”

โมเดลภาษาขนาดใหญ่ สำหรับพลังทางภาษาทั้งหมด ขาดความสามารถในการเข้าใจ 'ตอนนี้'. และในโลกที่หมุนไปอย่างรวดเร็ว 'ตอนนี้' คือทุกสิ่งทุกอย่าง

การวิจัยพบว่าแบบจำลองภาษาที่ได้รับการฝึกอบรมล่วงหน้าขนาดใหญ่ (LLM) เป็นแหล่งความรู้ที่เป็นข้อเท็จจริงเช่นกัน

พวกเขาได้รับการฝึกอบรมเกี่ยวกับข้อมูลมากมายจนซึมซับข้อเท็จจริงและตัวเลขมากมาย เมื่อปรับแต่งอย่างละเอียด พวกเขาสามารถบรรลุผลลัพธ์ที่น่าทึ่งในงาน NLP ที่หลากหลาย

แต่สิ่งสำคัญคือ ความสามารถของพวกเขาในการเข้าถึงและจัดการความรู้ที่เก็บไว้นี้บางครั้งก็ไม่สมบูรณ์แบบ โดยเฉพาะอย่างยิ่งเมื่องานในมือต้องใช้ความรู้มาก โมเดลเหล่านี้อาจล้าหลังสถาปัตยกรรมเฉพาะทางมากกว่า มันเหมือนกับการมีห้องสมุดที่มีหนังสือทั้งหมดในโลก แต่ไม่มีแคตตาล็อกที่จะค้นหาสิ่งที่คุณต้องการ

ChatGPT ของ OpenAI ได้รับการอัปเกรดการท่องเว็บ

การประกาศล่าสุดของ OpenAI เกี่ยวกับความสามารถในการเรียกดูของ ChatGPT ถือเป็นการก้าวกระโดดครั้งสำคัญในทิศทางของ Retreatal-Augmented Generation (RAG) ขณะนี้ ChatGPT สามารถค้นหาข้อมูลที่เป็นปัจจุบันและเชื่อถือได้บนอินเทอร์เน็ตได้ โดยจะสะท้อนแนวทาง RAG ของการดึงข้อมูลจากแหล่งภายนอกแบบไดนามิกเพื่อให้การตอบสนองที่สมบูรณ์ยิ่งขึ้น

ขณะนี้ ChatGPT สามารถท่องอินเทอร์เน็ตเพื่อให้ข้อมูลที่เป็นปัจจุบันและเชื่อถือได้ พร้อมด้วยลิงก์โดยตรงไปยังแหล่งที่มา ไม่จำกัดเพียงข้อมูลก่อนเดือนกันยายน 2021 อีกต่อไป pic.twitter.com/pyj8a9HWkB
—OpenAI (@OpenAI) September 27, 2023

ขณะนี้มีให้บริการสำหรับผู้ใช้ Plus และ Enterprise แล้ว OpenAI วางแผนที่จะเปิดตัวฟีเจอร์นี้ให้กับผู้ใช้ทุกคนในเร็วๆ นี้ ผู้ใช้สามารถเปิดใช้งานได้โดยเลือก 'เรียกดูด้วย Bing' ใต้ตัวเลือก GPT-4

Chatgpt คุณสมบัติการท่องเว็บ 'Bing' ใหม่

วิศวกรรมพร้อมท์มีประสิทธิภาพแต่ยังไม่เพียงพอ

Prompt ทำหน้าที่เป็นประตูสู่ความรู้ของ LLM พวกมันจะชี้แนะโมเดล โดยให้ทิศทางสำหรับการตอบสนอง อย่างไรก็ตาม การสร้างข้อความแจ้งที่มีประสิทธิภาพไม่ใช่โซลูชันที่ครบถ้วนเพื่อให้ได้สิ่งที่คุณต้องการจาก LLM อย่างไรก็ตาม ให้เราพิจารณาแนวปฏิบัติที่ดีบางประการเมื่อเขียนข้อความแจ้ง:

ความกระจ่างชัด: พรอมต์ที่กำหนดไว้อย่างดีช่วยขจัดความคลุมเครือ ควรตรงไปตรงมา เพื่อให้แน่ใจว่าโมเดลเข้าใจจุดประสงค์ของผู้ใช้ ความชัดเจนนี้มักจะแปลเป็นคำตอบที่สอดคล้องกันและเกี่ยวข้องมากขึ้น
บริบท: โดยเฉพาะอย่างยิ่งสำหรับอินพุตจำนวนมาก ตำแหน่งของคำสั่งอาจส่งผลต่อเอาต์พุตได้ ตัวอย่างเช่น การย้ายคำสั่งไปยังจุดสิ้นสุดของพรอมต์ที่ยาวมักจะให้ผลลัพธ์ที่ดีกว่า
ความแม่นยำในการสอน: พลังของคำถามที่มักถ่ายทอดผ่านกรอบงาน "ใคร อะไร ที่ไหน เมื่อใด ทำไม อย่างไร" สามารถชี้นำแบบจำลองไปสู่การตอบสนองที่มุ่งเน้นมากขึ้น นอกจากนี้ การระบุรูปแบบหรือขนาดเอาต์พุตที่ต้องการจะสามารถปรับแต่งเอาต์พุตของโมเดลเพิ่มเติมได้
การจัดการกับความไม่แน่นอน: จำเป็นต้องแนะนำโมเดลเกี่ยวกับวิธีการตอบสนองเมื่อไม่แน่ใจ เช่น การสั่งให้โมเดลตอบกลับว่า “ไม่รู้” เมื่อไม่แน่ใจสามารถป้องกันไม่ให้เกิดความคลาดเคลื่อนได้ หรือ “ประสาทหลอน” ตอบกลับ
การคิดแบบเป็นขั้นเป็นตอน: สำหรับคำสั่งที่ซับซ้อน การแนะนำโมเดลให้คิดอย่างเป็นระบบหรือแบ่งงานออกเป็นงานย่อยสามารถนำไปสู่ผลลัพธ์ที่ครอบคลุมและแม่นยำยิ่งขึ้น

เกี่ยวกับความสำคัญของคำแนะนำในการชี้แนะ ChatGPT สามารถดูบทความที่ครอบคลุมได้ในบทความที่ ยูไนเต็ด.ไอ.

ความท้าทายในโมเดล AI เชิงสร้างสรรค์

วิศวกรรมพร้อมท์เกี่ยวข้องกับการปรับแต่งคำสั่งที่กำหนดให้กับโมเดลของคุณอย่างละเอียดเพื่อปรับปรุงประสิทธิภาพของโมเดล เป็นวิธีที่คุ้มค่ามากในการเพิ่มความแม่นยำของแอปพลิเคชัน Generative AI โดยต้องมีการปรับเปลี่ยนโค้ดเพียงเล็กน้อยเท่านั้น แม้ว่าวิศวกรรมที่รวดเร็วจะช่วยเพิ่มผลลัพธ์ได้อย่างมาก แต่สิ่งสำคัญคือต้องเข้าใจข้อจำกัดโดยธรรมชาติของโมเดลภาษาขนาดใหญ่ (LLM) ความท้าทายหลักสองประการคือ ภาพหลอน และ การตัดความรู้.

ภาพหลอน: นี่หมายถึงกรณีที่โมเดลส่งคืนการตอบสนองที่ไม่ถูกต้องหรือสร้างขึ้นอย่างมั่นใจ แม้ว่า LLM ขั้นสูงจะมีกลไกในตัวเพื่อจดจำและหลีกเลี่ยงผลลัพธ์ดังกล่าว

ภาพหลอนใน LLM

ตัดความรู้: โมเดล LLM ทุกรุ่นมีวันที่สิ้นสุดการฝึกอบรม โพสต์โดยไม่ทราบถึงเหตุการณ์หรือการพัฒนา ข้อจำกัดนี้หมายความว่าความรู้ของแบบจำลองถูกระงับ ณ วันที่ฝึกอบรมครั้งล่าสุด เช่น โมเดลที่ฝึกจนถึงปี 2022 จะไม่ทราบเหตุการณ์ในปี 2023

การตัดความรู้ใน LLM

รุ่นดึงข้อมูลเสริม (RAG) เสนอวิธีแก้ปัญหาสำหรับความท้าทายเหล่านี้ ช่วยให้โมเดลเข้าถึงข้อมูลภายนอก บรรเทาปัญหาภาพหลอนโดยให้การเข้าถึงข้อมูลที่เป็นกรรมสิทธิ์หรือเฉพาะโดเมน สำหรับการตัดความรู้ RAG สามารถเข้าถึงข้อมูลปัจจุบันหลังจากวันที่ฝึกอบรมของโมเดล เพื่อให้มั่นใจว่าผลลัพธ์จะเป็นข้อมูลล่าสุด

นอกจากนี้ยังช่วยให้ LLM สามารถดึงข้อมูลจากแหล่งภายนอกต่างๆ ในแบบเรียลไทม์ นี่อาจเป็นฐานความรู้ ฐานข้อมูล หรือแม้แต่อินเทอร์เน็ตอันกว้างใหญ่

รู้เบื้องต้นเกี่ยวกับการสร้างแบบดึงข้อมูล-เสริม

การเรียกข้อมูลเสริมรุ่น (RAG) เป็นเฟรมเวิร์กแทนที่จะเป็นเทคโนโลยีเฉพาะ ซึ่งช่วยให้โมเดลภาษาขนาดใหญ่สามารถเข้าถึงข้อมูลที่พวกเขาไม่ได้รับการฝึกอบรมได้ มีหลายวิธีในการนำ RAG ไปใช้ และวิธีที่เหมาะสมที่สุดนั้นขึ้นอยู่กับงานเฉพาะของคุณและลักษณะของข้อมูลของคุณ

กรอบงาน RAG ทำงานในลักษณะที่มีโครงสร้าง:

อินพุตพร้อมท์

กระบวนการเริ่มต้นด้วยการป้อนข้อมูลหรือพร้อมท์ของผู้ใช้ นี่อาจเป็นคำถามหรือข้อความที่ต้องการข้อมูลเฉพาะ

การดึงข้อมูลจากแหล่งภายนอก

แทนที่จะสร้างการตอบสนองโดยตรงตามการฝึกอบรม โมเดลจะค้นหาผ่านแหล่งข้อมูลภายนอกโดยใช้ความช่วยเหลือของส่วนประกอบตัวดึงข้อมูล แหล่งข้อมูลเหล่านี้มีตั้งแต่ฐานความรู้ ฐานข้อมูล และที่เก็บเอกสารไปจนถึงข้อมูลที่เข้าถึงอินเทอร์เน็ตได้

ทำความเข้าใจเกี่ยวกับการเรียกคืน

โดยพื้นฐานแล้ว การดึงข้อมูลจะสะท้อนการดำเนินการค้นหา เป็นเรื่องเกี่ยวกับการแยกข้อมูลที่เกี่ยวข้องมากที่สุดเพื่อตอบสนองต่ออินพุตของผู้ใช้ กระบวนการนี้สามารถแบ่งออกเป็นสองขั้นตอน:

การจัดทำดัชนี: อาจเป็นไปได้ว่าส่วนที่ท้าทายที่สุดของการเดินทางของ RAG ทั้งหมดคือการจัดทำดัชนีฐานความรู้ของคุณ กระบวนการจัดทำดัชนีสามารถแบ่งกว้างๆ ได้เป็นสองขั้นตอน: การโหลด และการแยก ในเครื่องมืออย่าง LangChain กระบวนการเหล่านี้เรียกว่า “รถตัก"และ"แยก“. ตัวโหลดดึงเนื้อหาจากแหล่งต่าง ๆ ไม่ว่าจะเป็นหน้าเว็บหรือ PDF เมื่อดึงข้อมูลแล้ว ตัวแยกจะแบ่งเนื้อหานี้ออกเป็นชิ้นขนาดพอดีคำ เพื่อเพิ่มประสิทธิภาพสำหรับการฝังและการค้นหา
การสอบถาม: นี่คือการแยกส่วนความรู้ที่เกี่ยวข้องมากที่สุดตามข้อความค้นหา

แม้ว่าจะมีหลายวิธีในการเรียกข้อมูล ตั้งแต่การจับคู่ข้อความธรรมดาไปจนถึงการใช้เครื่องมือค้นหาเช่น Google แต่ระบบดึงข้อมูล-Augmented Generation (RAG) สมัยใหม่อาศัยการค้นหาเชิงความหมาย หัวใจสำคัญของการค้นหาเชิงความหมายอยู่ที่แนวคิดของการฝัง

การฝังเป็นศูนย์กลางในการทำความเข้าใจภาษาของ Large Language Models (LLM) เมื่อมนุษย์พยายามอธิบายว่าพวกเขาได้รับความหมายจากคำพูดอย่างไร คำอธิบายมักจะวนกลับไปที่ความเข้าใจโดยธรรมชาติ ลึกลงไปในโครงสร้างการรับรู้ของเรา เรารับรู้ว่า “เด็ก” และ “เด็ก” มีความหมายเหมือนกัน หรือทั้ง “สีแดง” และ “สีเขียว” ต่างก็แสดงถึงสีต่างๆ

การเพิ่มพรอมต์

ข้อมูลที่ดึงมาจะถูกรวมเข้ากับพรอมต์ดั้งเดิม โดยสร้างพรอมต์เพิ่มเติมหรือขยาย พร้อมท์เสริมนี้จะทำให้โมเดลมีบริบทเพิ่มเติม ซึ่งจะมีประโยชน์อย่างยิ่งหากข้อมูลเป็นข้อมูลเฉพาะโดเมนหรือไม่ได้เป็นส่วนหนึ่งของคลังข้อมูลการฝึกดั้งเดิมของโมเดล

การสร้างความสมบูรณ์

ด้วยพรอมต์เสริมที่อยู่ในมือ โมเดลจะสร้างการเสร็จสิ้นหรือการตอบกลับ การตอบสนองนี้ไม่ได้ขึ้นอยู่กับการฝึกของโมเดลเท่านั้น แต่ยังได้รับแจ้งจากข้อมูลแบบเรียลไทม์ที่ดึงมาอีกด้วย

การดึงข้อมูล-Augmented Generation

สถาปัตยกรรมของ RAG LLM ตัวแรก

บทความวิจัยโดย Meta ตีพิมพ์ในปี 2020 “การดึงข้อมูล- Augmented Generation สำหรับงาน NLP ที่เน้นความรู้” ให้ข้อมูลเชิงลึกเกี่ยวกับเทคนิคนี้ โมเดลการดึงข้อมูล-เพิ่มการสร้างจะเพิ่มกระบวนการสร้างแบบดั้งเดิมด้วยกลไกการดึงข้อมูลหรือการค้นหาจากภายนอก ซึ่งช่วยให้โมเดลดึงข้อมูลที่เกี่ยวข้องจากคลังข้อมูลจำนวนมหาศาล ช่วยเพิ่มความสามารถในการสร้างการตอบสนองที่แม่นยำตามบริบท

นี่คือวิธีการทำงาน:

หน่วยความจำพาราเมตริก: นี่คือโมเดลภาษาดั้งเดิมของคุณ เช่นเดียวกับโมเดล seq2seq ได้รับการฝึกฝนเกี่ยวกับข้อมูลจำนวนมหาศาลและรู้ข้อมูลมากมาย
หน่วยความจำแบบไม่มีพารามิเตอร์: คิดว่านี่เป็นเครื่องมือค้นหา มันเป็นดัชนีเวกเตอร์หนาแน่น เช่น วิกิพีเดีย ซึ่งสามารถเข้าถึงได้โดยใช้นิวรอลรีทรีฟเวอร์

เมื่อรวมทั้งสองสิ่งนี้เข้าด้วยกันจะทำให้เกิดแบบจำลองที่แม่นยำ ขั้นแรกโมเดล RAG จะดึงข้อมูลที่เกี่ยวข้องจากหน่วยความจำที่ไม่ใช่พารามิเตอร์ จากนั้นจึงใช้ความรู้เชิงพาราเมตริกเพื่อให้การตอบสนองที่สอดคล้องกัน

โมเดล RAG ดั้งเดิมโดย Meta

1. กระบวนการสองขั้นตอน:

RAG LLM ดำเนินการในกระบวนการสองขั้นตอน:

การแก้ไข: ขั้นแรกโมเดลจะค้นหาเอกสารหรือข้อความที่เกี่ยวข้องจากชุดข้อมูลขนาดใหญ่ ซึ่งทำได้โดยใช้กลไกการดึงข้อมูลแบบหนาแน่น ซึ่งใช้การฝังเพื่อแสดงทั้งแบบสอบถามและเอกสาร จากนั้นการฝังจะถูกนำมาใช้ในการคำนวณคะแนนความคล้ายคลึงกัน และเอกสารที่มีอันดับสูงสุดจะถูกดึงออกมา
รุ่น: ด้วยเอกสารที่เกี่ยวข้อง top-k ในมือ เอกสารเหล่านั้นจะถูกส่งเข้าสู่เครื่องสร้างลำดับต่อลำดับควบคู่ไปกับการสืบค้นเริ่มต้น ตัวสร้างนี้จะประดิษฐ์เอาต์พุตสุดท้าย โดยวาดบริบทจากทั้งแบบสอบถามและเอกสารที่ดึงมา

2. การดึงข้อมูลหนาแน่น:

ระบบการดึงข้อมูลแบบดั้งเดิมมักจะอาศัยการแสดงข้อมูลแบบกระจัดกระจาย เช่น TF-IDF อย่างไรก็ตาม RAG LLM ใช้การแสดงข้อมูลแบบหนาแน่น โดยที่ทั้งการสืบค้นและเอกสารถูกฝังอยู่ในปริภูมิเวกเตอร์ต่อเนื่อง ซึ่งช่วยให้สามารถเปรียบเทียบความคล้ายคลึงกันได้ละเอียดยิ่งขึ้น โดยบันทึกความสัมพันธ์ทางความหมายที่นอกเหนือไปจากการจับคู่คำหลักเท่านั้น

3. การสร้างลำดับต่อลำดับ:

เอกสารที่ดึงมาทำหน้าที่เป็นบริบทเพิ่มเติมสำหรับโมเดลการสร้าง โมเดลนี้ซึ่งมักจะใช้สถาปัตยกรรมอย่าง Transformers จะสร้างผลลัพธ์สุดท้าย เพื่อให้แน่ใจว่าโมเดลจะสอดคล้องกันและมีความเกี่ยวข้องตามบริบท

ค้นหาเอกสาร

การจัดทำดัชนีและการเรียกค้นเอกสาร

เพื่อการดึงข้อมูลที่มีประสิทธิภาพ โดยเฉพาะจากเอกสารขนาดใหญ่ ข้อมูลมักจะถูกจัดเก็บไว้ในฐานข้อมูลเวกเตอร์ ข้อมูลหรือเอกสารแต่ละชิ้นได้รับการจัดทำดัชนีตามเวกเตอร์ที่ฝัง ซึ่งรวบรวมสาระสำคัญด้านความหมายของเนื้อหา การจัดทำดัชนีที่มีประสิทธิภาพช่วยให้สามารถดึงข้อมูลที่เกี่ยวข้องได้อย่างรวดเร็วโดยอิงตามพร้อมท์อินพุต

ฐานข้อมูลเวกเตอร์

ที่มา: Redis

ฐานข้อมูลเวกเตอร์ บางครั้งเรียกว่าพื้นที่เก็บข้อมูลเวกเตอร์ เป็นฐานข้อมูลที่ปรับแต่งให้เชี่ยวชาญในการจัดเก็บและดึงข้อมูลเวกเตอร์ ในขอบเขตของ AI และวิทยาศาสตร์คอมพิวเตอร์ เวกเตอร์คือรายการตัวเลขที่เป็นสัญลักษณ์ของจุดในพื้นที่หลายมิติ ต่างจากฐานข้อมูลแบบดั้งเดิมที่ปรับให้เข้ากับข้อมูลแบบตารางมากกว่า ฐานข้อมูลเวกเตอร์มีความโดดเด่นในการจัดการข้อมูลที่เหมาะสมกับรูปแบบเวกเตอร์อย่างเป็นธรรมชาติ เช่น การฝังจากโมเดล AI

ฐานข้อมูลเวกเตอร์ที่โดดเด่นบางแห่ง ได้แก่ Annoy, ล้มเหลว โดย เมต้า, มิลวอสและ ไพน์โคน. ฐานข้อมูลเหล่านี้มีส่วนสำคัญในแอปพลิเคชัน AI ซึ่งช่วยเหลือในงานต่างๆ ตั้งแต่ระบบแนะนำไปจนถึงการค้นหารูปภาพ แพลตฟอร์ม เช่น AWS ยังเสนอบริการที่ปรับให้เหมาะกับความต้องการฐานข้อมูลเวกเตอร์ เช่น Amazon OpenSearch Service และ Amazon RDS สำหรับ PostgreSQL บริการเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับกรณีการใช้งานเฉพาะ ทำให้มั่นใจในการจัดทำดัชนีและการสืบค้นที่มีประสิทธิภาพ

การแบ่งส่วนเพื่อความเกี่ยวข้อง

เนื่องจากเอกสารจำนวนมากสามารถมีเนื้อหากว้างขวางได้ จึงมักใช้เทคนิคที่เรียกว่า "การแบ่งส่วน" สิ่งนี้เกี่ยวข้องกับการแบ่งเอกสารขนาดใหญ่ออกเป็นส่วนย่อยๆ ที่เชื่อมโยงกันทางความหมาย จากนั้น ชิ้นส่วนเหล่านี้จะถูกจัดทำดัชนีและดึงข้อมูลตามความจำเป็น เพื่อให้มั่นใจว่าส่วนที่เกี่ยวข้องที่สุดของเอกสารจะถูกนำมาใช้เพื่อเพิ่มข้อมูลในทันที

ข้อควรพิจารณาเกี่ยวกับหน้าต่างบริบท

LLM ทุกแห่งดำเนินการภายในหน้าต่างบริบท ซึ่งเป็นจำนวนข้อมูลสูงสุดที่สามารถพิจารณาได้ในคราวเดียว หากแหล่งข้อมูลภายนอกให้ข้อมูลที่เกินหน้าต่างนี้ จะต้องแบ่งออกเป็นส่วนเล็กๆ ที่พอดีกับหน้าต่างบริบทของโมเดล

ประโยชน์ของการใช้รุ่นดึงข้อมูล-เสริม

ความแม่นยำที่เพิ่มขึ้น: ด้วยการใช้ประโยชน์จากแหล่งข้อมูลภายนอก RAG LLM สามารถสร้างการตอบสนองที่ไม่เพียงแต่ขึ้นอยู่กับข้อมูลการฝึกอบรมเท่านั้น แต่ยังได้รับแจ้งจากข้อมูลที่เกี่ยวข้องและทันสมัยที่สุดที่มีอยู่ในคลังข้อมูลการดึงข้อมูลอีกด้วย
การเอาชนะช่องว่างความรู้: RAG จัดการกับข้อจำกัดความรู้โดยธรรมชาติของ LLM ได้อย่างมีประสิทธิภาพ ไม่ว่าจะเป็นเพราะการตัดการฝึกอบรมของโมเดลหรือการไม่มีข้อมูลเฉพาะโดเมนในคลังข้อมูลการฝึกอบรม
ความเก่งกาจ: RAG สามารถรวมเข้ากับแหล่งข้อมูลภายนอกต่างๆ ได้ ตั้งแต่ฐานข้อมูลที่เป็นกรรมสิทธิ์ภายในองค์กรไปจนถึงข้อมูลอินเทอร์เน็ตที่สาธารณะเข้าถึงได้ ทำให้สามารถปรับให้เข้ากับการใช้งานและอุตสาหกรรมที่หลากหลายได้
ลดอาการประสาทหลอน: หนึ่งในความท้าทายของ LLM คือโอกาสที่จะเกิด “ภาพหลอน” หรือการสร้างข้อมูลที่ไม่ถูกต้องตามข้อเท็จจริงหรือที่แต่งขึ้น ด้วยการจัดเตรียมบริบทข้อมูลแบบเรียลไทม์ RAG สามารถลดโอกาสของเอาต์พุตดังกล่าวได้อย่างมาก
scalability: ประโยชน์หลักประการหนึ่งของ RAG LLM คือความสามารถในการขยายขนาด ด้วยการแยกกระบวนการดึงข้อมูลและการสร้าง แบบจำลองนี้สามารถจัดการชุดข้อมูลจำนวนมหาศาลได้อย่างมีประสิทธิภาพ ทำให้เหมาะสำหรับการใช้งานในโลกแห่งความเป็นจริงที่มีข้อมูลมากมาย

ความท้าทายและการพิจารณา

ค่าใช้จ่ายในการคำนวณ: กระบวนการสองขั้นตอนอาจใช้การประมวลผลอย่างเข้มข้น โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับชุดข้อมูลขนาดใหญ่
การพึ่งพาข้อมูล: คุณภาพของเอกสารที่ดึงมาส่งผลโดยตรงต่อคุณภาพการสร้าง ดังนั้นการมีคลังข้อมูลการสืบค้นที่ครอบคลุมและได้รับการดูแลอย่างดีจึงเป็นสิ่งสำคัญ

สรุป

ด้วยการบูรณาการกระบวนการดึงข้อมูลและการสร้าง ทำให้การดึงข้อมูล-เพิ่มรุ่นนำเสนอโซลูชันที่มีประสิทธิภาพสำหรับงานที่ต้องใช้ความรู้มาก เพื่อให้มั่นใจว่าผลลัพธ์ที่ได้มีทั้งข้อมูลและบริบทที่เกี่ยวข้อง

คำมั่นสัญญาที่แท้จริงของ RAG อยู่ที่การใช้งานที่เป็นไปได้ในโลกแห่งความเป็นจริง สำหรับภาคส่วนต่างๆ เช่น การดูแลสุขภาพ ซึ่งข้อมูลที่ถูกต้องและทันท่วงทีสามารถเป็นหัวใจสำคัญได้ RAG นำเสนอความสามารถในการดึงและสร้างข้อมูลเชิงลึกจากวรรณกรรมทางการแพทย์มากมายได้อย่างราบรื่น ในขอบเขตของการเงิน ซึ่งตลาดมีการพัฒนาไปทีละนาที RAG สามารถให้ข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลแบบเรียลไทม์ ซึ่งช่วยในการตัดสินใจอย่างมีข้อมูล นอกจากนี้ ในด้านวิชาการและการวิจัย นักวิชาการสามารถควบคุม RAG เพื่อสแกนที่เก็บข้อมูลจำนวนมหาศาล ทำให้การทบทวนวรรณกรรมและการวิเคราะห์ข้อมูลมีประสิทธิภาพมากขึ้น

หัวข้อที่เกี่ยวข้อง:แชทจีพีที กำเนิดไอ LLM OpenAI พรอมท์ เอ็นจิเนียริ่ง เรียกค้นรุ่นที่เพิ่มขึ้น

ต่อไป

Mistral AI: การตั้งค่ามาตรฐานใหม่ที่เหนือกว่า Llama2 ในพื้นที่โอเพ่นซอร์ส

อย่าพลาด

เทคโนโลยี Acoustic Swarm ที่เป็นนวัตกรรมใหม่กำหนดอนาคตของระบบเสียงภายในห้อง

อายูช มิททาล

ฉันใช้เวลาห้าปีที่ผ่านมาหมกมุ่นอยู่กับโลกแห่งการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกที่น่าสนใจ ความหลงใหลและความเชี่ยวชาญของฉันทำให้ฉันมีส่วนร่วมในโครงการวิศวกรรมซอฟต์แวร์ที่หลากหลายกว่า 50 โครงการ โดยเน้นเฉพาะที่ AI/ML ความอยากรู้อยากเห็นอย่างต่อเนื่องของฉันยังดึงฉันไปสู่การประมวลผลภาษาธรรมชาติ ซึ่งเป็นสาขาที่ฉันกระตือรือร้นที่จะสำรวจเพิ่มเติม

ยูไนเต็ด.เอไอ

เจาะลึกสู่รุ่นดึงข้อมูล-เสริมใน LLM

ปัญญาประดิษฐ์

เจาะลึกสู่รุ่นดึงข้อมูล-เสริมใน LLM

สารบัญ

ChatGPT ของ OpenAI ได้รับการอัปเกรดการท่องเว็บ

วิศวกรรมพร้อมท์มีประสิทธิภาพแต่ยังไม่เพียงพอ

ความท้าทายในโมเดล AI เชิงสร้างสรรค์