Aayush Mittal

Building LLM Agents for RAG from Scratch and Beyond: A Comprehensive Guide

الذكاء الاصطناعي العام July 2, 2024

بناء وكلاء LLM ل RAG من الصفر والمتقدم: دليل شامل

تعاني أنظمة LLM مثل GPT-3 و GPT-4 ومكافئها مفتوح المصدر أحيانًا في استرجاع المعلومات الحديثة وقد تولد أحيانًا هلوسات أو معلومات غير صحيحة.يُستخدم التنميط المعزز بالاسترجاع...

MLOps Tools Guide: Weights & Biases, Comet and More

الذكاء الاصطناعي June 24, 2024

دليل أدوات MLOps الأعلى: Weights & Biases و Comet والمزيد

تعتبر عمليات التعلم الآلي (MLOps) مجموعة من الممارسات والمبادئ التي تهدف إلى توحيد عمليات تطوير ونشر وصيانة نماذج التعلم الآلي في بيئات الإنتاج. إنها تجمع بين...

Nvidia GPU in Ubuntu Basics of GPU Parallel Computing GPU Based LLM Training Machine

أدوات الذكاء الاصطناعي 101 June 21, 2024

إعداد تدريب وضبط دقيق وتحليل لنموذج LLM باستخدام وحدات معالجة الرسومات من NVIDIA وCUDA

لقد شهد مجال الذكاء الاصطناعي تقدمًا ملحوظًا في السنوات الأخيرة، وفي قلب هذا التقدم يوجد組 من وحدات معالجة الرسومات (GPUs) ومنصة الحوسبة الموازية.النماذج مثل GPT, BERT,...

Kubernetes and gpu Large Language Models: A Complete Guide

الذكاء الاصطناعي June 20, 2024

نشر نماذج اللغة الكبيرة على كوبيرنيتس: دليل شامل LoadBalancer [/code] تُ暴ِع هذه الخدمة نشر gpt3 على منفذ 80 وتُنشئ خدمة LoadBalancer لجعل خادم الاستدلال متاحًا من خارج كلستر كوبيرنيتس. نشر إلى كوبيرنيتس: طبق مаниفستات كوبيرنيتس باستخدام أمر kubectl: مراقبة النشر: راقب تقدم النشر باستخدام الأوامر التالية: بمجرد أن يكون البود يعمل ويسجل أن النموذج محمل وجاهز، يمكنك الحصول على عنوان IP الخارجي لخدمة LoadBalancer: اختبار النشر: يمكنك الآن إرسال طلبات إلى خادم الاستدلال باستخدام عنوان IP الخارجي والمنفذ المُحصل عليه من الخطوة السابقة. على سبيل المثال، باستخدام curl: يتطلب هذا الأمر من خادم استدلال GPT-3 استمرار العبارة “The quick brown fox” لما يصل إلى 50 رمز إضافي. مواضيع متقدمة يجب أن تكون على دراية بها في حين أن المثال السابق يُظهر نشرًا أساسيًا لنماذج اللغة الكبيرة على كوبيرنيتس، هناك مواضيع متقدمة ومراعات يجب استكشافها: 1. التوسيع التلقائي يدعم كوبيرنيتس التوسيع التلقائي الأفقي والرأسي، مما يمكن أن يكون مفيدًا لنشر نماذج اللغة الكبيرة بسبب متطلباتها الحاسوبية المتغيرة. يسمح التوسيع التلقائي الأفقي بزيادة أو تقليل عدد النسخ (البودات) تلقائيًا بناءً على معايير مثل استخدام وحدة المعالجة المركزية أو الذاكرة. لتمكين التوسيع التلقائي، يمكنك استخدام موسع بود كوبيرنيتس التلقائي (HPA) وموسع بود كوبيرنيتس الرأسي (VPA). تراقب هذه المكونات نشرك وتوسع الموارد تلقائيًا بناءً على القواعد والحدود المحددة مسبقًا. 2. جدولة الرسومات ومشاركتها في السيناريوهات التي يتم فيها تشغيل نشرات متعددة لنماذج اللغة الكبيرة أو حمولات عمل حاسوبية كثيفة أخرى على نفس كلستر كوبيرنيتس، تصبح جدولة الرسومات ومشاركتها فعالة جدًا. يوفر كوبيرنيتس آليات متعددة لضمان استخدام الرسومات العادل والفعال، مثل ملحقات أجهزة الرسومات، واختياري العقد، وحدود الموارد. يمكنك أيضًا الاستفادة من تقنيات جدولة الرسومات المتقدمة مثل NVIDIA Multi-Instance GPU (MIG) أو AMD Memory Pool Remapping (MPR) لتحويل الرسومات ومشاركتها بين حمولات العمل. 3. موازاة النموذج وتنسيقه بعض نماذج اللغة الكبيرة، ولا سيما تلك التي تحتوي على مليارات أو تريليونات المعلمات، قد لا تتناسب تمامًا في ذاكرة رسومات واحدة أو حتى عقدة واحدة. في مثل هذه الحالات، يمكنك استخدام تقنيات موازاة النموذج وتنسيقه لتوزيع النموذج عبر رسومات متعددة أو عقد. تتضمن موازاة النموذج تقسيم هيكل النموذج إلى مكونات مختلفة (مثل المُкод، والفكودر). بينما يتضمن تنسيق النموذج تقسيم معلمات النموذج وتوزيعه عبر أجهزة أو عقد متعددة. يوفر كوبيرنيتس آليات مثل مجموعات الحالة وموارد التعريف المخصصة (CRDs) لإدارة وتوجيه نشرات نماذج اللغة الكبيرة الموزعة مع موازاة النموذج وتنسيقه. 4. التعدين الدقيق والتعلم المستمر في nhiều الحالات، قد تحتاج نماذج اللغة الكبيرة المُدربة مسبقًا إلى تعدين دقيق أو تدريب مستمر على بيانات محددة لتحسين أدائها لمهام أو مجالات معينة. يمكن أن يسهل كوبيرنيتس هذه العملية من خلال توفير منصة قابلة للتوسيع ومتينة لتشغيل حمولات التعدين أو التعلم. يمكنك الاستفادة من إطارات معالجة الدفعة في كوبيرنيتس مثل أباتشي سبارك أو كوبفلوا لتشغيل مهام تعدين أو تدريب موزعة على نماذج اللغة الكبيرة. بالإضافة إلى ذلك، يمكنك دمج نماذجك المعدلة أو المُدرَّبة بشكل مستمر مع نشرات الاستدلال باستخدام آليات كوبيرنيتس مثل التحديثات المتداولة أو نشرات الأزرق والأخضر. 5. المراقبة والرصد تعتبر المراقبة والرصد من الجوانب الحاسمة لأي نشر إنتاجي، بما في ذلك نشر نماذج اللغة الكبيرة على كوبيرنيتس. يوفر كوبيرنيتس حلول مراقبة مدمجة مثل بروميثيوس وتكاملات مع منصات رصد شعبية مثل غرافانا، إلاستيكسيرتش، وجايجر. يمكنك مراقبة معايير متعددة تتعلق بنشر نماذج اللغة الكبيرة، مثل استخدام وحدة المعالجة المركزية والذاكرة، واستخدام الرسومات، وتأخر الاستدلال، والنتاج. بالإضافة إلى ذلك، يمكنك جمع وتحليل سجلات التطبيق وتتبعها للحصول على رؤى حول سلوك وأداء نماذج اللغة الكبيرة. 6. الأمان والامتثال اعتمادًا على حالة استخدامك و敏感ية البيانات المُستخدمة، قد تحتاج إلى مراعاة جوانب الأمان والامتثال عند نشر نماذج اللغة الكبيرة على كوبيرنيتس. يوفر كوبيرنيتس ميزات وتكاملات لتعزيز الأمان، مثل سياسات الشبكة، ومراقبة الوصول القائم على الأدوار (RBAC)، وإدارة الأسرار، والتكامل مع حلول أمان خارجية مثل هاشي كورب فاولت أو مدير الأسرار من أمازون. إضافة إلى ذلك، إذا كنت تنشر نماذج اللغة الكبيرة في صناعات خاضعة للرقابة أو تتعامل مع بيانات حساسة، قد تحتاج إلى ضمان الامتثال للمعايير واللوائح ذات الصلة، مثل GDPR، وHIPAA، أو PCI-DSS. 7. النشر المتعدد السحابي والهجين في حين أن هذا المنشور يركز على نشر نماذج اللغة الكبيرة على كلستر كوبيرنيتس واحد، قد تحتاج إلى مراعاة نشرات متعددة السحابي أو الهجين في بعض السيناريوهات. يوفر كوبيرنيتس منصة متسقة لنشر وإدارة التطبيقات عبر مختلف مزودي السحابة وعلى الموقع. يمكنك الاستفادة من أدوات اتحاد كوبيرنيتس أو إدارة الكلستر المتعددة مثل كوبيفيد أو جيك هاب لإدارة وتوجيه نشرات نماذج اللغة الكبيرة عبر عدة كلسترات كوبيرنيتس تمتد عبر مختلف مزودي السحابة أو بيئات الهجين. تُبرز هذه المواضيع المتقدمة مرونة وقابلية توسيع كوبيرنيتس لنشر وإدارة نماذج اللغة الكبيرة. الختام ينشر نماذج اللغة الكبيرة (LLMs) على كوبيرنيتس العديد من الفوائد، بما في ذلك التوسيع، وإدارة الموارد، والتوافر العالي، والتنقل. من خلال اتباع الخطوات المحددة في هذا المنشور الفني، يمكنك تحويل تطبيق نماذج اللغة الكبيرة إلى حاويات، وتعريف الموارد اللازمة لكوبيرنيتس، ونشرها إلى كلستر كوبيرنيتس. 然而، ينشر نماذج اللغة الكبيرة على كوبيرنيتس هو فقط الخطوة الأولى.随ما يتطور تطبيقك ويتغير متطلباتك، قد تحتاج إلى استكشاف مواضيع متقدمة مثل التوسيع التلقائي، وتنظيم الرسومات، وموازاة النموذج، والتعدين الدقيق، والرصد، والأمان، والنشر المتعدد السحابي. يوفر كوبيرنيتس منصة قوية ومتوسعة لنشر وإدارة نماذج اللغة الكبيرة، مما يُمكِّنك من بناء تطبيقات موثوقة، قابلة للتوسيع، وأمنة.

تعتبر نماذج اللغة الكبيرة (LLMs) قادرة على فهم وتوليد نصوص تشبه تلك المكتوبة باللغة البشرية، مما يجعلها لا تقدر بثمن لمجموعة واسعة من التطبيقات، مثل محادثات...

مسارات الذكاء الاصطناعي 101 June 19, 2024

إتقان MLOps: الدليل الشامل لتصبح مهندس MLOps في 2024

في عالم الذكاء الاصطناعي (AI) والتعلم الآلي (ML)، ظهرت مهنة جديدة تجمع بين الفجوة بين الخوارزميات المتقدمة والتنفيذ في العالم الحقيقي. تعرف على مهندس MLOps: الذي...

Understanding Sparse Autoencoders, GPT-4 & Claude 3 : An In-Depth Technical Exploration

الذكاء الاصطناعي June 17, 2024

فهم المُشفرات الذكية النادرة، GPT-4 & Claude 3: استكشاف تقني عميق

مقدمة في المُشفرات الذكيةالمُشفرات الذكية هي فئة من الشبكات العصبية التي تهدف إلى تعلم تمثيلات فعالة للبيانات الإدخالية من خلال التشفير وإعادة البناء. تتكون من جزأين...

DSPy is a framework for algorithmically optimizing LM prompts and weights

هندسة المحفزات June 13, 2024

تحسين LLM مع DSPy: دليل خطوة بخطوة لإنشاء وتحسين وتقييم أنظمة الذكاء الاصطناعي

مع استمرار توسع قدرات النماذج اللغوية الكبيرة (LLM)، أصبح تطوير أنظمة ذكاء اصطناعي قوية تعتمد على إمكانياتها أكثر تعقيدًا. غالبًا ما تتضمن النهج التقليدية تقنيات تحفيز...

الذكاء الاصطناعي June 12, 2024

قوة الرسم البياني RAG: مستقبل البحث الذكي

随着世界变得越来越数据驱动，准确和高效的搜索技术需求从未如此之高。传统搜索引擎虽然强大，但往往难以满足用户的复杂和细致需求，特别是在处理长尾查询或专业领域时。这就是图RAG（检索增强生成）作为一个改变游戏规则的解决方案出现的地方，利用知识图和大型语言模型（LLM）来提供智能、上下文感知的搜索结果。在这份综合指南中，我们将深入探讨图RAG的世界，探索其起源、基本原理以及它为信息检索领域带来的开创性进展。准备好开始一段将重塑您对搜索理解并解锁智能数据探索新边疆的旅程。重新审视基础：原始RAG方法在深入探讨图RAG的复杂性之前，了解其基础——检索增强生成（RAG）技术至关重要。RAG是一种自然语言查询方法，通过外部知识增强现有的LLM，使其能够为需要特定领域知识的查询提供更相关和准确的答案。RAG过程涉及根据用户查询从外部源（通常是一个向量数据库）检索相关信息。然后将此“基础上下文”输入LLM提示，允许模型生成更忠实于外部知识源、更不容易出现幻觉或捏造的响应。虽然原始RAG方法在各种自然语言处理任务中（如问答、信息提取和摘要）已被证明是非常有效的，但它仍然在处理复杂、多面查询或需要深入上下文理解的专业领域时面临局限性。原始RAG方法的局限性尽管其优势，原始RAG方法存在几个局限性，阻碍了它提供真正智能和全面的搜索结果的能力：缺乏上下文理解:传统RAG依赖于关键词匹配和向量相似性，这在捕捉复杂数据集的细微差别和关系时可能无效，导致搜索结果不完整或肤浅。知识表示有限:RAG通常检索原始文本块或文档，这可能缺乏综合理解和推理所需的结构化和相互链接表示。可扩展性挑战:随着数据集的增长和多样性增加，维护和查询向量数据库所需的计算资源可能变得难以承受。领域特异性:RAG系统通常难以适应高度专业的领域或专有知识源，因为它们缺乏必要的领域特异性上下文和本体论。图RAG的出现知识图是实体和关系的结构化表示，由两个主要组件组成：节点和边。节点代表个别实体，例如人员、地点、对象或概念，而边代表这些节点之间的关系，指示它们如何相互连接。这种结构显著提高了LLM生成信息响应的能力，使其能够访问精确和上下文相关的数据。流行的图数据库产品包括Ontotext、NebulaGraph和Neo4J，它们促进了这些知识图的创建和管理。NebulaGraphNebulaGraph的图RAG技术，将知识图与LLM集成，实现了生成更智能和更精确搜索结果的突破。在信息过载的背景下，传统的搜索增强技术通常难以应对复杂的查询和像ChatGPT这样的技术带来的高需求。图RAG通过利用知识图来提供更全面的上下文理解，帮助用户以较低的成本获得更智能和更精确的搜索结果。图RAG的优势：是什么让它与众不同？图RAG提供了几个关键优势，使其成为组织寻求解锁其数据全部潜力的有吸引力的选择：增强的上下文理解:知识图提供了丰富的结构化信息表示，捕捉了复杂数据集中经常被传统搜索方法忽略的细微差别和关系。通过利用这种上下文信息，图RAG使LLM能够对领域有更深入的理解，从而带来更准确和富有洞察力的搜索结果。改进的推理和推断:知识图的相互连接性使LLM能够推理复杂关系并得出传统文本数据无法做出的推断。这种能力在科学研究、法律分析和情报收集等领域特别有价值，因为在这些领域，连接不同信息碎片至关重要。可扩展性和效率:通过以图结构组织信息，图RAG可以高效地检索和处理大量数据，减少与传统向量数据库查询相关的计算开销。这种可扩展性优势变得越来越重要，因为数据集继续增长和变得更加复杂。领域适应性:知识图可以根据特定领域进行定制，纳入领域特定的本体论和分类法。这种灵活性使图RAG能够在医疗保健、金融或工程等领域表现出色，因为在这些领域，领域特定的知识对于准确的搜索和理解至关重要。成本效益:通过利用知识图的结构化和相互连接的性质，图RAG可以在需要更少计算资源和训练数据的情况下实现与传统RAG方法相当或更好的性能。这种成本效益使图RAG成为组织寻求最大化其数据价值同时最小化支出的有吸引力的解决方案。演示图RAG图RAG的有效性可以通过与其他技术（如Vector RAG和Text2Cypher）进行比较来说明。图RAG与Vector RAG:当搜索“银河护卫队3”的信息时，传统的向量检索引擎可能只提供有关角色和情节的基本细节。图RAG然而，提供了更多关于角色技能、目标和身份变化的深入信息。图RAG与Text2Cypher:Text2Cypher将任务或问题转换为面向答案的图查询，类似于Text2SQL。虽然Text2Cypher根据知识图模式生成图模式查询，但图RAG检索相关子图以提供上下文。两者都有优势，但图RAG往往呈现更全面的结果，提供关联搜索和上下文推断。使用NebulaGraph构建知识图应用NebulaGraph简化了企业特定知识图应用的创建。开发人员可以专注于LLM编排逻辑和管道设计，而无需处理复杂的抽象和实现。NebulaGraph与LLM框架（如Llama Index和LangChain）的集成允许开发高质量、低成本的企业级LLM应用。“图RAG”与“知识图RAG”在深入探讨图RAG的应用和实现之前，澄清围绕这一新兴技术的术语至关重要。虽然“图RAG”和“知识图RAG”这两个术语经常被交替使用，但它们指的是略微不同的概念：图RAG:该术语指的是使用知识图来增强LLM的检索和生成能力的一般方法。它涵盖了利用知识图结构化表示的一系列技术和实现。知识图RAG:该术语更具体，指的是一种特定的图RAG实现，该实现使用专用的知识图作为检索和生成的主要信息源。在这种方法中，知识图作为领域知识的综合表示，捕获实体、关系和其他相关信息。虽然图RAG和知识图RAG的基本原理相似，但后者意味着一种更紧密集成和领域特定的实现。在实践中，许多组织可能会选择采用混合方法，将知识图与其他数据源（如文本文档或结构化数据库）结合起来，为LLM增强提供更全面的和多样化的信息集。实现图RAG：策略和最佳实践虽然图RAG的概念很强大，但其成功实现需要仔细规划和遵循最佳实践。以下是组织采用图RAG的一些关键策略和考虑因素：知识图构建:实现图RAG的第一步是创建一个强大和全面的知识图。这个过程涉及识别相关数据源、提取实体和关系，并将它们组织成结构化和相互链接的表示。根据领域和用例，这可能需要利用现有的本体论、分类法或开发自定义模式。数据集成和增强:知识图应该不断更新和增强新的数据源，以确保它们保持当前和全面的状态。这可能涉及集成来自数据库的结构化数据、来自文档的非结构化文本或来自Web页面或社交媒体源的外部数据。自动化技术，如自然语言处理（NLP）和机器学习，可以用来从这些源中提取实体、关系和元数据。可扩展性和性能优化:随着知识图的增长和复杂性增加，确保可扩展性和最佳性能变得至关重要。这可能涉及技术，如图分区、分布式处理和缓存机制，以实现知识图的高效检索和查询。 LLM集成和提示工程:无缝集成知识图与LLM是图RAG的一个关键组成部分。这涉及开发高效的检索机制，以基于用户查询从知识图中检索相关实体和关系。另外，提示工程技术可以用来有效地将检索到的知识与LLM的生成能力结合，实现更准确和上下文感知的响应。用户体验和界面:为了充分利用图RAG的力量，组织应该专注于开发直观和用户友好的界面，允许用户与知识图和LLM无缝交互。这可能涉及自然语言界面、可视化探索工具或针对特定用例定制的领域特定应用程序。...

الذكاء الاصطناعي June 11, 2024

Qwen2 – أحدث نموذج لغة متعدد اللغات من أليبABA ي挑ّي سوتا مثل Llama 3

بعد أشهر من التوقع، فريق Qwen في أليبABA قد كشف أخيرًا عن Qwen2 – التطور التالي لسلسلة نماذج اللغة القوية. يُعتبر Qwen2跃ًا كبيرًا إلى الأمام، حيث...

Large Language Models with Multi-token Prediction

الذكاء الاصطناعي June 3, 2024

شحن كبير للنماذج اللغوية الكبيرة مع التنبؤ المتعدد الرموز

النماذج اللغوية الكبيرة (LLMs) مثل GPT و LLaMA وغيرها قد أثاروا ضجة في العالم بفضل قدرتهم الرائعة على فهم وإنشاء نصوص تشبه النصوص البشرية. ومع ذلك،...

هندسة المحفزات May 27, 2024

أحدث التقنيات الحديثة في هندسة التحفيز: دليل شامل

هندسة التحفيز، وهي فن وعلومة صياغة التحفيزات التي تثير استجابات مرغوبة من النماذج اللغوية الكبيرة، أصبحت مجالاً حيوياً من البحث والتطوير.من تحسين القدرات العقلية إلى تمكين...

الذكاء الاصطناعي May 22, 2024

نموذج OpenAI GPT-4o المتعدّد الوسائط: تحويل التفاعل بين الإنسان والآلة

أصدرت OpenAI أحدث نموذج لغة متقدم لديها – GPT-4o، المعروف أيضًا باسم نموذج “Omni” . يمثل هذا النظام الاصطناعي الثوري قفزة巨ية إلى الأمام، مع قدرات تُبهم...

الذكاء الاصطناعي May 16, 2024

xLSTM: دليل شامل لذاكرة اللانغمد الطويلة الموسعة

لمزيد من عقدين من الزمن، كانت معمارية ذاكرة اللانغمد الطويلة (LSTM) التي طوّرها Sepp Hochreiter أداة أساسية في العديد من الإنجازات في التعلم العميق والتطبيقات العملية...

graph neural network large language model

الذكاء الاصطناعي May 8, 2024

شحن شبكات العصبية الرسومية بطرق متقدمة مع نماذج اللغة الكبيرة: الدليل النهائي

الرسوم البيانية هي هياكل بيانات تمثل علاقات معقدة عبر مجموعة واسعة من المجالات ، بما في ذلك شبكات التواصل الاجتماعي وقواعد المعرفة والأنظمة البيولوجية وغيرها الكثير....

Memory for Large Language Model Inference

الذكاء الاصطناعي May 2, 2024

تحسين الذاكرة لاستدلال وضبط دقيق للنماذج اللغوية الكبيرة

النماذج اللغوية الكبيرة (LLMs) مثل GPT-4 و Bloom و LLaMA حققت قدرات مذهلة من خلال التوسع إلى مليارات المعلمات. ومع ذلك ، فإن نشر هذه النماذج...

Unite.AI