قادة الفكر
خطوات تكتيكية لتحقيق نجاح في اختبار概念 الجيل الثاني للذكاء الاصطناعي
مشاريع اختبار Concept (PoC) هي ساحة اختبار للتكنولوجيا الجديدة، والذكاء الاصطناعي من الجيل الثاني (GenAI) ليست استثناء. ماذا يعني النجاح حقًا لمشروع PoC للجيل الثاني للذكاء الاصطناعي؟ ببساطة، مشروع PoC ناجح هو الذي ينتقل بسهولة إلى الإنتاج. المشكلة هي أن معظم مشاريع PoC للجيل الثاني للذكاء الاصطناعي تركز بشكل أساسي على الجوانب الفنية والمتغيرات مثل الدقة والاستدلال. هذا التركيز الضيق هو أحد الأسباب الرئيسية لفشل مشاريع PoC. وجدت دراسة conducted بواسطة McKinsey أن ربع المستجيبين كانوا قلقين بشأن الدقة، لكن العديد منهم kämpften مع مشاكل مثل الأمان والتوضيح وإدارة الملكية الفكرية (IP) والامتثال التنظيمي. أضف إلى ذلك مشاكل شائعة مثل سوء جودة البيانات وقيود التوسع وأمراض التكامل، ومن السهل أن نرى لماذا يفشل العديد من مشاريع PoC للجيل الثاني للذكاء الاصطناعي في التقدم.
ما وراء الهوس: الحقيقة عن مشاريع PoC للجيل الثاني للذكاء الاصطناعي
تبني الجيل الثاني للذكاء الاصطناعي يزداد واضحًا، لكن معدل النجاح الفعلي لمشاريع PoC لا يزال غير واضح. تقارير تقدم إحصائيات متباينة:
- Gartner يتوقع أن يتم التخلي عن 30٪ على الأقل من مشاريع الجيل الثاني للذكاء الاصطناعي بعد مرحلة PoC بحلول نهاية عام 2025، مما يعني أن 70٪ قد تنتقل إلى الإنتاج.
- دراسة conducted بواسطة Avanade (مذكورة في RTInsights) وجدت أن 41٪ من مشاريع الجيل الثاني للذكاء الاصطناعي لا تزال عالقة في مرحلة PoC.
- تقرير حالة الجيل الثاني للذكاء الاصطناعي في الشركات الصادر عن Deloitte في يناير 2025 يقدر أن فقط 10-30٪ من مشاريع PoC ستنمو إلى الإنتاج.
- بحث conducted بواسطة IDC (مذكورة في CIO.com) وجد أن فقط 5 من 37 مشروع PoC (13٪) يصل إلى الإنتاج.
مع تقديرات تتراوح بين 10٪ و 70٪، من المحتمل أن يكون معدل النجاح الفعلي أقرب إلى النهاية الأقل. هذا يسلط الضوء على أن العديد من المنظمات تعاني من صعوبة في تصميم مشاريع PoC مع مسار واضح للتوسع. يمكن أن يؤدي معدل النجاح المنخفض إلى استنزاف الموارد، وتهدئة الحماس، ووقف الابتكار، مما يؤدي إلى ما يسمى “إرهاق PoC”، حيث يشعر الفريق بالارتباك في تشغيل الطائرات بدون أن تصل إلى الإنتاج.
الانتقال بعيدًا عن الجهود المبذولة
الجيل الثاني للذكاء الاصطناعي لا يزال في المراحل الأولى من دورة تبنيه، مثل الحوسبة السحابية والذكاء الاصطناعي التقليدية من قبله. استغرق الحوسب السحابي 15-18 عامًا للوصول إلى التبني الواسع، في حين احتاج الذكاء الاصطناعي التقليدية 8-10 سنوات ولا يزال يتطور. تاريخيًا، اتبعت تبني الذكاء الاصطناعي دورة انفجار-انكماش حيث يؤدي الحماس الأولي إلى توقعات مفرطة، يليها تباطؤ عند ظهور التحديات، قبل الاستقرار في الاستخدام الرئيسي. إذا كانت التاريخ دليلًا، فإن تبني الجيل الثاني للذكاء الاصطناعي سيكون له صعودًا وهبوطًا.
为了导航此周期有效地,组织必须确保每个 PoC 都设计为可扩展,避免常见的陷阱导致浪费努力。认识到这些挑战,领先的技术和咨询公司已经开发了结构化框架,以帮助组织超越实验并成功扩展其 GenAI 计划。
本文的目标是补充这些框架和战略努力,概述实用的、战术步骤,可以显著增加 GenAI PoC 从测试到现实世界影响的可能性。
关键战术步骤用于成功的 GenAI PoC
1. 选择具有生产潜力的用例
首先,选择具有清晰生产路径的用例。这并不意味着进行全面、企业范围的 GenAI 就绪评估。相反,根据因素(如数据质量、可扩展性和集成要求)评估每个用例,并优先考虑那些具有最高生产可能性。
选择合适的用例时,还需要考虑几个关键问题:
- 我的 PoC 是否与长期业务目标一致?
- 是否可以访问和使用所需的数据?
- 是否存在明确的风险将阻止扩展?
2. 在启动前定义和对齐成功指标
PoC 停滞的主要原因之一是缺乏明确定义的成功指标。没有对目标和 ROI 期望的强烈对齐,即使在技术上合理的 PoC 也可能难以获得生产的认可。估计 ROI 并不容易,但以下是一些推荐:
- 设计或采用一个框架,例如 这个。
- 使用成本计算器,例如 这个 OpenAI API 定价工具 和云提供商计算器来估计费用。
- 不要设定单一的目标,而是制定一个基于概率的 ROI 估计范围,以考虑不确定性。
以下是 Uber 的 QueryGPT 团队如何估计其文本到 SQL 的 GenAI 工具的潜在影响的示例。
3. 启用快速实验
构建 GenAI 应用程序就是不断迭代的实验。当选择技术栈、架构、团队和流程时,请确保它们支持这种迭代方法。选择应该支持无缝实验,从生成假设和运行测试到收集数据、分析结果、学习和改进。
- 考虑雇用小型和中型服务供应商来加速实验。
- 选择 基准、评估和评估框架,从一开始就确保它们与您的用例和目标保持一致。
- 使用诸如 LLM-as-a-judge 或 LLM-as-Juries 的技术来自动(半自动)评估。
4. 追求低摩擦解决方案
低摩擦解决方案需要较少的批准,因此面临较少或没有采用和扩展的异议。GenAI 的快速增长导致了工具、框架和平台的爆发,这些工具旨在加速 PoC 和生产部署。然而,许多这些解决方案作为黑盒运行,需要来自 IT、法律、安全和风险管理团队的严格审查。为了解决这些挑战并简化流程,请考虑以下关于构建低摩擦解决方案的建议:
- 创建专用路线图以获取批准:考虑创建专用路线图以解决合作伙伴团队的担忧并获取批准。
- 使用预批准的技术栈:在可能的情况下,使用已经批准并使用的技术栈,以避免批准和集成的延迟。
- 专注于基本工具:早期 PoC 通常不需要模型微调、自动反馈循环或广泛的可观察性/SRE。相反,优先考虑用于核心任务的工具,例如向量化、嵌入、知识检索、防护栏和 UI 开发。
- 谨慎使用低代码/无代码工具:虽然这些工具可以加速时间表,但其黑盒性质限制了自定义和集成能力。谨慎使用并考虑其长期影响。
- 提前解决安全问题:实施诸如合成数据生成、PII 数据屏蔽和加密等技术,以主动解决安全问题。
5. 组装精简、创业团队
与任何项目一样,拥有合适的团队和必备的技能对于成功至关重要。除了技术专业知识外,您的团队还必须灵活和具有创业精神。
- 考虑包括产品经理和主题专家(SME),以确保您正在解决正确的问题。
- 确保您拥有全栈开发人员和机器学习工程师的团队。
- 避免为 PoC 或从更高优先级的长期项目中借用内部资源。相反,考虑雇用小型和中型服务供应商,他们可以快速带来合适的人才。
- 从第一天开始就将法律和安全合作伙伴嵌入其中。
6. 优先考虑非功能性要求
对于成功的 PoC,建立明确的问题边界和固定的一组功能性要求至关重要。然而,非功能性要求不应被忽视。虽然 PoC 应该在问题边界内保持关注,但其架构必须设计为高性能。更具体地说,实现毫秒级延迟可能不是立即必要的,但 PoC 应该能够在 beta 用户扩展时无缝扩展。选择模块化架构,保持灵活和工具的中立性。
7. 制定计划以处理幻觉
幻觉是语言模型的必然结果。因此,防护栏对于扩展 GenAI 解决方案的责任至关重要。然而,评估是否需要自动防护栏以及需要多少。在 PoC 阶段忽略或过度工程防护栏而不是检测 何时您的模型产生幻觉 并将其标记为 PoC 用户。
8. 采用产品和项目管理最佳实践
这 XKCD 插图适用于 PoC,就像它适用于生产一样。没有通用剧本。然而,采用项目和产品管理的最佳实践可以帮助简化和实现进展。
- 使用 Kanban 或敏捷方法进行战术规划和执行。
- 记录一切。
- 举行 Scrum-of-Scrums 与合作伙伴团队有效合作。
- 让利益相关者和领导层了解进展情况。
结论
运行成功的 GenAI PoC 不仅仅是证明技术可行性,而是评估长期的基础选择。通过仔细选择合适的用例、对齐成功指标、启用快速实验、最小化摩擦、组装合适的团队、解决功能性和非功能性要求以及规划挑战(如幻觉),组织可以显著提高从 PoC 到生产的机会。
话虽如此,上述步骤并非详尽无遗,并非所有建议都适用于每个用例。每个 PoC 都是独一无二的,成功的关键是将这些最佳实践适应您的具体业务目标、技术约束和监管环境。
强烈的愿景和战略对于 GenAI 采用至关重要,但如果没有正确的战术步骤,即使最周密的计划也可能在 PoC 阶段停滞。执行是伟大想法要么成功要么失败的地方,清晰的结构化方法可以确保创新转化为现实世界的影响。












