Connect with us

يوهان وادنهولت فريثيم، الرئيس التنفيذي لشركة Voxo – سلسلة المقابلات

مقابلات

يوهان وادنهولت فريثيم، الرئيس التنفيذي لشركة Voxo – سلسلة المقابلات

mm

يوهان وادنهولت فريثيم يأتي مع أكثر من عقدين من الخبرة على تقاطع التكنولوجيا والأعمال، مع التركيز على الاستفادة من الذكاء الاصطناعي لتحويل كيفية عمل المنظمات والتفاعل مع عملائها. قاد مبادرات رقمية رئيسية وبرامج عملاء في قطاعي البنوك والتمويل في شركة CGI، قبل أن يشارك في تأسيس Voxo لتعزيز الابتكار في تحليل المحادثات وتكنولوجيا الأحداث.

في Voxo AI، يترأس يوهان تسليم استخبارات مدفوعة بالذكاء الاصطناعي في الوقت الفعلي من المناقشات الحية في الأحداث والمؤتمرات، مما يمنح الفرق القدرة على الانتقال من البيانات إلى الإجراءات بسرعة ودقة. ملتزم بالتأثير التجاري والخير الاجتماعي، قاد أيضًا مبادرات المسؤولية الاجتماعية للشركات التي تهدف إلى منع استغلال الأطفال عبر الإنترنت.

Voxo AI هي منصة ذكاء الأحداث التي تستخدم الذكاء الاصطناعي لالتقاط وتحويل المحادثات الشفوية الحية من المؤتمرات واللوحات والجلسات إلى رؤى منظمة ويمكن استخدامها. من خلال تحليل الصوت في الوقت الفعلي، يتم توليد ملخصات فورية ومعلومات رئيسية ومحتوى بعد الحدث مثل التقارير والassets العلامة التجارية، مما يسمح للمنظمين والحضار والرعاة والمتحدثين بالاستفادة القيمة من المناقشات دون الحاجة إلى كتابة الملاحظات أو العمل التالي.

قبل تأسيس Voxo، قمت بقيادة مبادرات رقمية ومعززة بالذكاء الاصطناعي معقدة في قطاعي البنوك والخدمات المالية في شركة CGI. ما هي الإحباطات أو الفجوات المحددة من تلك التجربة التي أقنعتك بأن الوقت قد حان لإنشاء شركتك الخاصة التي تركز على ذكاء المحادثات؟

كان وقت tôi في CGI ممتعًا للغاية. إنها منظمة كبيرة مع مئات من أصول الملكية الفكرية بالإضافة إلى الاستشارات، وحصلت على مقعد في الصف الأمامي لبيئات التسليم المعقدة والحوكمة وعمليات التحول المؤسسي على نطاق واسع. كما كانت منقسمة، موزعة على العديد من التكنولوجيات والأطراف المعنية والأولويات التنافسية.

انتقلت من محلل أعمال إلى مدير في غضون عامين فقط، وفي ذلك الوقت شعرت أنني جاهز للتركيز. عندما التقيت بمؤسسي، أدركت أننا يمكن أن نبني شيئًا أكثر حدة، مسارًا واحدًا يستخدم أفضل التكنولوجيا المتاحة لحل مشكلة محددة وقيمة عالية. ما لا يعرفه الكثير من الناس هو أننا بدأنا كشركة فنتيك رائدة في الوثائق في الإستشارات المالية. من هناك تطورنا إلى تحليل المحادثات، و في النهاية توسعنا إلى ذكاء الأحداث بعد ما يقرب من عقد من الزمن من التعلم كيفية استخراج المعنى الحقيقي من المحادثات البشرية.

في البداية، ما كانت التحديات الفنية أو التجارية الأكثر صعوبة في بناء الذكاء الاصطناعي الذي يمكنه فهم المحادثات الحقيقية بدلاً من المدخلات المكتوبة والمنظمة؟

في منتجاتنا الفنيقة المبكرة، قامت التكنولوجيا بتحديد الطموح. كان معدل الخطأ الكلمة تلقائي التعرف على الكلام للغات النوردية، والتي كانت محورنا الأولي، في النطاق من 70 إلى 80 في المائة. على هذا المستوى، لا يمكنك بناء منتج ي замен الوثائق البشرية.

في الوقت نفسه، لم تكن قدرات نماذج اللغة الكبيرة الحديثة موجودة بعد، لذلك كان إنتاج ملخصات موثوقة يقترب من المستحيل. عندما قمنا لاحقًا بطرح خدمتنا للأحداث، تغيرت المناظر الطبيعية. لقد بنينا معرفة عميقة على مدار السنوات، و终于 حصلنا على الكتلة الصحيحة من بناء الذكاء الاصطناعي لفهم المفاتيح والمناقشات والجداول المستديرة بطريقة يمكن أن تتوسع.

بدأت Voxo مع تحليل المحادثات وتوسعت لاحقًا إلى ذكاء الأحداث على نطاق واسع. ما هي الإشارات التي أظهرت لك أن الأحداث الحية هي الجبهة الرئيسية التالية للذكاء الاصطناعي للكلام؟

بصورة مثيرة للاهتمام، بدأنا العمل مع الأحداث كوسيلة للوصول إلى كبار المسؤولين التنفيذيين بشكل أسرع وإظهار قوة ذكاء المحادثات. ولكن بمجرد أن قمنا بتسليمها في أكبر حدث تكنولوجي في السويد، Techarenan، مع أكثر من 10,000 حاضراً، رأينا تحولًا كبيرًا.

كان الطلب الوارد فوريًا وواضحًا للغاية. الناس لم يكونوا فقط مهتمين، بل أرادوا شراء خدمتنا للأحداث كمنتج. تلك كانت الإشارة. قررنا استثمار الوقت والتركيز والموارد اللازمة لتسليمها على مستوى عالمي، و القيام بذلك على أعلى مستوى جودة ممكن.

من منظور أنظمة، ما الذي يتغير بشكل أساسي عند الانتقال من نسخة واحدة من اجتماع إلى معالجة مئات الجلسات المتزامنة عبر حدث متعدد الأيام؟

تتضاعف التعقيدات بسرعة. أنت لا تحافظ فقط على الاستقرار والجودة عبر كل جلسة فردية، بل تقوم أيضًا بالتعامل مع الفوضى في العالم الحقيقي. التغييرات في الجدول الزمني في اللحظة الأخيرة، وتبادل المتحدثين، وتحديثات البرنامج هي أمور عادية في الأحداث الكبيرة.

为了 تسليمها دون وضع عبء إضافي على فرق الأحداث الممتدة بالفعل، تحتاج إلى عمليات صارمة ومازالت مرنة. تحتاج أيضًا إلى منهجية محكمة للتحليل. لا يمكنك مجرد رمي مئات الساعات من الصوت في نموذج والطلب تقريرًا مثيرًا للاهتمام. لتحقيق مخرجات عالية الجودة في دقائق، عليك أن تجمع بين عدة نماذج وخطوط أنابيب وطبقات من الهيكل.

يؤكد العديد من أدوات الذكاء الاصطناعي على الأتمتة فوق كل شيء. لماذا قررت أن تتضمن مراجعة الإنسان في الحلقة كجزء أساسي من منصة Voxo؟

الثقة لا تزال أكبر حواجز، خاصة بالنسبة للعملاء المؤسسيين مثل HubSpot و GitHub و Intuit. خوف نشر شيء غير دقيق هو حقيقي للغاية. هذا هو السبب في أن Processes الموثوقة، بالإضافة إلى مزيج من مراجعة الذكاء الاصطناعي وضمان الجودة البشرية، لا تزال متطلبًا للعديد من العملاء اليوم.

نحن أيضًا نمنح العملاء السيطرة. يمكنهم مراجعة واعتماد الملخصات قبل توزيع أي شيء، ونجعل ذلك سير العمل فعالًا. مع مرور الوقت، أعتقد أن الحاجة إلى المراجعة البشرية ستنخفض عندما تنضج التكنولوجيا والحماية. حتى ذلك الحين، لا شيء يهم أكثر من كسب الحق في الثقة بالمحتوى الذي يمثل علامتهم التجارية.

كيف غيرت النسخ والتلخيص في الوقت الفعلي الطريقة التي يفكر بها فرق الأحداث حول جداول المحتوى والقيمة بعد الحدث؟

تغير ذلك بشكل أساسي الجدول الزمني. بدلاً من أن يكون المحتوى شيئًا تنشره بعد أسابيع، يصبح شيئًا يمكنك استخدامه أثناء حدوث الحدث وبعد انتهاء كل جلسة.

ما نراه هو أن العملاء يمتلكون الآن مواد يمكنهم استخدامها لاحياء المشاركة لشهرًا. الحضار والمتحدثون أكثر احتمالاً لمشاركة المحتوى فور انتهاء الجلسة، طالما كان من السهل وكان يبدو أنيقًا. إذا وصل نفس المحتوى بعد شهر، فمن المحتمل أن يكون متأخرًا جدًا لتحفيز التوزيع المهم، خاصة على وسائل التواصل الاجتماعي. يتحول الوقت الفعلي المحتوى إلى امتداد للخبرة الحية، وليس مجرد أرشيف بعد الحدث.

تتضمن الأحداث العديد من الأطراف المعنية، المنظمين، المتحدثين، الرعاة، والحضار. كيف تصمم Voxo مخرجات تخدم جميعهم دون التضحية بالرؤية أو الجودة؟

نصمم من الأطراف المعنية إلى الخارج، ولكن نحافظ على نفس مصدر الحقيقة الأساسي. الجميع يستفيدون من نفس المحتوى الملتقط، ثم نعدل المخرجات لتطابق أهداف الأطراف المعنية.

يحصل الحضار على ملخصات جلسات فورية قابلة للمشاركة وفرصة لإعادة زيارة الجلسات التي فاتتهم. يحصل فريق التسويق على assets رعاية العلامة التجارية التي تتماشى مع التوزيع والآثار القابلة للقياس. يحصل المنظمون على قيمة حاضرة أعلى، وزمكان أطول للأحداث، وخيارات جديدة للعائد. يحصل المتحدثون على طريقة واحدة لتحديث ملخصاتهم، ويستفيد المنظمون من ذلك التأثير الشبكي.

المفتاح هو أننا لا نخفف من الجودة. نبني محرك محتوى قوي واحد، ثم نعبئه بشكل مختلف لكل طرف معني بناءً على ما يخلق قيمة حقيقية.

تقرر الأحداث التي تستخدم Voxo تسليم المحتوى أسرع وتفاعل الرعاة أعلى. ما الذي تعتقد أنه أكثر أهمية في تحقيق ذلك التأثير، السرعة، الهيكل، أو جودة الرؤية؟

إنه مزيج من كل هذه. لا تهم السرعة إذا كان المحتوى يفتقر إلى الهيكل والجودة. في الوقت نفسه، حتى أفضل المحتوى يصبح أقل قيمة إذا وصل متأخرًا جدًا.

الفرق الحقيقي هو تسليم كل هذه معًا. رؤى عالية الجودة، معبأة في هيكل واضح، وتسليمها بسرعة كافية لما زالت تشعر بالصلة. هذا هو ما يجعل المحتوى مفيدًا، قابلًا للمشاركة، وتأثيرًا تجاريًا.

ماذا يعني “الوقت الفعلي” حقًا للأطراف التي تعمل بالذكاء الاصطناعي على مدى السنوات القليلة القادمة، وكم نحن قريبون من تلك الحقيقة اليوم؟

في بعض الحالات، الوقت الفعلي الحقيقي موجود بالفعل. لقد قمنا بتسليم التعليقات في الوقت الفعلي عبر عدة تيارات حية، على سبيل المثال مع NHS في مانشستر الصيف الماضي مع First Sight Media و Lineup Ninja. كما قدمنا تجارب في الوقت الفعلي في 2023 في Techarenan مع متحدثين مثل آل غور وستيف ووزنياك.

然而، هناك مكان للزمن الفعلي القريب والزمن الفعلي الحقيقي في الأحداث. الجزء المهم هو أن تكون متعمدًا فيما يخلق القيمة. سحابة كلمات في الوقت الفعلي التي تتجدد خلف متحدث قد تكون أكثر إزعاجًا من النفع.

أخيرًا، ما هو التصور الخاطئ الشائع حول الملخصات أو النصوص التي يتم إنشاؤها بواسطة الذكاء الاصطناعي الذي يجب عليك تصحيحه بانتظام عند التحدث مع العملاء المؤسسين؟

التصور الخاطئ الأكبر هو أنك يمكنك الحصول على ملخصات موثوقة ومتسقة وذات جودة عالية عن طريق نسخ ملف صوتي ووضعها في ChatGPT. يدرك الناس بسرعة أن ذلك يستغرق وقتًا ويتطلب جهدًا لتحافظ على الاتساق، خاصة عند وجود عدد كبير من الجلسات. وحتى ذلك الحين، النسخ والتلخيص هو جزء صغير فقط مما نقدمه. ربما يكون 5٪ فقط. العمل الحقيقي هو السرعة، الهيكل، السياق، التعبئة الجاهزة للعلامة التجارية، وضمان الجودة، وتنسيقات التوزيع التي تجعل المحتوى قابلًا للاستخدام وقيمًا على مستوى المؤسسات.

شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Voxo AI.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.