مقابلات
د. مايك فلاكسمان، نائب الرئيس لمنتجات HEAVY.AI – سلسلة المقابلات

د. مايك فلاكسمان هو حاليًا نائب الرئيس لمنتجات HEAVY.AI، بعد أن شغل منصب مدير المنتج وقاد ممارسة العلوم المكانية في الخدمات المهنية. وقد أمضى letzten 20 عامًا يعمل في التخطيط البيئي المكاني. قبل HEAVY.AI، أسس Geodesign Technologies، Inc وشارك في تأسيس GeoAdaptive LLC، وهي شركتان بدأتا تطبيق تقنيات التحليل المكاني في التخطيط. قبل حياته في الشركات الناشئة، كان أستاذًا للتخطيط في MIT ومديرًا للصناعة في ESRI.
HEAVY.AI هي منصة معززة بالأجهزة لتحليلات البيانات في الوقت الفعلي ذات التأثير الكبير. إنها تستخدم معالجات GPU و CPU لاستعلام قواعد البيانات الضخمة بسرعة، مع دعم SQL وبيانات الجغرافيا المكانية. وتشمل المنصة أدوات تحليلات بصرية للوحات التفاعلية والتصفية المتقاطعة والتصوريات البيانية القابلة للتحجيم، مما يتيح تحليل البيانات الكبيرة بشكل فعال عبر مختلف الصناعات.
يمكنك أن تخبرنا عن خلفيتك المهنية وما أدى بك للانضمام إلى HEAVY.AI؟
قبل انضممي إلى HEAVY.AI، أمضيت سنوات في الأكاديمية، وأدرست في النهاية تحليلات مكانية في MIT. كما قمت بتشغيل شركة استشارات صغيرة، مع مجموعة من العملاء في القطاع العام. لقد شاركت في مشاريع نظم المعلومات الجغرافية عبر 17 دولة. عملتي أخذتني من تقديم المشورة للمنظمات مثل بنك التنمية للإنترأميريكان إلى إدارة تقنيات نظم المعلومات الجغرافية للهندسة والمعمارية والبناء في ESRI، أكبر مطور لنظم المعلومات الجغرافية في العالم.
أتذكر جيدًا أول لقائي مع ما هو الآن HEAVY.AI، وهو عندما كنت كمستشار مسؤولاً عن تخطيط السيناريوهات لبرنامج الحفاظ على الموائل في شاطئ فلوريدا. كان زملائي وأنا نضال لنمذجة موطن السلاحف البحرية باستخدام بيانات لاندسات 30م واشار لي صديق إلى بعض البيانات الجديدة جدًا وذات صلة كبيرة – ليدار 5 سم. كان ذلك بالضبط ما كنا نحتاجه علميًا، ولكن شيئًا ما مثل 3600 مرة أكبر مما كنا قد خططنا لاستخدامه. ومن الطبيعي أن لا أحد سيزيد من ميزانيتي حتى بجزء صغير من ذلك المقدار. لذلك في ذلك اليوم وضعت أدواتي التي كنت أستخدمها وأدرست لعدة عقود وذهبت أبحث عن شيء جديد. قطع HEAVY.AI ذلك البيانات بسهولة وبدون جهد، لذلك كنت مخطوبًا على الفور.
في السنوات القليلة التالية، ما زلت أعتقد أن ما يفعله HEAVY.AI هو فريد من نوعه وأن رهانها المبكر على تحليلات GPU هو بالضبط حيث يحتاج الصناعة إلى الذهاب. HEAVY.AI راسخة في التركيز على ديمقراطية الوصول إلى البيانات الكبيرة. هذا يشمل مكون حجم البيانات وسرعة المعالجة بالطبع، مما يعطي الجميع جهاز كمبيوتر شخصي. ولكن جانبًا مهمًا بشكل متزايد مع ظهور نماذج اللغة الكبيرة هو جعل النمذجة المكانية متاحة للعديد من الأشخاص. في هذه الأيام، بدلاً من قضاء سنوات في تعلم واجهة معقدة ذات آلاف الأدوات، يمكنك ببساطة بدء محادثة مع HEAVY.AI باللغة البشرية التي تختارها. البرنامج لا يولد فقط الأوامر المطلوبة، بل يعرض أيضًا التصوريات ذات الصلة.
خلف الكواليس، تقديم سهولة الاستخدام هو بالطبع صعب جدًا. حاليًا، كنائب لرئيس إدارة المنتج في HEAVY.AI، أنا متورط بشكل كبير في تحديد الميزات والقدرات التي نركز عليها في منتجاتنا. خلفيتي الواسعة في نظم المعلومات الجغرافية تسمح لي بفهم احتياجات عملائنا حقًا وتوجيه خارطة طريق تطويرنا وفقًا لذلك.
كيف أثرت خبرتك السابقة في التخطيط البيئي المكاني والشركات الناشئة على عملك في HEAVY.AI؟
التخطيط البيئي هو مجال خاص بالتحديات، حيث تحتاج إلى مراعاة احتياجات بشرية مختلفة والعالم الطبيعي. الحل العام الذي تعلمته في وقت مبكر هو زوج من طريقة التخطيط التشاركي، مع تقنيات الاستشعار عن بعد ونظم المعلومات الجغرافية. قبل أن نستقر على خطة عمل، كنا نصنع سيناريوهات متعددة ونحاكي الآثار الإيجابية والسلبية في الكمبيوتر باستخدام التصوريات. باستخدام العمليات التشاركية، سمح لنا بدمج أشكال مختلفة من الخبرة وحل مشاكل معقدة جدًا.
على الرغم من أننا لا ننجز عادة تخطيطًا بيئيًا في HEAVY.AI، فإن هذا النمط يعمل جيدًا في الإعدادات التجارية. لذلك نساعد العملاء على بناء توائم رقمية لأجزاء رئيسية من أعمالهم، ونسمح لهم بإنشاء وتقييم سيناريوهات أعمال بسرعة.
أعتقد أن خبرتي التعليمية قد أعطتني تعاطفًا عميقًا مع مستخدمي البرمجيات، خاصة أنظمة البرمجيات المعقدة. حيث يتعثر أحد الطلاب في مكان ما هو عشوائي، ولكن حيث يتعثر العشرات أو المئات من الناس بأخطاء مماثلة، تعرف أنك لديك مشكلة تصميم. ربما جزءي المفضل من تصميم البرمجيات هو أخذ هذه المعارف وتطبيقها في تصميم أجيال جديدة من الأنظمة.
يمكنك أن تشرح كيف يستخدم HeavyIQ معالجة اللغة الطبيعية لتسهيل استكشاف البيانات وتصورها؟
في هذه الأيام يبدو أن الجميع وشقيقهم يروجون لنموذج AI جديد، معظمهم نسخ قابلة للنسيان من بعضها البعض. لقد اخترنا طريقًا مختلفًا جدًا. نحن نعتقد أن الدقة والقابلية للتكرار والخصوصية هي سمات أساسية لأدوات تحليلات الأعمال، بما في ذلك تلك التي يتم إنشاؤها مع نماذج اللغة الكبيرة (LLM). لذلك بنينا هذه في عروضنا على مستوى фундаментال. على سبيل المثال، نحن نحدد مدخلات النموذج بشكل صارم إلى قواعد بيانات الشركات وتقديم الوثائق داخل حاجز أمان الشركة. نحن نحدد أيضًا الإخراج إلى HeavySQL و Charts أحدث. هذا يعني أنه مهما كانت السؤال التي تطرحها، سنحاول الإجابة عنها باستخدام بياناتك، وسنريك كيف حصلنا على ذلك الجواب.
مع ضمانات هذه في مكانها، لا يهم كثيرًا لعملائنا بالضبط كيف نمتلك معالجة الاستفسارات. ولكن خلف الكواليس، الفرق المهم الآخر بالنسبة إلى AI الت消في هو أننا ننفذ نموذجًا متقنًا بشكل مكثف ضد أنواع الأسئلة التي يطرحها مستخدمو الأعمال من بيانات الأعمال، بما في ذلك البيانات المكانية. لذلك على سبيل المثال نموذجنا ممتاز في أداء الانضمام المكاني والزمني، والتي ليست في مقاييس SQL الكلاسيكية ولكن مستخدمينا يستخدمونها يوميًا.
نحن نقوم بتعبئة هذه القدرات الأساسية في واجهة دفتر ملاحظات نسميها HeavyIQ. IQ هو حول جعل استكشاف البيانات وتصورها möglich كما هو ممكن باستخدام معالجة اللغة الطبيعية (NLP). تسأل سؤالاً باللغة الإنجليزية – مثل “ما كانت الأنماط الجوية في كاليفورنيا الأسبوع الماضي؟” – و HeavyIQ يترجم ذلك إلى استفسارات SQL التي يتم معالجتها بسرعة بواسطة قاعدة بياناتنا المعززة بواسطة GPU. يتم تقديم النتائج ليس فقط كبيانات ولكن كتصورات – خرائط، مخططات، ما هو الأكثر صلة. إنه حول تمكين الاستفسار التفاعلي السريع، خاصة عند التعامل مع مجموعات بيانات كبيرة أو سريعة الحركة. ما هو مفتاح هنا هو أنه غالبًا ما لا يكون السؤال الأول الذي تسأله هو الذي يحصل على رؤية جوهرية، ولكن HeavyIQ مصمم لتمكين تلك الاستكشاف الأعمق.
ما هي الفوائد الرئيسية لاستخدام HeavyIQ على أدوات BI التقليدية لشركات الاتصالات والخدمات العامة والوكالات الحكومية؟
HeavyIQ يمتاز في البيئات التي تتعامل مع بيانات كبيرة السرعة – بالضبط نوع البيانات التي تتعامل معها شركات الاتصالات والخدمات العامة والوكالات الحكومية. أدوات BI التقليدية غالبًا ما تتعثر مع حجم وسرعة هذه البيانات. على سبيل المثال، في الاتصالات، قد يكون لديك مليارات من سجلات المكالمات، ولكنها الجزء الصغير من المكالمات المقطوعة التي تحتاج إلى التركيز عليها. يسمح لك HeavyIQ بالعثور على تلك البيانات 10 إلى 100 مرة أسرع بفضل بنية GPU لدينا. هذه السرعة، بالإضافة إلى القدرة على الاستفسار التفاعلي وتصور البيانات، تجعلها لا تقدر بثمن لتحليلات المخاطر في الخدمات العامة أو التخطيط السيناريو في الوقت الفعلي للوكالات الحكومية.
الميزة الأخرى المذكورة أعلاه هي أن استفسارات SQL المكانية والزمنية تحليلية قوية جدًا – ولكن يمكن أن تكون بطيئة أو صعبة الكتابة باليد. عندما تعمل النظام بسرعة الفضول، يمكن للمستخدمين أن يطرحوا أكثر الأسئلة وأكثر الأسئلة الدقيقة. على سبيل المثال، قد يلاحظ مهندس شركة اتصالات انخفاضًا زمنيًا في فشل المعدات من نظام مراقبة، ويتحقق من ذلك باستفسار مكاني يعود بمخطط.
ما هي الإجراءات المتبعة لمنع تسرب البيانات الوصفية عند استخدام HeavyIQ؟
كما هو موضح أعلاه، لقد بنينا HeavyIQ مع الخصوصية والأمان في جوهره. هذا يشمل ليس فقط البيانات ولكن أيضًا أنواعًا متعددة من البيانات الوصفية. نستخدم بيانات وصفية على مستوى العمود والجدول على نطاق واسع في تحديد الجداول والاعمدة التي تحتوي على المعلومات اللازمة للإجابة على استفسار. نستخدم أيضًا وثائق الشركة الداخلية حيث قدمت لتسهيل ما يُعرف بالتوليد المعزز بالإرجاع (RAG). وأخيرًا، النماذج اللغة نفسها تولد بيانات وصفية إضافية. جميع هذه، ولكن خاصة الأخيرة، يمكن أن تكون حساسة للأعمال التجارية.
على عكس النماذج الثالثة حيث يتم إرسال بياناتك عادة إلى خوادم خارجية، يعمل HeavyIQ محليًا على نفس بنية GPU مثل بقية منصتنا. هذا يضمن أن بياناتك وبياناتك الوصفية تبقى تحت سيطرتك، بدون خطر تسرب. بالنسبة للمنظمات التي تتطلب أعلى مستويات الأمان، يمكن حتى توزيع HeavyIQ في بيئة معزولة تمامًا، مما يضمن أن المعلومات الحساسة لا تغادر المعدات المحددة.
كيف تحقق HEAVY.AI أداءً عاليًا ومتسابقًا مع مجموعات بيانات ضخمة باستخدام بنية GPU؟
السر هو أساسًا في تجنب حركة البيانات السائدة في الأنظمة الأخرى. في جوهره، يبدأ هذا مع قاعدة بيانات مصممة خصيصًا للتشغيل على وحدات معالجة الرسومات من NVIDIA. لقد عملنا على هذا لمدة 10 سنوات الآن، ونعتقد حقًا أننا لدينا أفضل حل في فئة تحليلات GPU المعززة.
حتى أفضل الأنظمة المعتمدة على CPU تتعثر قبل وقت طويل من GPU المتوسط. الاستراتيجية عندما يحدث ذلك على CPU تتطلب توزيع البيانات عبر نوى متعددة ثم أنظمة متعددة (ما يسمى “التوسع الأفقي”). يعمل هذا جيدًا في بعض السياقات حيث الأمور أقل حرجة، ولكن بشكل عام يبدأ في الحصول على انسداد في أداء الشبكة.
بالإضافة إلى تجنب حركة البيانات على الاستفسارات، نحن نمنعها أيضًا على العديد من المهام الشائعة الأخرى. الأول هو أننا يمكن أن نرسم الرسومات بدون نقل البيانات. ثم إذا كنت تريد نمذجة ML، نفعل ذلك أيضًا بدون نقل البيانات. وإذا كنت تسأل البيانات باستخدام نموذج اللغة الكبير، نفعل ذلك أيضًا بدون نقل البيانات. حتى إذا كنت عالم بيانات وتريد استفسار البيانات من Python، نقدم أساليب لفعل ذلك على GPU بدون نقل البيانات.
ما يعنيه ذلك في الممارسة هو أننا يمكن أن نؤدي ليس فقط استفسارات ولكن أيضًا الرسومات 10 إلى 100 مرة أسرع من قواعد البيانات التقليدية المعتمدة على CPU وخوادم الخرائط. عندما تتعامل مع مجموعات بيانات ضخمة وسريعة الحركة التي يعمل معها عملاؤنا – مثل نماذج الطقس وسجلات المكالمات الهاتفية أو صور الأقمار الصناعية – فإن هذا النوع من تعزيز الأداء هو أمر ضروري تمامًا.
كيف تحتفظ HEAVY.AI بميزتها التنافسية في مشهد تحليلات البيانات الكبيرة والذكاء الاصطناعي الذي يتطور بسرعة؟
هذا سؤال رائع، وهو شيء نفكر فيه باستمرار. مشهد تحليلات البيانات الكبيرة والذكاء الاصطناعي يتطور بسرعة لا تصدق، مع حدوث اختراقات جديدة وابتكارات دائمًا. من المفيد بالتأكيد أن لدينا بداية مبكرة لتقنية قاعدة البيانات GPU. .
أعتقد أن المفتاح لنا هو البقاء مركزًا على مهمتنا الأساسية – ديمقراطية الوصول إلى البيانات الكبيرة الجغرافية المكانية. هذا يعني دفع حدود ما هو ممكن مع تحليلات GPU المعززة، وضمان أن منتجاتنا توفر أداءً وسمات غير مسبوقة في هذا المجال. جزء كبير من ذلك هو استثمارنا المستمر في تطوير نماذج لغة مخصصة ومتقنة حقًا تفهم دقائق SQL المكانية والتحليل الجغرافي المكاني.
لقد بنينا مكتبة شاملة من بيانات التدريب، تتجاوز البنوك العامة، لضمان أن أدوات تحليلاتنا التفاعلية يمكنها التفاعل مع المستخدمين بطريقة طبيعية و直觉ية. ولكننا نعرف أيضًا أن التكنولوجيا وحدها لا تكفي. يجب أن نبقى على اتصال وثيق مع عملائنا واحتياجاتهم المتطورة. في النهاية، ميزتنا التنافسية تأتي من التركيز المستمر على تقديم قيمة تحويلية لمستخدمينا. لسنا فقط نحافظ على مسار السوق – نحن ندفع حدود ما هو ممكن مع البيانات الكبيرة والذكاء الاصطناعي. وسنواصل القيام بذلك، مهما تطور السوق بسرعة.
كيف تدعم HEAVY.AI جهود الاستجابة للطوارئ من خلال HeavyEco؟
لقد بنينا HeavyEco عندما رأينا بعض أكبر عملائنا يعانون من تحديات كبيرة في مجرد استهلاك مخرجات نماذج الطقس الحالية، بالإضافة إلى تصورها لمقارنات مشتركة. كان يستغرق أحد العملاء ما يصل إلى أربع ساعات لتحميل البيانات، وعندما تكون أمام طقس متطرف سريع الحركة مثل الحرائق… هذا ليس جيدًا على الإطلاق.
HeavyEco مصمم لتقديم رؤى في الوقت الفعلي في مواقف ذات عواقب عالية، مثل أثناء حريق أو فيضان. في مثل هذه الحالات، تحتاج إلى اتخاذ قرارات بسرعة وبالاعتماد على أفضل بيانات ممكنة. لذلك يخدم HeavyEco في المقام الأول كخط أنابيب بيانات محترف لنمذج السلطة مثل تلك من NOAA و USGS. بالإضافة إلى ذلك، يسمح لك HeavyEco بتشغيل السيناريوهات ونمذجة تأثيرات المباني وتصور البيانات في الوقت الفعلي. هذا يعطي المستجيبين الأوائل المعلومات الحرجة التي يحتاجونها عندما يهم الأمر.
في النهاية، هدفنا هو إعطاء مستخدمينا القدرة على استكشاف بياناتهم بسرعة الفكر. سواء كانوا يديرون نماذج مكانية معقدة أو يقارنون توقعات الطقس أو يحاولون تحديد الأنماط في السلاسل الزمنية الجغرافية المكانية، نريد أن يكونوا قادرين على فعل ذلك بسلاسة، بدون أي حواجز تقنية تمنعهم.
ما يميز نموذج LLM الخاص بـ HEAVY.AI عن نماذج LLM الثالثة فيما يتعلق بالدقة والأداء؟
نموذج LLM الخاص بنا مصمم خصيصًا للأنواع من التحليلات التي نركز عليها – مثل النص إلى SQL والنص إلى التصور. لقد حاولنا في البداية نماذج تقليدية ثالثة، ولكن وجدنا أنها لا تلبى متطلبات الدقة العالية لمستخدمينا، الذين غالبًا ما يأخذون قرارات حرجة. لذلك قمنا بتحسين مجموعة من النماذج المفتوحة المصدر واختبارها ضد مقاييس الصناعة.
نموذج LLM الخاص بنا أكثر دقة لconceptات SQL المتقدمة التي يحتاجها مستخدمونا، خاصة في البيانات المكانية والزمنية. بالإضافة إلى ذلك، نظرًا لتشغيله على بنية GPU لدينا، فهو أكثر أمانًا.
بالإضافة إلى قدرات النموذج المدمجة، نقدم أيضًا واجهة مستخدم تفاعلية كاملة للمسؤولين والمستخدمين لإضافة بيانات وصفية متعلقة بالصناعة أو الأعمال. على سبيل المثال، إذا لم يؤد النموذج الأساسي كما هو متوقع، يمكنك استيراد أو تعديل بيانات وصفية على مستوى العمود أو إضافة معلومات توجيهية و الحصول على ملاحظات فورية.
كيف تتخيل HEAVY.AI دور تحليلات البيانات المكانية والزمنية في تشكيل مستقبل مختلف القطاعات؟
نعتقد أن تحليلات البيانات المكانية والزمنية ستكون حاسمة لمستقبل العديد من الصناعات. ما نحن متورطون فيه حقًا هو مساعدة عملائنا على اتخاذ قرارات أفضل، أسرع. سواء كنت في الاتصالات أو الخدمات العامة أو الحكومة أو غيرها – فإن القدرة على تحليل وتصور البيانات في الوقت الفعلي يمكن أن يكون تغييرًا في اللعبة.
مهمتنا هي جعل هذا النوع من التحليلات القوية متاحًا للجميع، وليس فقط لأكبر اللاعبين مع الموارد الضخمة. نريد أن نضمن أن عملائنا يمكنهم الاستفادة من البيانات التي لديهم، للبقاء في الصدارة وحل المشاكل كما تظهر. مع استمرار نمو البيانات وزيادة تعقيداتها، نرى دورنا في ضمان أن أدواتنا تتطور جنبًا إلى جنب معها، بحيث يكون عملاؤنا دائمًا مستعدين لما يأتي بعد ذلك.
شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا HEAVY.AI.












