Connect with us

อิงโก มิเออร์สวา ผู้ก่อตั้งและประธานของ RapidMiner, Inc – ซีรีส์สัมภาษณ์

ปัญญาประดิษฐ์

อิงโก มิเออร์สวา ผู้ก่อตั้งและประธานของ RapidMiner, Inc – ซีรีส์สัมภาษณ์

mm

อิงโก มิเออร์สวา เป็นผู้ก่อตั้งและประธานของ RapidMiner, Inc RapidMiner นำเทคโนโลยีปัญญาประดิษฐ์มาสู่องค์กรผ่านแพลตฟอร์มวิทยาศาสตร์ข้อมูลที่เปิดกว้างและขยายได้ สำหรับทีมวิเคราะห์ RapidMiner รวมชีวิตวิทยาศาสตร์ข้อมูลทั้งหมดตั้งแต่การเตรียมข้อมูลไปจนถึงการเรียนรู้ของเครื่องและไปจนถึง การวางแบบจำลองการคาดการณ์ มืออาชีพด้านวิเคราะห์มากกว่า 625,000 คนใช้ผลิตภัณฑ์ของ RapidMiner เพื่อขับเคลื่อนรายได้ ลดค่าใช้จ่าย และหลีกเลี่ยงความเสี่ยง

อะไรคือแรงบันดาลใจของคุณในการเปิดตัว RapidMiner?

ฉันเคยทำงานในธุรกิจที่ปรึกษาวิทยาศาสตร์ข้อมูลมาหลายปี และฉันเห็นความจำเป็นในการมีแพลตฟอร์มที่直截และเข้าถึงได้ง่ายสำหรับผู้ที่ไม่มีการศึกษาทางการในด้านวิทยาศาสตร์ข้อมูล มีหลายวิธีแก้ปัญหาในขณะนั้นที่พึ่งพาการเขียนโค้ดและการเขียนสคริปต์ และพวกมันไม่ใช่ผู้ใช้งานที่เป็นมิตรเลย นอกจากนี้ยังทำให้ข้อมูลยากต่อการบริหารจัดการและบำรุงรักษาโซลูชันที่พัฒนาในแพลตฟอร์มเหล่านั้น โดยพื้นฐานแล้ว ฉันรู้ว่าโครงการเหล่านี้ไม่จำเป็นต้องยากขนาดนี้ ดังนั้นเราจึงเริ่มสร้างแพลตฟอร์ม RapidMiner เพื่อให้ทุกคนสามารถเป็นนักวิทยาศาสตร์ข้อมูลที่ยอดเยี่ยมได้

คุณสามารถพูดถึงการกำกับดูแลความโปร่งใสที่ใช้โดย RapidMiner ในปัจจุบันได้หรือไม่?

เมื่อคุณไม่สามารถอธิบายแบบจำลองได้ มันจะยากที่จะปรับแต่ง เชื่อถือ และแปล ความพยายามทางวิทยาศาสตร์ข้อมูลส่วนใหญ่เป็นการสื่อสารผลลัพธ์ให้กับผู้อื่นเพื่อให้ผู้มีส่วนได้ส่วนเสียเข้าใจวิธีการปรับปรุงกระบวนการ สิ่งนี้ต้องการความเชื่อถือและความเข้าใจอย่างลึกซึ้ง นอกจากนี้ ปัญหาเกี่ยวกับความเชื่อถือและความเข้าใจสามารถทำให้ยากต่อการเอาชนะข้อกำหนดขององค์กรในการนำแบบจำลองไปใช้ในการผลิต เรากำลังต่อสู้กับการต่อสู้นี้ในหลายๆ ด้าน:

ในฐานะแพลตฟอร์มวิทยาศาสตร์ข้อมูลที่มีความโปร่งใส RapidMiner แสดงออกมาเป็นคำอธิบายสำหรับท่อข้อมูลและแบบจำลองทั้งหมดในรูปแบบที่สามารถบริโภคได้สูงซึ่งสามารถเข้าใจได้โดยนักวิทยาศาสตร์ข้อมูลหรือผู้ที่ไม่ใช่นักวิทยาศาสตร์ข้อมูล มันทำให้แบบจำลองโปร่งใสและส่งเสริมให้ผู้ใช้เข้าใจพฤติกรรมของแบบจำลองและประเมินจุดแข็งและจุดอ่อนและตรวจจับอคติที่อาจเกิดขึ้น

นอกจากนี้ แบบจำลองที่สร้างขึ้นในแพลตฟอร์มมาพร้อมกับการแสดงภาพอย่างกว้างขวางสำหรับผู้ใช้ – โดยทั่วไปคือผู้ใช้ที่สร้างแบบจำลอง – เพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับแบบจำลอง เข้าใจพฤติกรรมของแบบจำลอง และประเมินอคติของแบบจำลอง

RapidMiner ยังให้คำอธิบายแบบจำลอง – แม้แต่เมื่ออยู่ในการผลิต: สำหรับการคาดการณ์แต่ละครั้งที่สร้างโดยแบบจำลอง RapidMiner จะสร้างและเพิ่มปัจจัยที่มีอิทธิพลซึ่งนำไปสู่หรือมีอิทธิพลต่อการตัดสินใจที่ทำโดยแบบจำลองในการผลิต

สุดท้าย – และสิ่งนี้มีความสำคัญมากสำหรับฉันส่วนบุคคล เนื่องจากฉันผลักดันสิ่งนี้กับทีมวิศวกรของเราเมื่อหลายปีที่แล้ว – RapidMiner ยังให้ความสามารถในการจำลองแบบจำลองที่มีพลังมาก ซึ่งช่วยให้ผู้ใช้สามารถจำลองและดูพฤติกรรมของแบบจำลองตามข้อมูลอินพุตที่ให้มาโดยผู้ใช้ ข้อมูลอินพุตสามารถตั้งค่าและเปลี่ยนแปลงได้ง่าย ซึ่งช่วยให้ผู้ใช้เข้าใจพฤติกรรมเชิงทำนายของแบบจำลองในกรณีสมมุติหรือกรณีจริงต่างๆ ได้ จำลองแบบแสดงปัจจัยที่มีอิทธิพลต่อการตัดสินใจของแบบจำลอง ผู้ใช้ – ในกรณีนี้ แม้แต่ผู้ใช้ทางธุรกิจหรือผู้เชี่ยวชาญด้านโดเมน – สามารถเข้าใจพฤติกรรมของแบบจำลอง ตรวจสอบการตัดสินใจของแบบจำลองกับผลลัพธ์จริงหรือความรู้ด้านโดเมน และระบุปัญหา จำลองแบบช่วยให้คุณสามารถจำลองโลกแห่งความเป็นจริงและดูสู่อนาคต – สู่อนาคตของคุณเอง

RapidMiner ใช้การเรียนรู้ลึกอย่างไร?

การใช้การเรียนรู้ลึกของ RapidMiner เป็นสิ่งที่เราภูมิใจมาก การเรียนรู้ลึกสามารถใช้งานได้ยาก และผู้ที่ไม่ใช่นักวิทยาศาสตร์ข้อมูลมักต้องดิ้นรนในการตั้งค่าเครือข่ายเหล่านั้นโดยไม่มีการสนับสนุนจากผู้เชี่ยวชาญ RapidMiner ทำให้กระบวนการนี้ง่ายที่สุดสำหรับผู้ใช้ทุกประเภท การเรียนรู้ลึกเป็นส่วนหนึ่งของผลิตภัณฑ์ Auto Machine Learning (ML) ของเราที่เรียกว่า RapidMiner Go ในที่นี้ ผู้ใช้ไม่จำเป็นต้องรู้อะไรเกี่ยวกับการเรียนรู้ลึกเพื่อใช้แบบจำลองที่ซับซ้อนเหล่านี้ นอกจากนี้ ผู้ใช้ที่มีพลังสามารถไปลึกและใช้ไลบรารีการเรียนรู้ลึกที่ได้รับความนิยม เช่น Tensorflow, Keras หรือ DeepLearning4J โดยตรงจากเวิร์กโฟลว์ที่มองเห็นได้ที่พวกเขากำลังสร้างด้วย RapidMiner สิ่งนี้คล้ายกับการเล่นกับบล็อกและทำให้ประสบการณ์สำหรับผู้ใช้ที่มีทักษะวิทยาศาสตร์ข้อมูลน้อยลง ผ่านแนวทางนี้ ผู้ใช้ของเราสามารถสร้างโครงข่ายที่ยืดหยุ่นได้ด้วยฟังก์ชันการกระตุ้นที่แตกต่างกันและจำนวนโหนดและชั้นที่กำหนดโดยผู้ใช้ ชั้นต่างๆ ที่มีจำนวนโหนดที่แตกต่างกัน และเลือกจากเทคนิคการฝึกอบรมที่แตกต่างกัน

มีการใช้การเรียนรู้ของเครื่องประเภทอื่น ๆ อีกหรือไม่?

ทั้งหมด! เรามีแอลกอริทึมการเรียนรู้ที่แตกต่างกันหลายร้อยแบบที่เป็นส่วนหนึ่งของแพลตฟอร์ม RapidMiner – ทุกสิ่งที่คุณสามารถใช้ได้ในภาษาโปรแกรมมิ่งวิทยาศาสตร์ข้อมูลที่ใช้กันอย่างแพร่หลาย เช่น Python และ R RapidMiner มี phương phápสำหรับ Naive Bayes, การถดถอย เช่น Generalized Linear Models, การจัดกลุ่ม เช่น k-Means, FP-Growth, Decision Trees, Random Forests, Parallelized Deep Learning และ Gradient Boosted Trees สิ่งเหล่านี้และอื่นๆ อีกมากมายเป็นส่วนหนึ่งของห้องสมุดแบบจำลองของ RapidMiner และสามารถใช้ได้ด้วยการคลิกเพียงครั้งเดียว

คุณสามารถพูดถึงวิธีการที่ Auto Model รู้ค่าเหมาะสมที่จะใช้ได้หรือไม่?

RapidMiner AutoModel ใช้การอัตโนมัติที่ชาญฉลาดเพื่อเร่งทุกสิ่งที่ผู้ใช้ทำ และรับประกันว่าแบบจำลองที่ถูกต้องและสมเหตุสมผลถูกสร้างขึ้น ซึ่งรวมถึงการคัดเลือกอินสแตนซ์และการเอาออกอัตโนมัติของเอาต์เลียร์ การสร้างคุณลักษณะสำหรับข้อมูลที่ซับซ้อน เช่น วันที่หรือข้อความ และการสร้างคุณลักษณะอัตโนมัติแบบหลายวัตถุประสงค์เต็มรูปแบบเพื่อคัดเลือกคุณลักษณะที่เหมาะสมและสร้างคุณลักษณะใหม่ๆ Auto Model ยังรวมถึงวิธีการทำความสะอาดข้อมูลอื่นๆ เพื่อแก้ไขปัญหาทั่วไปในข้อมูล เช่น ค่าขาดหายไป ค่าข้อมูลที่ไม่สมบูรณ์ และการเปลี่ยนแปลงต่างๆ

Auto Model ยังดึงข้อมูลเมตาดาต้าของคุณภาพ – ตัวอย่างเช่น วิธีการที่คอลัมน์ประพฤติตนเหมือนกับ ID หรือว่ามีค่าขาดหายไปมาก – ข้อมูลเมตาดาตานี้ถูกใช้ร่วมกับข้อมูลเมตาดาตาพื้นฐานในการทำให้การอัตโนมัติและช่วยเหลือผู้ใช้ในการ ‘ใช้ค่าเหมาะสม’ และจัดการกับปัญหาคุณภาพข้อมูล

สำหรับรายละเอียดเพิ่มเติม เราได้ทำแผนภาพทั้งหมดในแผนภาพ Auto Model ของเรา (รูปด้านล่างเพื่อความเข้าใจเพิ่มเติม)

มีเฟสการอัตโนมัติขั้นพื้นฐานสี่เฟสที่การอัตโนมัติถูกนำไปใช้:

– การเตรียมข้อมูล: การวิเคราะห์ข้อมูลอัตโนมัติเพื่อระบุปัญหาเชิงคุณภาพทั่วไป เช่น สหสัมพันธ์ ค่าขาดหายไป และเสถียรภาพ
– การเลือกและปรับแบบจำลองอัตโนมัติ รวมถึงการตรวจสอบและเปรียบเทียบประสิทธิภาพแบบเต็ม ซึ่งแนะนำเทคนิคการเรียนรู้ของเครื่องที่ดีที่สุดสำหรับข้อมูลที่กำหนดและกำหนดพารามิเตอร์ที่เหมาะสม
– การจำลองแบบจำลองเพื่อช่วยกำหนดการดำเนินการเฉพาะ (แบบสั่งการ) ที่จะดำเนินการเพื่อให้ได้ผลลัพธ์ที่ต้องการที่คาดการณ์ไว้โดยแบบจำลอง
– ในระยะการนำแบบจำลองไปใช้และการดำเนินงาน ผู้ใช้จะเห็นปัจจัย เช่น การเปลี่ยนแปลง อคติ และผลกระทบทางธุรกิจ อัตโนมัติ โดยไม่ต้องทำงานเพิ่มเติม

การเอนเอียงของเครื่องคอมพิวเตอร์เป็นปัญหาในการใช้ AI ทุกประเภท มีการควบคุมใดๆ ที่ใช้เพื่อป้องกันการเอนเอียงที่จะเกิดขึ้นในผลลัพธ์หรือไม่?

ใช่ สิ่งนี้มีความสำคัญอย่างยิ่งสำหรับการทำวิทยาศาสตร์ข้อมูลอย่างมีจริยธรรม คุณลักษณะการกำกับดูแลที่กล่าวถึงก่อนหน้านี้รับประกันว่าผู้ใช้สามารถเห็นได้เสมอว่าข้อมูลใดที่ใช้ในการสร้างแบบจำลอง วิธีการที่มันถูกแปลง และว่ามีอคติในการเลือกข้อมูลหรือไม่ นอกจากนี้ คุณลักษณะของเราในการตรวจจับการเปลี่ยนแปลงยังเป็นเครื่องมือที่ทรงพลังในการตรวจจับอคติ หากแบบจำลองในการผลิตแสดงการเปลี่ยนแปลงมากในข้อมูลอินพุต สิ่งนี้อาจเป็นสัญญาณที่โลกเปลี่ยนแปลงไปอย่างมาก อย่างไรก็ตาม สิ่งนี้อาจเป็นตัวบ่งชี้ว่ามีอคติอย่างรุนแรงในการฝึกอบรมข้อมูล ในอนาคต เรากำลังคิดที่จะไปอีกขั้นและสร้างแบบจำลองการเรียนรู้ของเครื่องซึ่งสามารถใช้ในการตรวจจับอคติในแบบจำลองอื่นๆ

คุณสามารถพูดถึง RapidMiner AI Cloud และวิธีที่มันแตกต่างจากผลิตภัณฑ์ที่แข่งขันกันหรือไม่?

ความต้องการสำหรับโครงการวิทยาศาสตร์ข้อมูลสามารถมีขนาดใหญ่ซับซ้อนและต้องใช้การประมวลผลมาก ซึ่งเป็นสิ่งที่ทำให้การใช้เทคโนโลยีคลาวด์เป็นกลยุทธ์ที่น่าสนใจสำหรับนักวิทยาศาสตร์ข้อมูล อย่างไรก็ตาม แพลตฟอร์มวิทยาศาสตร์ข้อมูลที่ใช้คลาวด์แบบเนทีฟมักจะผูกมัดคุณกับบริการคลาวด์และการนำเสนอการเก็บข้อมูลของซัพพลายเออร์คลาวด์เฉพาะ

RapidMiner AI Cloud เป็นเพียงการนำเสนอ้บริการคลาวด์ของแพลตฟอร์ม RapidMiner การให้บริการนี้สามารถปรับให้เหมาะสมกับสภาพแวดล้อมของลูกค้าใดๆ โดยไม่คำนึงถึงกลยุทธ์คลาวด์ของพวกเขา สิ่งนี้มีความสำคัญในขณะนี้ เนื่องจากแนวทางของธุรกิจส่วนใหญ่ในการจัดการข้อมูลคลาวด์กำลังพัฒนาอย่างรวดเร็วในบรรยากาศปัจจุบัน ความยืดหยุ่นเป็นสิ่งที่ทำให้ RapidMiner AI Cloud แตกต่างออกไป มันสามารถทำงานในบริการคลาวด์ใดๆ สแต็คคลาวด์ส่วนตัว หรือในเซตอัพไฮบริด เราเป็นคลาวด์ที่พกพาได้ คลาวด์ที่เป็นกลาง คลาวด์หลายตัว – ไม่ว่าคุณจะเรียกว่าอะไร

RapidMiner AI Cloud ยังมีความง่ายต่อการดูแลรักษา เนื่องจากเรามอบความสามารถในการจัดการการนำไปใช้ทั้งหมดหรือบางส่วนสำหรับลูกค้าเพื่อให้พวกเขาสามารถมุ่งเน้นไปที่การดำเนินธุรกิจด้วย AI ไม่ใช่ในทางกลับกัน มีแม้กระทั่งตัวเลือกแบบตามความต้องการ ซึ่งช่วยให้คุณสามารถเริ่มต้นสภาพแวดล้อมได้ตามที่คุณต้องการสำหรับโครงการสั้นๆ

RapidMiner Radoop ลดความซับซ้อนบางส่วนของวิทยาศาสตร์ข้อมูล คุณสามารถบอกเราได้ว่า Radoop มีประโยชน์ต่อนักพัฒนาอย่างไร?

Radoop เป็นหลักสำหรับผู้ที่ไม่ใช่นักพัฒนาที่ต้องการใช้ศักยภาพของข้อมูลขนาดใหญ่ RapidMiner Radoop ใช้งานเวิร์กโฟลว์ของ RapidMiner โดยตรงภายใน Hadoop โดยไม่ต้องเขียนโค้ด เรายังสามารถฝังเครื่องมือการดำเนินการของ RapidMiner ใน Spark เพื่อให้ง่ายต่อการดันเวิร์กโฟลว์ที่สมบูรณ์ไปสู่ Spark โดยไม่มีความซับซ้อนที่มาจากการเข้าใกล้ด้วยโค้ด

หน่วยงานรัฐบาลจะสามารถใช้ RapidMiner เพื่อวิเคราะห์ข้อมูลเพื่อคาดการณ์โรคระบาดที่อาจเกิดขึ้นได้หรือไม่ เช่นเดียวกับวิธีการทำงานของ BlueDot?

ในฐานะแพลตฟอร์มวิทยาศาสตร์ข้อมูลและเครื่องมือการเรียนรู้ของเครื่องโดยทั่วไป RapidMiner มีจุดมุ่งหมายเพื่อทำให้กระบวนการสร้างและจัดการแบบจำลองง่ายขึ้น ไม่ว่าเรื่องนี้จะเกี่ยวข้องกับหัวข้อหรือโดเมนใดก็ตาม แม้ว่าเราจะไม่มุ่งเน้นไปที่การคาดการณ์โรคระบาด แต่ผู้เชี่ยวชาญด้านเนื้อหาสามารถใช้แพลตฟอร์มเพื่อสร้างแบบจำลองที่สามารถคาดการณ์โรคระบาดได้อย่างแม่นยำ ในความเป็นจริง นักวิจัยหลายคนใช้ RapidMiner – และแพลตฟอร์มของเรามีให้ใช้ฟรีสำหรับวัตถุประสงค์ทางวิชาการ

มีสิ่งอื่นใดที่คุณต้องการแบ่งปันเกี่ยวกับ RapidMiner หรือไม่?

ลองใช้ดูสิ! คุณอาจจะประหลาดใจว่าวิทยาศาสตร์ข้อมูลสามารถเป็นเรื่องง่ายเพียงใด และแพลตฟอร์มที่ดีสามารถปรับปรุงประสิทธิภาพการทำงานของคุณและทีมของคุณได้มากเพียงใด

ขอขอบคุณสำหรับการสัมภาษณ์ที่ยอดเยี่ยมนี้ ผู้อ่านซึ่งต้องการเรียนรู้เพิ่มเติมควรเยี่ยมชม RapidMiner

อ็องตวนเป็นผู้นำที่มีวิสัยทัศน์และเป็นพันธมิตรผู้ก่อตั้งของ Unite.AI โดยมีความหลงใหลที่ไม่สั่นคลอนในการ塑造และส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการที่มีประสบการณ์หลายครั้ง และเชื่อว่า AI จะมีผลกระทบต่อสังคมมากเท่ากับไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่เปลี่ยนแปลงและ AGI

As a futurist เขาได้ให้ความสนใจในการสำรวจว่านวัตกรรมเหล่านี้จะเปลี่ยนแปลงโลกของเราอย่างไร นอกจากนี้เขายังเป็นผู้ก่อตั้ง Securities.io ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นในการลงทุนในเทคโนโลยีที่ทันสมัยซึ่งกำลังกำหนดอนาคตและเปลี่ยนแปลงภาคส่วนต่างๆ