สัมภาษณ์
วิลสัน ปาง ผู้ร่วมเขียน Real World AI – สัมภาษณ์แบบซีรีส์

วิลสัน ปาง เข้าร่วม Appen ในเดือนพฤศจิกายน 2018 ในตำแหน่ง CTO และรับผิดชอบผลิตภัณฑ์และเทคโนโลยีของบริษัท วิลสันมีประสบการณ์มากกว่า 19 ปี ในด้านวิศวกรรมซอฟต์แวร์และวิทยาศาสตร์ข้อมูล ก่อนที่จะเข้าร่วม Appen วิลสันเป็นหัวหน้าฝ่ายข้อมูลของ Ctrip ในประเทศจีน ซึ่งเป็นบริษัทที่ให้บริการท่องเที่ยวออนไลน์ที่ใหญ่เป็นอันดับสองของโลก โดยที่เขานำทีมวิศวกรข้อมูล นักวิเคราะห์ ผู้จัดการผลิตภัณฑ์ข้อมูล และนักวิทยาศาสตร์ เพื่อปรับปรุงประสบการณ์ของผู้ใช้และเพิ่มประสิทธิภาพการดำเนินงานที่เติบโตของธุรกิจ ก่อนหน้านั้น เขาเป็นรองประธานฝ่ายวิศวกรรมของ eBay ในแคลิฟอร์เนีย และให้ความเป็นผู้นำในหลายโดเมน รวมถึงบริการข้อมูลและโซลูชัน วิทยาศาสตร์การค้นหา เทคโนโลยีการตลาด และระบบการเรียกเก็บเงิน เขาทำงานเป็นนักออกแบบที่ IBM ก่อนที่จะเข้าร่วม eBay โดยสร้างโซลูชันเทคโนโลยีสำหรับลูกค้าหลายราย วิลสันจบการศึกษาระดับมหาบัณฑิตและบัณฑิตศึกษาในสาขาวิศวกรรมไฟฟ้าจากมหาวิทยาลัยเจ้อเจียง ในประเทศจีน
เราพูดถึงหนังสือเล่มใหม่ของเขา: โลกแห่งความเป็นจริงของ AI: คู่มือปฏิบัติสำหรับการเรียนรู้ของเครื่องจักรที่รับผิดชอบ
คุณอธิบายว่าเมื่อคุณนำทีมวิทยาศาสตร์การค้นหาของ eBay หนึ่งในบทเรียนแรกของคุณเกี่ยวกับการเรียนรู้ของเครื่องจักรคือการทำความเข้าใจถึงความสำคัญของการรู้ว่าต้องวัดค่าเมตริกอะไร ซึ่งให้คำอธิบายถึงวิธีการที่เมตริก “การซื้อขายต่อเซสชัน” ไม่ได้คำนึงถึงมูลค่าของสินค้าอย่างไร ดังนั้น บริษัทต่างๆ จะทำความเข้าใจได้อย่างไรว่าต้องวัดค่าเมตริกอะไรเพื่อหลีกเลี่ยงปัญหาเหล่านี้
เริ่มต้นด้วยเป้าหมายที่ทีมของคุณกำหนดให้กับโมเดล AI – ในกรณีของเรา เราต้องการขับเคลื่อนรายได้มากขึ้นด้วยการเรียนรู้ของเครื่องจักร เมื่อคุณติดเมตริกกับเป้าหมาย ให้คิดถึงกลไกที่เมตริกเหล่านั้นจะสร้างขึ้น เมื่อคุณปล่อยโมเดลและผู้ใช้เริ่มโต้ตอบกับมัน แต่ยังให้บันทึกถึงสมมติฐานของคุณด้วย ในกรณีของเรา เราได้สมมติว่าโมเดลจะปรับให้เหมาะสมสำหรับรายได้ แต่จำนวนการซื้อขายต่อเซสชันไม่ได้แปลเป็นเช่นนั้น เนื่องจากโมเดลกำลังปรับให้เหมาะสมสำหรับการขายสินค้ามูลค่าต่ำจำนวนมาก และสุดท้ายแล้วเราไม่ได้ทำเงินมากขึ้น เมื่อเรารู้สิ่งนี้แล้ว เราก็สามารถเปลี่ยนแปลงเมตริกและชี้โมเดลไปในทางที่ถูกต้องได้ ดังนั้น การกำหนดเมตริกที่ละเอียดอ่อน เช่นเดียวกับการบันทึกสมมติฐานจึงมีความสำคัญต่อความสำเร็จของโครงการ
คุณได้เรียนรู้อะไรส่วนตัวจากการวิจัยและเขียนหนังสือเล่มนี้
เรามีปัญหาหลายอย่างที่สามารถแก้ไขได้ด้วย AI จากบริษัทและอุตสาหกรรมต่างๆ ใช้กรณีสามารถแตกต่างกันมาก โซลูชัน AI อาจแตกต่างกัน ข้อมูลที่ใช้ฝึกอบรมโซลูชัน AI อาจแตกต่างกัน อย่างไรก็ตาม ไม่ว่าจะมีความแตกต่างเหล่านี้ ความผิดพลาดที่ผู้คนได้ทำระหว่างการเดินทางของ AI นั้นคล้ายกันมาก ความผิดพลาดเหล่านี้เกิดขึ้นอีกและอีกในบริษัทต่างๆ จากอุตสาหกรรมต่างๆ
เราบางส่วนแบ่งแนวปฏิบัติที่ดีที่สุดเมื่อใช้โครงการ AI โดยหวังว่าจะช่วยให้ผู้คนและบริษัทต่างๆ หลีกเลี่ยงความผิดพลาดเหล่านี้และได้รับความมั่นใจในการใช้งาน AI ที่รับผิดชอบ
คุณหวังว่าผู้อ่านจะนำข้อความสำคัญอะไรไปจากหนังสือเล่มนี้
เรามีความเชื่อมั่นอย่างมากว่าการใช้เทคโนโลยีการเรียนรู้ของเครื่องจักรที่มีจริยธรรมและรับผิดชอบสามารถทำให้โลกเป็นสถานที่ที่ยุติธรรม ยุติธรรม และครอบคลุมมากขึ้น เทคโนโลยีการเรียนรู้ของเครื่องจักรสัญญาว่าจะเปลี่ยนแปลงทุกอย่างทั่วโลกธุรกิจ แต่ไม่จำเป็นต้องยาก มีกระบวนการและวิธีการที่ผ่านการทดสอบแล้วที่ทีมสามารถปฏิบัติตามและได้รับความมั่นใจในการใช้งาน
บทเรียนสำคัญอีกประการหนึ่งคือผู้นำธุรกิจ (เช่น ผู้จัดการผลิตภัณฑ์) และสมาชิกในทีมฝ่ายเทคนิค (เช่น วิศวกรและนักวิทยาศาสตร์ข้อมูล) ต้องใช้ภาษาร่วมกัน เพื่อใช้งาน AI ได้สำเร็จ ผู้นำต้องสร้างช่องว่างระหว่างทีม โดยให้ข้อมูลพื้นฐานเพียงพอแก่ผู้เชี่ยวชาญด้านธุรกิจและผู้บริหารระดับสูงเพื่อให้สามารถสื่อสารกับผู้นำเทคนิคได้อย่างมีประสิทธิภาพ
หลายคนคิดถึงโค้ดเมื่อพวกเขาคิดถึง AI ข้อความสำคัญในหนังสือเล่มนี้คือข้อมูลมีความสำคัญอย่างมากต่อความสำเร็จของโมเดล AI มีสิ่งมากมายที่เกี่ยวข้องกับข้อมูลตั้งแต่การรวบรวมไปยังการทำฉลาก การจัดเก็บ และทุกขั้นตอนจะส่งผลต่อความสำเร็จของโมเดล โครงการ AI ที่ประสบความสำเร็จมากที่สุดคือที่ให้ความสำคัญกับข้อมูลและพยายามปรับปรุงด้านนี้ของโมเดล ML อย่างต่อเนื่อง
การนำ AI ไปใช้จริงต้องการทีมที่ทำงานข้ามฟังก์ชันและจิตวิญญาณที่สร้างสรรค์
ได้กล่าวถึงการกำหนดเมื่อโมเดล AI มีความแม่นยำเพียงพอในการใช้งาน AI วิธีที่ง่ายที่สุดในการประเมินความแม่นยำที่ต้องการคืออะไร
ขึ้นอยู่กับกรณีการใช้งานและความอดทนของความเสี่ยง ทีมที่พัฒนา AI ควรจะมีการทดสอบที่กำหนดระดับความแม่นยำและขีดความสามารถที่ยอมรับได้สำหรับองค์กรและผู้มีส่วนได้ส่วนเสียของตน สำหรับกรณีการใช้งานที่มีความเสี่ยงต่อชีวิตหรือความตาย – โดยที่มีศักยภาพที่จะเกิดอันตรายหาก AI ทำผิดพลาด เช่น ซอฟต์แวร์ในการพิพากษาลงโทษ รถยนต์ขับเคลื่อนอัตโนมัติ การใช้งานทางการแพทย์ มาตรฐานคือสูงมาก – และทีมต้องมีการเตรียมการในกรณีที่โมเดลมีข้อผิดพลาด สำหรับกรณีการใช้งานที่สามารถทนต่อข้อผิดพลาดได้ – โดยที่มีการใช้ความเห็นของผู้ใช้ในการปรับโมเดลให้เหมาะสม – ทีมสามารถพึ่งพาการให้ข้อมูลโดยผู้ใช้เพื่อปรับโมเดลให้เหมาะสมต่อไปแม้ในระหว่างการผลิต ดังนั้น จึงมีกรณีการใช้งานที่มีความเสี่ยงสูงเช่นกัน โดยที่อาจแสดงเนื้อหาที่ผิดกฎหมายหรือผิดศีลธรรมให้กับผู้ใช้ ดังนั้น ระบบความปลอดภัยและกลไกการให้ข้อมูลจึงต้องมีอยู่
คุณสามารถอธิบายถึงความสำคัญของการกำหนดความสำเร็จของโครงการในขั้นตอนแรกได้หรือไม่
มีความสำคัญที่จะเริ่มต้นด้วยปัญหาเชิงธุรกิจและกำหนดความสำเร็จในขั้นตอนแรก เนื่องจากทั้งสองสิ่งนี้มีความเชื่อมโยงกัน ตัวอย่างเช่น ในตัวอย่างในหนังสือเกี่ยวกับดีลเลอร์รถยนต์ที่ใช้ AI ในการทำฉลากภาพ พวกเขาไม่ได้กำหนดว่าความสำเร็จคืออะไร เพราะพวกเขาไม่ได้กำหนดปัญหาเชิงธุรกิจที่จะแก้ไข ความสำเร็จอาจเป็นหลายสิ่งหลายอย่าง ซึ่งทำให้ยากที่จะแก้ไขปัญหาแม้สำหรับทีมคน แต่สำหรับโมเดลการเรียนรู้ของเครื่องจักรที่มีจุดมุ่งหมายที่แน่นอน หากพวกเขาได้กำหนดว่าต้องการทำฉลากรถยนต์ที่มีรอยบาดขีดข่วนเพื่อสร้างรายการตัวรถยนต์ที่ต้องการการซ่อมแซมและกำหนดความสำเร็จว่าเป็นการทำฉลากรถยนต์ที่มีรอยบาดขีดข่วนได้ถูกต้อง 80% ของรถยนต์ที่ใช้แล้วในคลังรถยนต์ เมื่อพวกเขาได้ทำฉลากรถยนต์ที่มีรอยบาดขีดข่วนได้ถูกต้อง 85% ทีมจะเรียกมันว่าความสำเร็จ แต่ถ้าความสำเร็จนั้นไม่เชื่อมโยงกับปัญหาเชิงธุรกิจและผลกระทบเชิงธุรกิจโดยตรง จะยากที่จะประเมินโครงการนอกเหนือจากคำจำกัดความของความแม่นยำในการทำฉลากในตัวอย่างนี้ ปัญหาเชิงธุรกิจมีความซับซ้อนมากขึ้น และการทำฉลากรถยนต์ที่มีรอยบาดขีดข่วนเป็นเพียงส่วนหนึ่งของปัญหา ในกรณีของพวกเขา พวกเขาอาจจะทำได้ดีกว่าโดยการกำหนดความสำเร็จว่าเป็นการประหยัดเวลา/เงินในการดำเนินการเคลมหรือการซ่อมแซมโดย X% และจากนั้นแปลผลกระทบจากการทำฉลากไปสู่ผลลัพธ์เชิงธุรกิจที่แท้จริง
การรับรองว่าข้อมูลการฝึกอบรมครอบคลุมทุกกรณีการใช้งานที่จะเกิดขึ้นในการใช้งานจริงมีความสำคัญเพียงใด
มีความสำคัญอย่างมากที่จะต้องฝึกอบรมโมเดลให้ครอบคลุมทุกกรณีการใช้งานเพื่อหลีกเลี่ยงความลำเอียง แต่ยังสำคัญที่จะทราบว่าไม่สามารถครอบคลุมทุกกรณีการใช้งานได้ ทีมที่สร้าง AI ต้องเข้าใจข้อมูลการผลิตและข้อมูลการฝึกอบรมของตนเพื่อที่จะฝึกอบรม AI สำหรับสิ่งที่จะพบในการผลิต การเข้าถึงข้อมูลการฝึกอบรมที่มาจากกลุ่มที่หลากหลายและใหญ่โตพร้อมกรณีการใช้งานต่างๆ จะมีความสำคัญต่อความสำเร็จของโมเดล ตัวอย่างเช่น โมเดลที่ฝึกอบรมให้ระบุสัตว์เลี้ยงที่อัปโหลดในภาพจะต้องฝึกอบรมกับสัตว์เลี้ยงหลายชนิด เช่น สุนัข แมว นก สัตว์เลี้ยงขนาดเล็ก สัตว์เลื้อยคลาน และอื่นๆ หากโมเดลฝึกอบรมเฉพาะสุนัข แมว และนก เมื่อมีใครอัปโหลดภาพกับหนูแฮมสเตอร์ โมเดลจะไม่สามารถระบุได้ แม้ว่านี่จะเป็นตัวอย่างที่ง่ายมาก แต่ก็แสดงให้เห็นว่าการฝึกอบรมกับกรณีการใช้งานที่น่าจะเกิดขึ้นมากที่สุดเป็นสิ่งสำคัญสำหรับความสำเร็จของโมเดล
กล่าวถึงในหนังสือเกี่ยวกับความจำเป็นในการพัฒนาพฤติกรรมที่ดีในการจัดการข้อมูลจากบนลงล่าง คุณสามารถอธิบายขั้นตอนแรกที่ดีที่สุดในการสร้างนิสัยนี้ได้หรือไม่
พฤติกรรมที่ดีในการจัดการข้อมูลจะเพิ่มความสามารถในการใช้ข้อมูลภายในและเตรียมพร้อมสำหรับการใช้งาน AI บริษัททั้งหมดต้องมีความสามารถในการจัดระเบียบและติดตามชุดข้อมูลของตน วิธีการที่แน่นอนในการบรรลุเป้าหมายนี้คือการทำให้เป็นข้อกำหนดทางธุรกิจและติดตามการดำเนินการเพื่อให้มีรายงานที่ไม่ใช่งานที่กำหนดเองมากนัก และทีมทำงานมากขึ้นด้วยข้อมูลที่ส่งผ่านไปยังคลังข้อมูลกลางพร้อมออนโทโลจีที่ชัดเจน การปฏิบัติที่ดีอีกประการหนึ่งคือการบันทึกว่าข้อมูลถูกเก็บเมื่อไหร่และเกิดอะไรขึ้นกับข้อมูลก่อนที่จะถูกเก็บในฐานข้อมูล เช่นเดียวกับการตั้งกระบวนการในการลบข้อมูลที่ไม่ได้ใช้หรือข้อมูลที่陈旧ออกเป็นระยะ
ขอขอบคุณสำหรับการสัมภาษณ์ที่ดีสำหรับผู้อ่านที่สนใจที่จะเรียนรู้เพิ่มเติม ฉันแนะนำให้อ่านหนังสือ โลกแห่งความเป็นจริงของ AI: คู่มือปฏิบัติสำหรับการเรียนรู้ของเครื่องจักรที่รับผิดชอบ












