Connect with us

Alex Ratner, CEO & Co-Founder of Snorkel AI – Interview Series

สัมภาษณ์

Alex Ratner, CEO & Co-Founder of Snorkel AI – Interview Series

mm

Alex Ratner เป็น CEO & Co-Founder ของ Snorkel AI บริษัทที่เกิดจาก Stanford AI lab

Snorkel AI ทำให้การพัฒนา AI เร็วและเป็นไปได้โดยการเปลี่ยนกระบวนการ AI ที่ทำด้วยมือให้เป็นโซลูชันแบบโปรแกรม Snorkel AI ช่วยให้ธุรกิจพัฒนา AI ที่ทำงานสำหรับงานเฉพาะของตนโดยใช้ข้อมูลและความรู้ที่เป็นกรรมสิทธิ์ 10-100 เท่าเร็วกว่า

สิ่งใดที่ดึงดูดคุณเข้าสู่วิชาวิทยาการคอมพิวเตอร์?

มีสองด้านที่น่าตื่นเต้นของวิชาวิทยาการคอมพิวเตอร์เมื่อคุณยังเป็นเด็ก หนึ่ง คุณสามารถเรียนรู้ได้เร็วตามที่คุณต้องการจากการลองผิดลองถูกและสร้างสรรค์ โดยไม่ต้องรอครู สอง คุณสามารถสร้างสรรค์ได้มากโดยไม่ต้องขออนุญาตใคร!

ฉันเริ่มเขียนโปรแกรมเมื่อฉันยังเป็นเด็กเนื่องจากสาเหตุเหล่านี้ ฉันยังชื่นชอบความแม่นยำที่ต้องการอีกด้วย ฉันชอบกระบวนการทำให้กระบวนการที่ซับซ้อนและแบบแผนเป็นแบบที่เข้าใจได้ และจากนั้นเข้ารหัสเป็นรูปแบบโมดูลาร์

ต่อมา เมื่อฉันโตขึ้น ฉันกลับเข้าสู่วิชาวิทยาการคอมพิวเตอร์อีกครั้งโดยทางอาชีพผ่านงานที่ให้ฉันเขียนสคริปต์สำหรับการวิเคราะห์องค์ประกอบพื้นฐานของเอกสารสิทธิบัตร ฉันรู้สึกประทับใจที่เห็นว่ามีปริมาณความรู้ของมนุษย์ที่มีอยู่มากมาย—ทุกสิ่งที่ใคร曾พิจารณาว่าเป็นสิทธิบัตร—พร้อมให้ใช้งาน แต่ก็ยากที่จะเข้าถึงเพราะการวิเคราะห์ข้อความทางเทคนิคและข้อมูลหลายรูปแบบนั้นยาก

สิ่งนี้ทำให้ฉันกลับเข้าสู่วิชาวิทยาการคอมพิวเตอร์อีกครั้ง และในที่สุดก็เข้าเรียนที่ Stanford โดยเน้นด้าน NLP ซึ่งเป็นด้านที่ใช้ ML/AI กับภาษาธรรมชาติ

คุณเริ่มต้นและนำโครงการ Snorkel ที่เปิดให้ใช้งานฟรีในขณะที่คุณอยู่ที่ Stanford คุณสามารถพาคนอ่านผ่านการเดินทางใน nhữngวันแรกได้หรือไม่?

ในสมัยนั้น เราเหมือนกับหลายคนในอุตสาหกรรมที่มุ่งเน้นการพัฒนาแอลกอริทึมใหม่ๆ และสิ่งที่ “หรูหรา” ของการเรียนรู้ของเครื่อง ที่ผู้คนในชุมชนทำการวิจัยและตีพิมพ์งานวิจัย

อย่างไรก็ตาม เรามุ่งมั่นอย่างมากในการยึดมั่นในประเด็นปัญหาในโลกแห่งความเป็นจริง—โดยส่วนใหญ่จะทำงานร่วมกับแพทย์และนักวิทยาศาสตร์ที่ Stanford แต่ละครั้งที่เรานำเสนอโมเดลหรือแอลกอริทึมใหม่ๆ คำตอบที่ได้รับก็คือ “ใช่ เราจะลอง แต่เราต้องการข้อมูลการฝึกอบรมที่มีฉลากที่เรามีเวลาที่จะสร้างไม่ได้!”

เราพบว่าปัญหาใหญ่ที่ไม่ได้พูดถึงคือกระบวนการของการให้ฉลากและคัดเลือกข้อมูลการฝึกอบรม—ดังนั้นเราจึงเปลี่ยนโฟกัสทั้งหมดไปที่สิ่งนี้ ซึ่งเป็นวิธีการที่โครงการ Snorkel และแนวคิด “การเรียนรู้ของเครื่องแบบมีศูนย์กลางที่ข้อมูล” เริ่มต้นขึ้น

Snorkel มีการเข้าถึง AI แบบมีศูนย์กลางที่ข้อมูล คุณสามารถกำหนดสิ่งนี้และอธิบายว่ามันแตกต่างจากการพัฒนา AI แบบมีศูนย์กลางที่โมเดลอย่างไร?

การเรียนรู้ของเครื่องแบบมีศูนย์กลางที่ข้อมูลหมายถึงการมุ่งเน้นในการสร้างข้อมูลที่ดีกว่าเพื่อสร้างโมเดลที่ดีกว่า

สิ่งนี้ตั้งตรงข้ามกับ—but works hand-in-hand with—การเรียนรู้ของเครื่องแบบมีศูนย์กลางที่โมเดล ในการเรียนรู้ของเครื่องแบบมีศูนย์กลางที่โมเดล นักวิทยาศาสตร์ข้อมูลหรือนักวิจัยสมมติว่าข้อมูลนั้นเป็นแบบคงที่และใช้พลังงานในการปรับเปลี่ยนโครงสร้างและพารามิเตอร์ของโมเดลเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น

นักวิจัยยังคงทำงานที่ดีในการเรียนรู้ของเครื่องแบบมีศูนย์กลางที่โมเดล แต่โมเดลที่พร้อมใช้งานและเทคนิค Auto ML ได้ดีขึ้นมากจนการเลือกโมเดลกลายเป็นสิ่งที่มีมาตรฐานในเวลาที่ผลิต เมื่อเป็นเช่นนั้น วิธีที่ดีที่สุดในการปรับปรุงโมเดลเหล่านี้คือการให้ข้อมูลที่ดีกว่าและมากขึ้น

หลักการหลักของการเข้าถึง AI แบบมีศูนย์กลางที่ข้อมูลคืออะไร?

หลักการหลักของการเรียนรู้ของเครื่องแบบมีศูนย์กลางที่ข้อมูลคือเรื่องง่าย: ข้อมูลที่ดีกว่าสร้างโมเดลที่ดีกว่า

ในงานวิจัยทางวิชาการของเรา เรียกว่า “การเขียนโปรแกรมข้อมูล” ความคิดคือว่าถ้าคุณให้โมเดลที่มีความแข็งแกร่งเพียงพอจำนวนมากของตัวอย่างอินพุตและเอาต์พุตที่คาดหวัง โมเดลจะเรียนรู้วิธีการทำซ้ำรูปแบบเหล่านั้น

สิ่งนี้นำเสนอความท้าทายที่มากกว่าที่คุณคาดหวัง ข้อมูลส่วนใหญ่ไม่มีฉลาก—หรืออย่างน้อยก็ไม่มีฉลากที่มีประโยชน์สำหรับการใช้งานของคุณ การให้ฉลากข้อมูลด้วยมือต้องใช้ความเบื่อหน่าย เวลา และความพยายามของมนุษย์

การมีชุดข้อมูลที่มีฉลากไม่ได้รับประกันคุณภาพ ความผิดพลาดของมนุษย์จะเกิดขึ้นทุกที่ ทุกตัวอย่างที่ไม่ถูกต้องในข้อมูลพื้นฐานของคุณจะทำให้ประสิทธิภาพของโมเดลสุดท้ายลดลง ไม่มีการปรับพารามิเตอร์ใดที่สามารถแก้ไขความเป็นจริงนี้ได้ นักวิจัยพบว่ามีบันทึกที่มีฉลากไม่ถูกต้องในเซตข้อมูลที่เปิดให้ใช้งานฟรี

คุณสามารถอธิบายได้หรือไม่ว่าสิ่งใดที่หมายถึงการเข้าถึง AI แบบมีศูนย์กลางที่ข้อมูลแบบโปรแกรมมาติก?

การให้ฉลากข้อมูลด้วยมือนำเสนอความท้าทายที่ร้ายแรง สิ่งนี้ต้องใช้เวลามนุษย์จำนวนมาก และบางครั้งเวลามนุษย์เหล่านั้นอาจมีค่าใช้จ่ายสูง ตัวอย่างเช่น เอกสารทางการแพทย์สามารถให้ฉลากได้เฉพาะโดยแพทย์

นอกจากนี้ การให้ฉลากด้วยมือบ่อยครั้งจะกลายเป็นโครงการที่ใช้ครั้งเดียว การให้ฉลากจะทำตามสเคมาที่เข้มงวด หากความต้องการของธุรกิจเปลี่ยนแปลงและต้องการชุดฉลากที่แตกต่าง การให้ฉลากจะต้องเริ่มต้นใหม่ตั้งแต่ต้น

การเข้าถึง AI แบบมีศูนย์กลางที่ข้อมูลแบบโปรแกรมมาติกจะลดปัญหาเหล่านี้ทั้งสองลง Snorkel AI ระบบการให้ฉลากแบบโปรแกรมมาติก รวมสัญญาณที่หลากหลาย—จากโมเดลที่มีอยู่แล้วถึงฉลากที่มีอยู่แล้วและฐานความรู้ภายนอก—เพื่อสร้างฉลากแบบมีแนวโน้มที่จะเกิดขึ้นในระดับใหญ่ สัญญาณหลักของเรามาจากผู้เชี่ยวชาญที่ร่วมมือกับนักวิทยาศาสตร์ข้อมูลในการสร้างฟังก์ชันการให้ฉลาก ซึ่งเข้ารหัสความเชี่ยวชาญของพวกเขาเป็นกฎที่สามารถขยายได้ ทำให้ความพยายามที่ลงทุนในการตัดสินใจหนึ่งครั้งสามารถส่งผลกระทบต่อหลายหรือหลายร้อยจุดข้อมูล

เฟรมเวิร์กนี้ยังยืดหยุ่นได้ เมื่อความต้องการของธุรกิจเปลี่ยนแปลงและต้องการชุดฉลากใหม่ ผู้ใช้เพิ่ม ลบ หรือปรับฟังก์ชันการให้ฉลากเพื่อใช้ฉลากใหม่ภายในไม่กี่ชั่วโมงแทนหลายวัน

การเข้าถึง AI แบบมีศูนย์กลางที่ข้อมูลนี้ช่วยให้สามารถขยายข้อมูลที่ไม่มีฉลากได้อย่างรวดเร็วได้อย่างไร?

การเข้าถึง AI แบบมีศูนย์กลางที่ข้อมูลแบบโปรแกรมมาติกของเราช่วยให้สามารถขยายข้อมูลที่ไม่มีฉลากได้อย่างรวดเร็วโดยการเพิ่มผลกระทบของแต่ละตัวเลือก เมื่อผู้เชี่ยวชาญด้านเนื้อหาสถาปนาข้อมูลพื้นฐานเริ่มต้นขนาดเล็กๆ แล้ว พวกเขาจะเริ่มร่วมมือกับนักวิทยาศาสตร์ข้อมูลเพื่อทำการวนซ้ำอย่างรวดเร็ว พวกเขากำหนดฟังก์ชันการให้ฉลากบางอย่าง ฝึกโมเดลอย่างรวดเร็ว วิเคราะห์ผลกระทบของฟังก์ชันการให้ฉลาก และจากนั้นเพิ่ม ลบ หรือปรับฟังก์ชันการให้ฉลากตามที่ต้องการ

แต่ละรอบจะปรับปรุงประสิทธิภาพของโมเดลจนกว่าจะถึงหรือเกินเป้าหมายของโครงการ ซึ่งสามารถลดงานการให้ฉลากข้อมูลหลายเดือนให้เหลือเพียงไม่กี่ชั่วโมง ในโครงการวิจัย Snorkel หนึ่งโครงการ นักวิจัยสองคนของเราให้ฉลากเอกสาร 20,000 ฉบับในหนึ่งวัน—ปริมาณที่อาจต้องใช้เวลานักให้ฉลากด้วยมือสิบสัปดาห์หรือมากกว่านั้น

Snorkel มีโซลูชัน AI หลายอย่าง รวมถึง Snorkel Flow, Snorkel GenGlow และ Snorkel Foundry สิ่งที่แตกต่างระหว่างโซลูชันเหล่านี้คืออะไร?

ชุด Snorkel AI ช่วยให้ผู้ใช้สามารถสร้างฟังก์ชันการให้ฉลาก (เช่น การค้นหาคำสำคัญหรือรูปแบบในเอกสาร) เพื่อการให้ฉลากข้อมูลหลายล้านจุดในนาที แทนที่จะให้ฉลากจุดข้อมูลหนึ่งจุดในแต่ละครั้ง

สิ่งนี้จะบีบอัดเวลาที่จำเป็นสำหรับบริษัทต่างๆ ในการแปลข้อมูลที่เป็นกรรมสิทธิ์ให้เป็นโมเดลที่พร้อมผลิตและเริ่มสร้างมูลค่าจากมัน Snorkel AI ช่วยให้ธุรกิจต่างๆ ขยายแนวทางแบบมีมนุษย์ในการทำงานโดยการรวมการตัดสินใจและความรู้ของผู้เชี่ยวชาญด้านเนื้อหาที่มีประสิทธิภาพ

สิ่งนี้นำไปสู่ AI ที่มีความโปร่งใสและอธิบายได้มากขึ้น ทำให้ธุรกิจต่างๆ สามารถจัดการความลำเอียงและนำผลลัพธ์ที่มีความรับผิดชอบมาใช้

เมื่อพิจารณาถึงรายละเอียด ชุด Snorkel AI ช่วยให้ธุรกิจขนาดใหญ่ใน Fortune 500:

  • พัฒนาข้อมูลที่มีฉลากคุณภาพสูงเพื่อฝึกโมเดลหรือปรับปรุง RAG;
  • ปรับโมเดล LLM ด้วยการปรับให้ละเอียด;
  • ทำให้โมเดล LLM มีขนาดเล็กลงและถูกกว่าในการดำเนินงาน;
  • สร้างโมเดล LLM ที่มีเฉพาะโดเมนและงานโดยใช้การฝึกฝนก่อน

คุณได้เขียนเอกสารวิจัยที่เป็นเครื่องหมายสำคัญ คุณคิดว่าเอกสารใดที่สำคัญที่สุด?

หนึ่งในเอกสารหลักคือเอกสารดั้งเดิมเกี่ยวกับ การเขียนโปรแกรมข้อมูล (การให้ฉลากข้อมูลการฝึกอบรมแบบโปรแกรมมาติก) และเกี่ยวกับ Snorkel

วิสัยทัศน์ของคุณสำหรับอนาคตของ Snorkel คืออะไร?

ฉันเห็น Snorkel ที่จะกลายเป็นพันธมิตรที่เชื่อถือได้สำหรับธุรกิจขนาดใหญ่ทั้งหมดที่จริงจังเกี่ยวกับ AI

Snorkel Flow ควรกลายเป็นเครื่องมือที่เป็นที่นิยมสำหรับทีมวิทยาศาสตร์ข้อมูลในธุรกิจขนาดใหญ่—ไม่ว่าพวกเขาจะปรับโมเดลภาษาขนาดใหญ่แบบกำหนดเองสำหรับองค์กรของตน สร้างโมเดลการจำแนกภาพ หรือสร้างโมเดลการถดถอยแบบลอจิสติกที่เรียบง่ายและสามารถใช้งานได้

ไม่ว่าธุรกิจจะต้องการโมเดลใดก็ตาม พวกเขาจะต้องมีข้อมูลที่มีฉลากคุณภาพสูงเพื่อฝึกอบรม

ขอขอบคุณสำหรับการสัมภาษณ์ที่ดี ผู้อ่านสามารถเยี่ยมชม Snorkel AI เพื่อเรียนรู้เพิ่มเติม

อ็องตวนเป็นผู้นำที่มีวิสัยทัศน์และเป็นพันธมิตรผู้ก่อตั้งของ Unite.AI โดยมีความหลงใหลที่ไม่สั่นคลอนในการ塑造และส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการที่มีประสบการณ์หลายครั้ง และเชื่อว่า AI จะมีผลกระทบต่อสังคมมากเท่ากับไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่เปลี่ยนแปลงและ AGI

As a futurist เขาได้ให้ความสนใจในการสำรวจว่านวัตกรรมเหล่านี้จะเปลี่ยนแปลงโลกของเราอย่างไร นอกจากนี้เขายังเป็นผู้ก่อตั้ง Securities.io ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นในการลงทุนในเทคโนโลยีที่ทันสมัยซึ่งกำลังกำหนดอนาคตและเปลี่ยนแปลงภาคส่วนต่างๆ