ต้นขั้ว แมชชีนเลิร์นนิงแบบเดิมยังเกี่ยวข้องอยู่หรือไม่ - Unite.AI
เชื่อมต่อกับเรา

ปัญญาประดิษฐ์

แมชชีนเลิร์นนิงแบบเดิมยังเกี่ยวข้องอยู่หรือไม่

mm

การตีพิมพ์

 on

แมชชีนเลิร์นนิงแบบเดิมยังเกี่ยวข้องอยู่หรือไม่

ในช่วงไม่กี่ปีที่ผ่านมา Generative AI แสดงให้เห็นผลลัพธ์ที่น่าหวังในการแก้ปัญหางาน AI ที่ซับซ้อน โมเดล AI สมัยใหม่เช่น ChatGPT, นักประพันธ์เพลง, โทร, ดัล-E.3และ SAM ได้แสดงความสามารถที่โดดเด่นในการแก้ปัญหาหลากหลายสาขาวิชา เช่น การตอบคำถามด้วยภาพ การแบ่งส่วน การใช้เหตุผล และการสร้างเนื้อหา

ยิ่งไปกว่านั้น AI หลายรูปแบบ เทคนิคได้เกิดขึ้น โดยมีความสามารถในการประมวลผลข้อมูลหลายรูปแบบ เช่น ข้อความ รูปภาพ เสียง และวิดีโอพร้อมกัน ด้วยความก้าวหน้าเหล่านี้ จึงเป็นธรรมดาที่จะสงสัยว่า: เรากำลังเข้าใกล้จุดจบของเรื่องหรือไม่ การเรียนรู้ของเครื่องแบบดั้งเดิม (มล.)?

ในบทความนี้ เราจะดูสถานะของภูมิทัศน์การเรียนรู้ของเครื่องแบบดั้งเดิมที่เกี่ยวข้องกับนวัตกรรม AI สมัยใหม่

การเรียนรู้ของเครื่องแบบดั้งเดิมคืออะไร? – ข้อจำกัดของมันคืออะไร?

การเรียนรู้ของเครื่องแบบดั้งเดิมเป็นคำกว้างๆ ที่ครอบคลุมอัลกอริธึมที่หลากหลายซึ่งขับเคลื่อนโดยสถิติเป็นหลัก อัลกอริธึม ML แบบดั้งเดิมมีสองประเภทหลักคือ ภายใต้การดูแลและไม่ได้รับการดูแล. อัลกอริธึมเหล่านี้ได้รับการออกแบบมาเพื่อพัฒนาแบบจำลองจากชุดข้อมูลที่มีโครงสร้าง

อัลกอริธึมการเรียนรู้ของเครื่องแบบดั้งเดิมมาตรฐานประกอบด้วย:

  • อัลกอริธึมการถดถอย เช่น เชิงเส้น ลาสโซ และริดจ์
  • การจัดกลุ่ม K-mean
  • การวิเคราะห์องค์ประกอบหลัก (PCA)
  • รองรับเครื่องเวกเตอร์ (SVM)
  • อัลกอริธึมแบบทรี เช่น แผนผังการตัดสินใจ และฟอเรสต์แบบสุ่ม
  • การเพิ่มประสิทธิภาพโมเดล เช่น การเร่งความเร็วแบบไล่ระดับ และ XGBoost.

ข้อจำกัดของแมชชีนเลิร์นนิงแบบดั้งเดิม

ML แบบดั้งเดิมมีข้อจำกัดดังต่อไปนี้:

  1. ความสามารถในการปรับขนาดที่จำกัด: โมเดลเหล่านี้มักต้องการความช่วยเหลือในการปรับขนาดด้วยชุดข้อมูลขนาดใหญ่และหลากหลาย
  2. การประมวลผลข้อมูลล่วงหน้าและวิศวกรรมคุณสมบัติ: ML แบบดั้งเดิมต้องมีการประมวลผลล่วงหน้าอย่างกว้างขวางเพื่อแปลงชุดข้อมูลตามความต้องการของโมเดล นอกจากนี้ วิศวกรรมฟีเจอร์อาจใช้เวลานานและต้องมีการวนซ้ำหลายครั้งเพื่อรวบรวมความสัมพันธ์ที่ซับซ้อนระหว่างฟีเจอร์ข้อมูล
  3. ข้อมูลมิติสูงและไม่มีโครงสร้าง: ML แบบดั้งเดิมต้องดิ้นรนกับประเภทข้อมูลที่ซับซ้อน เช่น รูปภาพ เสียง วิดีโอ และเอกสาร
  4. ความสามารถในการปรับตัวกับข้อมูลที่มองไม่เห็น: โมเดลเหล่านี้อาจปรับตัวได้ไม่ดีนักกับข้อมูลในโลกแห่งความเป็นจริงที่ไม่ได้เป็นส่วนหนึ่งของโมเดลเหล่านั้น ข้อมูลการฝึกอบรม.

โครงข่ายประสาทเทียม: การย้ายจากการเรียนรู้ของเครื่องไปสู่การเรียนรู้เชิงลึกและอื่น ๆ

โครงข่ายประสาทเทียม: การย้ายจากการเรียนรู้ของเครื่องไปสู่การเรียนรู้เชิงลึกและอื่น ๆ

โมเดลโครงข่ายประสาทเทียม (NN) มีความซับซ้อนมากกว่าโมเดลแมชชีนเลิร์นนิงแบบเดิมมาก NN ที่ง่ายที่สุด – เพอร์เซปตรอนหลายชั้น (MLP) ประกอบด้วยเซลล์ประสาทหลายตัวที่เชื่อมต่อเข้าด้วยกันเพื่อทำความเข้าใจข้อมูลและปฏิบัติงาน คล้ายกับการทำงานของสมองมนุษย์

ความก้าวหน้าในเทคนิคโครงข่ายประสาทเทียมได้สร้างพื้นฐานสำหรับการเปลี่ยนจาก การเรียนรู้ของเครื่องไปจนถึงการเรียนรู้เชิงลึก. ตัวอย่างเช่น เรียก NN ที่ใช้สำหรับงานคอมพิวเตอร์วิทัศน์ (การตรวจจับวัตถุและการแบ่งส่วนภาพ) โครงข่ายประสาทเทียม (CNNs)เช่น อเล็กซ์เน็ต, เรสเน็ตและ YOLO.

ปัจจุบัน เทคโนโลยี generative AI กำลังยกระดับเทคนิคโครงข่ายประสาทเทียมไปอีกขั้น ทำให้สามารถเป็นเลิศในโดเมน AI ต่างๆ ได้ ตัวอย่างเช่น โครงข่ายประสาทเทียมที่ใช้สำหรับงานประมวลผลภาษาธรรมชาติ (เช่น การสรุปข้อความ การตอบคำถาม และการแปล) เรียกว่า หม้อแปลง. หม้อแปลงรุ่นที่โดดเด่น ได้แก่ BERT, จีพีที-4และ T5. โมเดลเหล่านี้กำลังสร้างผลกระทบต่ออุตสาหกรรมต่างๆ ตั้งแต่การดูแลสุขภาพ การค้าปลีก การตลาด เงินทุนฯลฯ

เรายังต้องการอัลกอริธึมการเรียนรู้ของเครื่องแบบเดิมๆ หรือไม่?

เรายังต้องการอัลกอริธึมการเรียนรู้ของเครื่องแบบเดิมๆ หรือไม่?

ในขณะที่โครงข่ายประสาทเทียมและรูปแบบสมัยใหม่ เช่น หม้อแปลงไฟฟ้า ได้รับความสนใจอย่างมาก แต่วิธี ML แบบดั้งเดิมยังคงมีความสำคัญ ให้เราดูว่าทำไมพวกเขาถึงยังคงมีความเกี่ยวข้อง

1. ข้อกำหนดข้อมูลที่ง่ายกว่า

โครงข่ายประสาทเทียมต้องการชุดข้อมูลขนาดใหญ่สำหรับการฝึก ในขณะที่โมเดล ML สามารถบรรลุผลลัพธ์ที่สำคัญได้ด้วยชุดข้อมูลที่เล็กกว่าและเรียบง่ายกว่า ดังนั้น ML จึงได้รับความนิยมมากกว่าการเรียนรู้เชิงลึกสำหรับชุดข้อมูลที่มีโครงสร้างขนาดเล็กและในทางกลับกัน

2. ความเรียบง่ายและการตีความได้

โมเดลแมชชีนเลิร์นนิงแบบดั้งเดิมสร้างขึ้นจากโมเดลทางสถิติและความน่าจะเป็นที่เรียบง่ายกว่า ตัวอย่างเช่น บรรทัดเข้าที่เหมาะสมที่สุด การถดถอยเชิงเส้น สร้างความสัมพันธ์อินพุต-เอาต์พุตโดยใช้วิธีกำลังสองน้อยที่สุด ซึ่งเป็นการดำเนินการทางสถิติ

ในทำนองเดียวกัน แผนผังการตัดสินใจใช้หลักการความน่าจะเป็นในการจำแนกข้อมูล การใช้หลักการดังกล่าวช่วยให้สามารถตีความได้ และทำให้ผู้ปฏิบัติงานด้าน AI เข้าใจการทำงานของอัลกอริทึม ML ได้ง่ายขึ้น

สถาปัตยกรรม NN สมัยใหม่ เช่น โมเดลหม้อแปลงและการแพร่กระจาย (โดยทั่วไปจะใช้สำหรับการสร้างภาพ เช่น การแพร่กระจายที่เสถียร or กลางการเดินทาง) มีโครงสร้างเครือข่ายหลายชั้นที่ซับซ้อน การทำความเข้าใจเครือข่ายดังกล่าวจำเป็นต้องมีความเข้าใจแนวคิดทางคณิตศาสตร์ขั้นสูง นั่นเป็นสาเหตุที่เรียกพวกมันว่า 'กล่องดำ'

3. ประสิทธิภาพทรัพยากร

โครงข่ายประสาทเทียมสมัยใหม่ เช่น Large Language Models (LLM) ได้รับการฝึกฝนบนคลัสเตอร์ของ GPU ราคาแพงตามข้อกำหนดด้านการคำนวณ ตัวอย่างเช่น มีรายงานว่ามีการฝึกอบรมเกี่ยวกับ GPT4 GPU Nvidia 25000 ตัว เป็นเวลา 90 ถึง 100 วัน

อย่างไรก็ตาม ฮาร์ดแวร์ราคาแพงและเวลาการฝึกอบรมที่ยาวนานนั้นไม่สามารถทำได้สำหรับผู้ปฏิบัติงานหรือทีม AI ทุกคน ในทางกลับกัน ประสิทธิภาพการคำนวณของอัลกอริธึมการเรียนรู้ของเครื่องแบบดั้งเดิมช่วยให้ผู้ปฏิบัติงานบรรลุผลลัพธ์ที่มีความหมายแม้จะมีทรัพยากรที่จำกัดก็ตาม

4. ไม่ใช่ทุกปัญหาที่ต้องการการเรียนรู้อย่างลึกซึ้ง

การเรียนรู้ลึก ๆ ไม่ใช่วิธีแก้ปัญหาที่สมบูรณ์สำหรับทุกปัญหา มีสถานการณ์บางอย่างที่ ML มีประสิทธิภาพเหนือกว่าการเรียนรู้เชิงลึก

ตัวอย่างเช่นใน การวินิจฉัยและการพยากรณ์โรค ด้วยข้อมูลที่จำกัด อัลกอริธึม ML สำหรับ การตรวจจับความผิดปกติ เช่น REMED ให้ผลลัพธ์ที่ดีกว่าการเรียนรู้เชิงลึก ในทำนองเดียวกัน การเรียนรู้ของเครื่องแบบดั้งเดิมมีความสำคัญในสถานการณ์ที่มีความสามารถในการคำนวณต่ำเช่น โซลูชันที่ยืดหยุ่นและมีประสิทธิภาพ.

โดยพื้นฐานแล้ว การเลือกแบบจำลองที่ดีที่สุดสำหรับปัญหาใดๆ ขึ้นอยู่กับความต้องการขององค์กรหรือผู้ปฏิบัติงาน และลักษณะของปัญหาที่มีอยู่

แมชชีนเลิร์นนิงในปี 2023

แมชชีนเลิร์นนิงในปี 2023

รูปภาพที่สร้างโดยใช้ เลโอนาร์โด เอ.ไอ

ในปี 2023 การเรียนรู้ของเครื่องแบบดั้งเดิมยังคงมีการพัฒนาอย่างต่อเนื่อง และกำลังแข่งขันกับการเรียนรู้เชิงลึกและ AI เชิงสร้างสรรค์ มีประโยชน์หลายอย่างในอุตสาหกรรม โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับชุดข้อมูลที่มีโครงสร้าง

ตัวอย่างเช่น หลายๆ สินค้าอุปโภคบริโภคที่เคลื่อนไหวรวดเร็ว (FMCG) บริษัทต่างๆ จัดการกับข้อมูลแบบตารางจำนวนมากโดยอาศัยอัลกอริธึม ML สำหรับงานที่สำคัญ เช่น คำแนะนำผลิตภัณฑ์ส่วนบุคคล การเพิ่มประสิทธิภาพราคา การจัดการสินค้าคงคลัง และการเพิ่มประสิทธิภาพห่วงโซ่อุปทาน

นอกจากนี้อีกมากมาย แบบจำลองการมองเห็นและภาษา ยังคงใช้เทคนิคแบบดั้งเดิม โดยนำเสนอโซลูชั่นในแนวทางแบบไฮบริดและการใช้งานที่เกิดขึ้นใหม่ ยกตัวอย่างงานวิจัยล่าสุดเรื่อง “เราต้องการโมเดลการเรียนรู้เชิงลึกสำหรับการพยากรณ์อนุกรมเวลาจริงหรือ?” ได้พูดคุยถึงวิธีที่ต้นไม้การถดถอยที่ส่งเสริมการไล่ระดับสี (GBRT) มีประสิทธิภาพมากขึ้นสำหรับ พยากรณ์อนุกรมเวลา มากกว่าโครงข่ายประสาทเทียมเชิงลึก

ความสามารถในการตีความของ ML ยังคงมีคุณค่าสูงเมื่อใช้เทคนิคเช่น สับ (คำอธิบายสารเติมแต่งแชปลีย์) และ มะนาว (คำอธิบายของผู้ไม่เชื่อเรื่องพระเจ้าแบบจำลองที่ตีความได้ในท้องถิ่น) เทคนิคเหล่านี้จะอธิบายโมเดล ML ที่ซับซ้อนและให้ข้อมูลเชิงลึกเกี่ยวกับการคาดการณ์ ซึ่งจะช่วยให้ผู้ปฏิบัติงาน ML เข้าใจโมเดลของตนได้ดียิ่งขึ้น

สุดท้ายนี้ แมชชีนเลิร์นนิงแบบเดิมยังคงเป็นโซลูชันที่แข็งแกร่งสำหรับอุตสาหกรรมที่หลากหลาย ในการจัดการกับความสามารถในการขยายขนาด ความซับซ้อนของข้อมูล และข้อจำกัดด้านทรัพยากร อัลกอริธึมเหล่านี้ไม่สามารถทดแทนได้สำหรับการวิเคราะห์ข้อมูลและการสร้างแบบจำลองเชิงคาดการณ์ และจะยังคงเป็นส่วนหนึ่งของ คลังแสงของนักวิทยาศาสตร์ข้อมูล.

หากหัวข้อเช่นนี้ทำให้คุณสนใจ ลองสำรวจดู รวมพลังเอไอ สำหรับข้อมูลเชิงลึกเพิ่มเติม