ปัญญาประดิษฐ์

ปัญญาประดิษฐ์สร้างสรรค์: ความคิดเบื้องหลัง CHATGPT, Dall-E, Midjourney และอื่นๆ

mm
Generative AI - Midjourney Prompt

โลกของศิลปะ การสื่อสาร และวิธีที่เราเข้าใจความเป็นจริงกำลังเปลี่ยนแปลงอย่างรวดเร็ว หากเรามองย้อนกลับไปในประวัติศาสตร์ของนวัตกรรมของมนุษย์ เราอาจพิจารณาการค้นพบการสร้างล้อหรือการค้นพบไฟฟ้าเป็นขั้นตอนสำคัญของมนุษย์ วันนี้ การปฏิวัติใหม่กำลังเกิดขึ้น โดยเชื่อมช่องว่างระหว่างความคิดสร้างสรรค์ของมนุษย์และการคำนวณของเครื่องจักร นั่นคือ ปัญญาประดิษฐ์สร้างสรรค์

แบบจำลองสร้างสรรค์ได้ทำให้เส้นแบ่งระหว่างมนุษย์และเครื่องจักรพร่ามพราว ด้วยการมาถึงของแบบจำลอง เช่น GPT-4 ซึ่งใช้โมดูลทรานส์ฟอร์เมอร์ เราได้เข้าใกล้การสร้างภาษาที่เป็นธรรมชาติและ豊富ด้วยบริบทมากขึ้น การพัฒนานี้ได้กระตุ้นให้เกิดการประยุกต์ใช้ในด้านการสร้างเอกสาร ระบบสนทนาของแชทบอท และแม้กระทั่งการประพันธ์เพลงสังเคราะห์

การตัดสินใจของบริษัทเทคโนโลยีขนาดใหญ่ในระยะหลังเน้นย้ำถึงความสำคัญของปัญญาประดิษฐ์สร้างสรรค์ Microsoft ได้ยกเลิกแอป Cortana ในเดือนนี้เพื่อเน้นไปที่นวัตกรรมปัญญาประดิษฐ์สร้างสรรค์ที่ใหม่กว่า เช่น Bing Chat Apple ก็ได้ลงทุนไปแล้วกว่า 22.6 พันล้านดอลลาร์ในงบประมาณการวิจัยและพัฒนาเพื่อสร้างสรรค์ปัญญาประดิษฐ์ตามที่ CEO Tim Cook ระบุ

ยุคใหม่ของแบบจำลอง: ปัญญาประดิษฐ์สร้างสรรค์เทียบกับแบบจำลองแบ่งแยก

เรื่องราวของปัญญาประดิษฐ์สร้างสรรค์ไม่ได้แค่เกี่ยวกับการประยุกต์ใช้ แต่เกี่ยวกับกลไกภายในของมันในระบบปัญญาประดิษฐ์ มีแบบจำลองสองประเภท: แบบจำลองแบ่งแยกและแบบจำลองสร้างสรรค์

แบบจำลองแบ่งแยกเป็นสิ่งที่ผู้คนพบเจอในชีวิตประจำวัน อัลกอริทึมเหล่านี้รับข้อมูลเข้า เช่น ข้อความหรือรูปภาพ และจับคู่มันกับผลลัพธ์ที่ต้องการ เช่น การแปลหรือการวินิจฉัยทางการแพทย์ มันเกี่ยวกับการทำแผนที่และการทำนาย

แบบจำลองสร้างสรรค์เป็นผู้สร้าง มันไม่เพียงแต่ทำนายหรือตีความ แต่ยังสร้างผลลัพธ์ใหม่ที่ซับซ้อนจากเวกเตอร์ของตัวเลขที่ไม่เกี่ยวข้องกับค่าในโลกแห่งความเป็นจริง

เทคโนโลยีเบื้องหลังแบบจำลองสร้างสรรค์

แบบจำลองสร้างสรรค์เป็นผลมาจากเครือข่ายประสาทเทียมที่ซับซ้อนซึ่งออกแบบมาเพื่อเลียนแบบการทำงานของสมองมนุษย์ โดยการเก็บและประมวลผลความแปรผันของข้อมูลที่ซับซ้อน เครือข่ายเหล่านี้เป็นรากฐานของแบบจำลองสร้างสรรค์หลายแบบ

แบบจำลองสร้างสรรค์ถูกสร้างขึ้นอย่างไร โดยทั่วไปจะถูกสร้างขึ้นโดยใช้เครือข่ายประสาทเทียมที่ถูกปรับให้เหมาะสมเพื่อจับข้อมูลที่ซับซ้อน ตัวอย่างที่ดีคือเครือข่าย Generative Adversarial (GAN) ซึ่งมีเครือข่ายประสาทเทียมสองตัว คือ ตัวสร้างและตัวแบ่งแยก ซึ่งแข่งขันกันและเรียนรู้จากกันในความสัมพันธ์แบบครู-นักเรียนที่ไม่เหมือนใคร ตั้งแต่การวาดภาพถึงการถ่ายโอนสไตล์ จากการประพันธ์เพลงถึงการเล่นเกม แบบจำลองเหล่านี้กำลังพัฒนาและขยายออกไปในทางที่ไม่เคยคิดมาก่อน

ปัญญาประดิษฐ์สร้างสรรค์ประเภท: ข้อความถึงข้อความ, ข้อความถึงรูปภาพ

ทรานส์ฟอร์เมอร์และโมเดลภาษาขนาดใหญ่

การมาถึงของโมเดลทรานส์ฟอร์เมอร์ได้เปลี่ยนแปลงวิธีการสร้างแบบจำลองข้อความใหม่ โดยการแนะนำแนวคิดของ “ความสนใจ” ซึ่งหมายถึงการมุ่งความสนใจไปที่ส่วนต่างๆ ของข้อความตามบริบท นี่ทำให้สามารถประมวลผลข้อความได้เร็วขึ้นและง่ายขึ้นเมื่อเทียบกับโครงสร้างแบบเก่าๆ เช่น RNN หรือ CNN

โมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT-4, Bard และ LLaMA เป็นโครงสร้างขนาดใหญ่ที่ออกแบบมาเพื่อทำความเข้าใจและสร้างภาษาของมนุษย์ รหัส และอื่นๆ ขนาดที่ใหญ่ของโมเดลเหล่านี้เป็นหนึ่งในคุณลักษณะที่สำคัญที่สุด

สถานะของโมเดลภาษาขนาดใหญ่ (LLMs) ณ ปี 2023

ชื่อโมเดล ผู้พัฒนา พารามิเตอร์ ความพร้อมและเข้าถึง คุณลักษณะและคำอธิบายที่สำคัญ
GPT-4 OpenAI 1.5 ล้านล้าน ไม่เปิดเผยต้นฉบับ สามารถเข้าถึงได้ทาง API มีประสิทธิภาพที่น่าประทับใจในหลายงาน สามารถประมวลผลรูปภาพและข้อความได้ ยาวสูงสุด 32,768 โทเคน

การใช้โมเดลภาษาขนาดใหญ่ (LLMs)

LLMs สามารถใช้ได้ในหลายวิธี รวมถึง:

  1. การใช้โดยตรง: ใช้โมเดล LLM ที่ถูกฝึกฝนแล้วสำหรับการสร้างข้อความหรือประมวลผลข้อความ
  2. การปรับแต่ง: ปรับโมเดล LLM ที่ถูกฝึกฝนแล้วสำหรับงานเฉพาะ
  3. การค้นหาข้อมูล: ใช้ LLMs ในระบบที่ใหญ่ขึ้นเพื่อค้นหาและจัดประเภทข้อมูล

การประยุกต์ใช้ปัญญาประดิษฐ์สร้างสรรค์

โดเมนข้อความ

เริ่มต้นด้วยข้อความ ปัญญาประดิษฐ์สร้างสรรค์ได้ถูกเปลี่ยนแปลงโดยแชทบอท เช่น ChatGPT ซึ่งพึ่งพาเทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP) และโมเดลภาษาขนาดใหญ่ (LLMs) เพื่อทำงานต่างๆ เช่น การสร้างโค้ด การแปลภาษา การสรุปข้อมูล และการวิเคราะห์ความรู้สึก

ศิลปะ

โลกของภาพถูกเปลี่ยนแปลงไปอย่างมากด้วยปัญญาประดิษฐ์สร้างสรรค์ โดยเฉพาะอย่างยิ่งหลังจากการแนะนำ DALL-E 2 ในปี 2022 เทคโนโลยีนี้สามารถสร้างภาพจากข้อความได้ และมีผลกระทบต่อทั้งด้านศิลปะและวิชาชีพ

การผลิตวิดีโอ

การผลิตวิดีโอยังคงอยู่ในช่วงเริ่มต้นของการประยุกต์ใช้ปัญญาประดิษฐ์สร้างสรรค์ แต่ก็แสดงให้เห็นถึงความก้าวหน้าที่น่าสนใจ แพลตฟอร์มต่างๆ เช่น Imagen Video, Meta Make A Video และ Runway Gen-2 กำลังผลักดันขอบเขตของสิ่งที่เป็นไปได้

การสร้างโค้ด

การเขียนโค้ดเป็นส่วนสำคัญของโลกดิจิทัลและไม่ได้รับผลกระทบจากปัญญาประดิษฐ์สร้างสรรค์น้อยกว่า แม้ว่า ChatGPT จะเป็นเครื่องมือที่นิยม แต่ก็มีการพัฒนาแอปพลิเคชัน AI อื่นๆ สำหรับการเขียนโค้ด เช่น GitHub Copilot, Alphacode และ CodeComplete

สรุป

การผสมผสานความคิดสร้างสรรค์ของมนุษย์กับการคำนวณของเครื่องจักรได้พัฒนาเป็นเครื่องมือที่มีคุณค่า โดยมีแพลตฟอร์ม เช่น ChatGPT และ DALL-E 2 ที่ผลักดันขอบเขตของสิ่งที่เป็นไปได้ ตั้งแต่การสร้างเนื้อหาข้อความไปจนถึงการสร้างภาพที่สวยงาม การประยุกต์ใช้เหล่านี้มีความหลากหลายและกว้างขวาง

ในขณะเดียวกัน การพิจารณาผลกระทบทางจริยธรรมก็มีความสำคัญเช่นกัน ในขณะที่ปัญญาประดิษฐ์สร้างสรรค์ให้ความสามารถสร้างสรรค์ที่ไม่มีขอบเขต มันสำคัญที่จะใช้มันอย่างรับผิดชอบ โดยตระหนักถึงความเสี่ยงของความลำเอียงและพลังของการบิดเบือนข้อมูล

ด้วยเครื่องมือ เช่น ChatGPT ที่เข้าถึงได้มากขึ้น นี่คือเวลาที่เหมาะสมที่จะทดลองและสำรวจ โลกของปัญญาประดิษฐ์สร้างสรรค์เต็มไปด้วยโอกาสที่รอการสำรวจ ไม่ว่าคุณจะเป็นศิลปิน นักเขียนโค้ด หรือผู้ที่หลงใหลในเทคโนโลยี ปฏิวัตินี้ไม่ได้อยู่บนขอบฟ้า แต่มันอยู่ที่นี่และตอนนี้ ดังนั้น จงลงมือสำรวจ!

ฉันใช้เวลาที่ผ่านมา 5 ปีในการศึกษาสิ่งที่น่าสนใจเกี่ยวกับ Machine Learning และ Deep Learning ความเชี่ยวชาญและความหลงใหลของฉันทำให้ฉันเข้าร่วมในโครงการพัฒนาซอฟต์แวร์มากกว่า 50 โครงการที่มีความหลากหลาย โดยมุ่งเน้นไปที่ AI/ML ความอยากรู้อยากเห็นของฉันยังทำให้ฉันสนใจในด้าน Natural Language Processing ซึ่งเป็นสาขาที่ฉันต้องการสำรวจต่อไป