ปัญญาประดิษฐ์
ปัญญาประดิษฐ์สร้างสรรค์: ความคิดเบื้องหลัง CHATGPT, Dall-E, Midjourney และอื่นๆ

โลกของศิลปะ การสื่อสาร และวิธีที่เราเข้าใจความเป็นจริงกำลังเปลี่ยนแปลงอย่างรวดเร็ว หากเรามองย้อนกลับไปในประวัติศาสตร์ของนวัตกรรมของมนุษย์ เราอาจพิจารณาการค้นพบการสร้างล้อหรือการค้นพบไฟฟ้าเป็นขั้นตอนสำคัญของมนุษย์ วันนี้ การปฏิวัติใหม่กำลังเกิดขึ้น โดยเชื่อมช่องว่างระหว่างความคิดสร้างสรรค์ของมนุษย์และการคำนวณของเครื่องจักร นั่นคือ ปัญญาประดิษฐ์สร้างสรรค์
แบบจำลองสร้างสรรค์ได้ทำให้เส้นแบ่งระหว่างมนุษย์และเครื่องจักรพร่ามพราว ด้วยการมาถึงของแบบจำลอง เช่น GPT-4 ซึ่งใช้โมดูลทรานส์ฟอร์เมอร์ เราได้เข้าใกล้การสร้างภาษาที่เป็นธรรมชาติและ豊富ด้วยบริบทมากขึ้น การพัฒนานี้ได้กระตุ้นให้เกิดการประยุกต์ใช้ในด้านการสร้างเอกสาร ระบบสนทนาของแชทบอท และแม้กระทั่งการประพันธ์เพลงสังเคราะห์
การตัดสินใจของบริษัทเทคโนโลยีขนาดใหญ่ในระยะหลังเน้นย้ำถึงความสำคัญของปัญญาประดิษฐ์สร้างสรรค์ Microsoft ได้ยกเลิกแอป Cortana ในเดือนนี้เพื่อเน้นไปที่นวัตกรรมปัญญาประดิษฐ์สร้างสรรค์ที่ใหม่กว่า เช่น Bing Chat Apple ก็ได้ลงทุนไปแล้วกว่า 22.6 พันล้านดอลลาร์ในงบประมาณการวิจัยและพัฒนาเพื่อสร้างสรรค์ปัญญาประดิษฐ์ตามที่ CEO Tim Cook ระบุ
ยุคใหม่ของแบบจำลอง: ปัญญาประดิษฐ์สร้างสรรค์เทียบกับแบบจำลองแบ่งแยก
เรื่องราวของปัญญาประดิษฐ์สร้างสรรค์ไม่ได้แค่เกี่ยวกับการประยุกต์ใช้ แต่เกี่ยวกับกลไกภายในของมันในระบบปัญญาประดิษฐ์ มีแบบจำลองสองประเภท: แบบจำลองแบ่งแยกและแบบจำลองสร้างสรรค์
แบบจำลองแบ่งแยกเป็นสิ่งที่ผู้คนพบเจอในชีวิตประจำวัน อัลกอริทึมเหล่านี้รับข้อมูลเข้า เช่น ข้อความหรือรูปภาพ และจับคู่มันกับผลลัพธ์ที่ต้องการ เช่น การแปลหรือการวินิจฉัยทางการแพทย์ มันเกี่ยวกับการทำแผนที่และการทำนาย
แบบจำลองสร้างสรรค์เป็นผู้สร้าง มันไม่เพียงแต่ทำนายหรือตีความ แต่ยังสร้างผลลัพธ์ใหม่ที่ซับซ้อนจากเวกเตอร์ของตัวเลขที่ไม่เกี่ยวข้องกับค่าในโลกแห่งความเป็นจริง
เทคโนโลยีเบื้องหลังแบบจำลองสร้างสรรค์
แบบจำลองสร้างสรรค์เป็นผลมาจากเครือข่ายประสาทเทียมที่ซับซ้อนซึ่งออกแบบมาเพื่อเลียนแบบการทำงานของสมองมนุษย์ โดยการเก็บและประมวลผลความแปรผันของข้อมูลที่ซับซ้อน เครือข่ายเหล่านี้เป็นรากฐานของแบบจำลองสร้างสรรค์หลายแบบ
แบบจำลองสร้างสรรค์ถูกสร้างขึ้นอย่างไร โดยทั่วไปจะถูกสร้างขึ้นโดยใช้เครือข่ายประสาทเทียมที่ถูกปรับให้เหมาะสมเพื่อจับข้อมูลที่ซับซ้อน ตัวอย่างที่ดีคือเครือข่าย Generative Adversarial (GAN) ซึ่งมีเครือข่ายประสาทเทียมสองตัว คือ ตัวสร้างและตัวแบ่งแยก ซึ่งแข่งขันกันและเรียนรู้จากกันในความสัมพันธ์แบบครู-นักเรียนที่ไม่เหมือนใคร ตั้งแต่การวาดภาพถึงการถ่ายโอนสไตล์ จากการประพันธ์เพลงถึงการเล่นเกม แบบจำลองเหล่านี้กำลังพัฒนาและขยายออกไปในทางที่ไม่เคยคิดมาก่อน
ปัญญาประดิษฐ์สร้างสรรค์ประเภท: ข้อความถึงข้อความ, ข้อความถึงรูปภาพ
ทรานส์ฟอร์เมอร์และโมเดลภาษาขนาดใหญ่
การมาถึงของโมเดลทรานส์ฟอร์เมอร์ได้เปลี่ยนแปลงวิธีการสร้างแบบจำลองข้อความใหม่ โดยการแนะนำแนวคิดของ “ความสนใจ” ซึ่งหมายถึงการมุ่งความสนใจไปที่ส่วนต่างๆ ของข้อความตามบริบท นี่ทำให้สามารถประมวลผลข้อความได้เร็วขึ้นและง่ายขึ้นเมื่อเทียบกับโครงสร้างแบบเก่าๆ เช่น RNN หรือ CNN
โมเดลภาษาขนาดใหญ่ (LLM) เช่น GPT-4, Bard และ LLaMA เป็นโครงสร้างขนาดใหญ่ที่ออกแบบมาเพื่อทำความเข้าใจและสร้างภาษาของมนุษย์ รหัส และอื่นๆ ขนาดที่ใหญ่ของโมเดลเหล่านี้เป็นหนึ่งในคุณลักษณะที่สำคัญที่สุด
สถานะของโมเดลภาษาขนาดใหญ่ (LLMs) ณ ปี 2023
| ชื่อโมเดล | ผู้พัฒนา | พารามิเตอร์ | ความพร้อมและเข้าถึง | คุณลักษณะและคำอธิบายที่สำคัญ |
| GPT-4 | OpenAI | 1.5 ล้านล้าน | ไม่เปิดเผยต้นฉบับ สามารถเข้าถึงได้ทาง API | มีประสิทธิภาพที่น่าประทับใจในหลายงาน สามารถประมวลผลรูปภาพและข้อความได้ ยาวสูงสุด 32,768 โทเคน |
การใช้โมเดลภาษาขนาดใหญ่ (LLMs)
LLMs สามารถใช้ได้ในหลายวิธี รวมถึง:
- การใช้โดยตรง: ใช้โมเดล LLM ที่ถูกฝึกฝนแล้วสำหรับการสร้างข้อความหรือประมวลผลข้อความ
- การปรับแต่ง: ปรับโมเดล LLM ที่ถูกฝึกฝนแล้วสำหรับงานเฉพาะ
- การค้นหาข้อมูล: ใช้ LLMs ในระบบที่ใหญ่ขึ้นเพื่อค้นหาและจัดประเภทข้อมูล
การประยุกต์ใช้ปัญญาประดิษฐ์สร้างสรรค์
โดเมนข้อความ
เริ่มต้นด้วยข้อความ ปัญญาประดิษฐ์สร้างสรรค์ได้ถูกเปลี่ยนแปลงโดยแชทบอท เช่น ChatGPT ซึ่งพึ่งพาเทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP) และโมเดลภาษาขนาดใหญ่ (LLMs) เพื่อทำงานต่างๆ เช่น การสร้างโค้ด การแปลภาษา การสรุปข้อมูล และการวิเคราะห์ความรู้สึก
ศิลปะ
โลกของภาพถูกเปลี่ยนแปลงไปอย่างมากด้วยปัญญาประดิษฐ์สร้างสรรค์ โดยเฉพาะอย่างยิ่งหลังจากการแนะนำ DALL-E 2 ในปี 2022 เทคโนโลยีนี้สามารถสร้างภาพจากข้อความได้ และมีผลกระทบต่อทั้งด้านศิลปะและวิชาชีพ
การผลิตวิดีโอ
การผลิตวิดีโอยังคงอยู่ในช่วงเริ่มต้นของการประยุกต์ใช้ปัญญาประดิษฐ์สร้างสรรค์ แต่ก็แสดงให้เห็นถึงความก้าวหน้าที่น่าสนใจ แพลตฟอร์มต่างๆ เช่น Imagen Video, Meta Make A Video และ Runway Gen-2 กำลังผลักดันขอบเขตของสิ่งที่เป็นไปได้
การสร้างโค้ด
การเขียนโค้ดเป็นส่วนสำคัญของโลกดิจิทัลและไม่ได้รับผลกระทบจากปัญญาประดิษฐ์สร้างสรรค์น้อยกว่า แม้ว่า ChatGPT จะเป็นเครื่องมือที่นิยม แต่ก็มีการพัฒนาแอปพลิเคชัน AI อื่นๆ สำหรับการเขียนโค้ด เช่น GitHub Copilot, Alphacode และ CodeComplete
สรุป
การผสมผสานความคิดสร้างสรรค์ของมนุษย์กับการคำนวณของเครื่องจักรได้พัฒนาเป็นเครื่องมือที่มีคุณค่า โดยมีแพลตฟอร์ม เช่น ChatGPT และ DALL-E 2 ที่ผลักดันขอบเขตของสิ่งที่เป็นไปได้ ตั้งแต่การสร้างเนื้อหาข้อความไปจนถึงการสร้างภาพที่สวยงาม การประยุกต์ใช้เหล่านี้มีความหลากหลายและกว้างขวาง
ในขณะเดียวกัน การพิจารณาผลกระทบทางจริยธรรมก็มีความสำคัญเช่นกัน ในขณะที่ปัญญาประดิษฐ์สร้างสรรค์ให้ความสามารถสร้างสรรค์ที่ไม่มีขอบเขต มันสำคัญที่จะใช้มันอย่างรับผิดชอบ โดยตระหนักถึงความเสี่ยงของความลำเอียงและพลังของการบิดเบือนข้อมูล
ด้วยเครื่องมือ เช่น ChatGPT ที่เข้าถึงได้มากขึ้น นี่คือเวลาที่เหมาะสมที่จะทดลองและสำรวจ โลกของปัญญาประดิษฐ์สร้างสรรค์เต็มไปด้วยโอกาสที่รอการสำรวจ ไม่ว่าคุณจะเป็นศิลปิน นักเขียนโค้ด หรือผู้ที่หลงใหลในเทคโนโลยี ปฏิวัตินี้ไม่ได้อยู่บนขอบฟ้า แต่มันอยู่ที่นี่และตอนนี้ ดังนั้น จงลงมือสำรวจ!












