ต้นขั้ว Google เผยการใช้ข้อมูลเว็บสาธารณะในการฝึกอบรม AI - Unite.AI
เชื่อมต่อกับเรา

จริยธรรม

Google เผยการใช้ข้อมูลเว็บสาธารณะในการฝึกอบรม AI

การตีพิมพ์

 on

ในการอัปเดตนโยบายความเป็นส่วนตัวล่าสุด Google ได้ยอมรับอย่างเปิดเผยว่าใช้ข้อมูลที่เปิดเผยต่อสาธารณะจากเว็บเพื่อฝึกโมเดล AI การเปิดเผยนี้พบโดย Gizmodoรวมถึงบริการต่างๆ เช่น Bard และ Cloud AI Christa Muldoon โฆษกของ Google กล่าวกับ Verge การอัปเดตเป็นเพียงการชี้แจงว่าบริการใหม่ๆ เช่น Bard รวมอยู่ในแนวทางปฏิบัตินี้ด้วย และ Google ได้รวมหลักการความเป็นส่วนตัวและการป้องกันเข้ากับการพัฒนาเทคโนโลยี AI ของตน

ความโปร่งใสในแนวทางปฏิบัติในการฝึกอบรม AI เป็นขั้นตอนในทิศทางที่ถูกต้อง แต่ก็ก่อให้เกิดคำถามมากมายเช่นกัน Google รับรองความเป็นส่วนตัวของบุคคลอย่างไรเมื่อใช้ข้อมูลที่เปิดเผยต่อสาธารณะ มีมาตรการอะไรบ้างเพื่อป้องกันการใช้ข้อมูลในทางที่ผิด?

ความหมายของวิธีการฝึกอบรม AI ของ Google

นโยบายความเป็นส่วนตัวที่อัปเดตระบุว่า Google ใช้ข้อมูลเพื่อปรับปรุงบริการและพัฒนาผลิตภัณฑ์ คุณลักษณะ และเทคโนโลยีใหม่ๆ ที่เป็นประโยชน์ต่อผู้ใช้และสาธารณะ นโยบายยังระบุด้วยว่าบริษัทอาจใช้ข้อมูลที่เปิดเผยต่อสาธารณะเพื่อฝึกโมเดล AI ของ Google และสร้างผลิตภัณฑ์และฟีเจอร์ต่างๆ เช่น ความสามารถของ Google Translate, Bard และ Cloud AI

อย่างไรก็ตาม นโยบายนี้ไม่ได้ชี้แจงว่า Google จะป้องกันไม่ให้รวมเนื้อหาที่มีลิขสิทธิ์ไว้ในกลุ่มข้อมูลที่ใช้สำหรับการฝึกอบรมได้อย่างไร เว็บไซต์ที่เข้าถึงได้ทั่วไปหลายแห่งมีนโยบายที่ห้ามการรวบรวมข้อมูลหรือการขูดเว็บเพื่อวัตถุประสงค์ในการฝึกอบรมโมเดลภาษาขนาดใหญ่และชุดเครื่องมือ AI อื่นๆ แนวทางนี้อาจขัดแย้งกับข้อบังคับสากล เช่น GDPR ที่ปกป้องผู้คนจากข้อมูลของพวกเขาที่ถูกนำไปใช้ในทางที่ผิดโดยไม่ได้รับอนุญาตอย่างชัดแจ้ง

การใช้ข้อมูลที่เปิดเผยต่อสาธารณะสำหรับการฝึกอบรม AI นั้นไม่ได้เป็นปัญหาโดยเนื้อแท้ แต่จะกลายเป็นปัญหาเมื่อละเมิดกฎหมายลิขสิทธิ์และความเป็นส่วนตัวส่วนบุคคล เป็นความสมดุลที่ละเอียดอ่อนซึ่งบริษัทต่างๆ เช่น Google ต้องดำเนินการอย่างระมัดระวัง

ผลกระทบที่กว้างขึ้นของแนวทางปฏิบัติในการฝึกอบรม AI

การใช้ข้อมูลที่เปิดเผยต่อสาธารณะสำหรับการฝึกอบรม AI เป็นปัญหาที่ถกเถียงกัน ระบบ AI กำเนิดยอดนิยมเช่น GPT-4 ของ OpenAI นั้นไม่ค่อยสนใจเกี่ยวกับแหล่งข้อมูลของพวกเขา และไม่ว่าพวกเขาจะรวมโพสต์บนโซเชียลมีเดียหรืองานที่มีลิขสิทธิ์โดยศิลปินและนักเขียนที่เป็นมนุษย์หรือไม่ ปัจจุบันการปฏิบัตินี้อยู่ในพื้นที่สีเทาทางกฎหมาย ก่อให้เกิดการฟ้องร้องต่างๆ และทำให้ฝ่ายนิติบัญญัติในบางประเทศออกกฎหมายที่เข้มงวดมากขึ้นเพื่อควบคุมวิธีที่บริษัท AI รวบรวมและใช้ข้อมูลการฝึกอบรมของพวกเขา

Gannett ผู้จัดพิมพ์หนังสือพิมพ์รายใหญ่ที่สุดในสหรัฐอเมริกากำลังฟ้องร้อง Google และบริษัทแม่อย่าง Alphabet โดยอ้างว่าความก้าวหน้าในเทคโนโลยี AI ช่วยให้ยักษ์ใหญ่ด้านการค้นหาสามารถผูกขาดตลาดโฆษณาดิจิทัลได้ ในขณะเดียวกัน แพลตฟอร์มโซเชียลเช่น Twitter และ Reddit ได้ใช้มาตรการเพื่อป้องกันไม่ให้บริษัทอื่น ๆ เก็บเกี่ยวข้อมูลของตนอย่างอิสระ ซึ่งนำไปสู่การฟันเฟืองจากชุมชนของตน

การพัฒนาเหล่านี้เน้นย้ำถึงความจำเป็นของแนวทางด้านจริยธรรมที่ชัดเจนใน AI ในขณะที่ AI มีการพัฒนาอย่างต่อเนื่อง สิ่งสำคัญสำหรับบริษัทคือการสร้างความสมดุลระหว่างความก้าวหน้าทางเทคโนโลยีกับการพิจารณาด้านจริยธรรม ซึ่งรวมถึงการเคารพกฎหมายลิขสิทธิ์ การปกป้องความเป็นส่วนตัวส่วนบุคคล และการทำให้แน่ใจว่า AI เป็นประโยชน์ต่อสังคมทั้งหมด ไม่ใช่แค่ส่วนน้อยเท่านั้น

การอัปเดตนโยบายความเป็นส่วนตัวล่าสุดของ Google ได้ให้ความกระจ่างเกี่ยวกับแนวทางปฏิบัติในการฝึกอบรม AI ของบริษัท อย่างไรก็ตาม ยังทำให้เกิดคำถามเกี่ยวกับนัยทางจริยธรรมของการใช้ข้อมูลที่เปิดเผยต่อสาธารณะสำหรับการฝึกอบรม AI การละเมิดกฎหมายลิขสิทธิ์ที่อาจเกิดขึ้น และผลกระทบต่อความเป็นส่วนตัวของผู้ใช้ เมื่อเราก้าวไปข้างหน้า จำเป็นอย่างยิ่งที่เราจะต้องดำเนินการสนทนาต่อไปและทำงานเพื่ออนาคตที่ AI ได้รับการพัฒนาและใช้งานอย่างมีความรับผิดชอบ

Alex McFarland เป็นนักข่าวและนักเขียนด้าน AI ที่สำรวจการพัฒนาล่าสุดในด้านปัญญาประดิษฐ์ เขาได้ร่วมมือกับสตาร์ทอัพด้าน AI และสิ่งพิมพ์ต่างๆ มากมายทั่วโลก