การเฝ้าระวัง

การกำหนดขอบเขตการเฝ้าระวังวิดีโอผ่านข้อมูล Google Street View

Published May 12, 2021

Updated April 28, 2026

Martin Anderson

การครอบคลุมอย่างต่อเนื่องของ Google Street View ทั่วถึงถนนสายหลักของโลกอาจเป็นตัวแทนของบันทึกภาพที่สมบูรณ์ที่สุด ที่สอดคล้องกันและเป็นรูปธรรมของสังคมโลก โดยไม่รวมประเทศที่ มีการห้าม ยานพาหนะที่รวบรวมข้อมูลของยักษ์ใหญ่ค้นหา

ในฐานะผู้ร่วมให้ข้อมูลที่สร้างรายได้ให้กับโครงสร้างพื้นฐานของ Google Maps โครงข่ายการเฝ้าระวังของ Google Street View เป็นแหล่งข้อมูลที่มีคุณค่าสำหรับการวิเคราะห์โดยใช้เครื่องจักรเรียนรู้ นอกจากความสามารถในการบันทึกการกระทำทางอาญาโดยไม่ตั้งใจแล้ว ยังใช้เพื่อ ประมาณรายได้ระดับภูมิภาค จากคุณภาพรถยนต์ในภาพ Google Street View ประเมินพื้นที่สีเขียว ในสภาพแวดล้อมเมือง ระบุตำแหน่งเสาไฟฟ้า จำแนกอาคาร และ ประมาณการ ส่วนผสมทางประชากรของย่านชุมชนในสหรัฐอเมริกา เป็นต้น

สถิติที่จำกัดเกี่ยวกับการแพร่กระจายของกล้องวงจรปิดในสหรัฐอเมริกา

尽管มีการใช้ข้อมูล Google Maps อย่างกว้างขวางสำหรับโครงการเครื่องจักรเรียนรู้ที่ตระหนักถึงสังคม แต่มีชุดข้อมูลที่สร้างจาก Google Street View มีจำนวนไม่มากที่รวมตัวอย่างที่มีฉลากของกล้องวงจรปิด ชุดข้อมูล Mapillary Vistas เป็นหนึ่งในจำนวนน้อยที่มีฟังก์ชันนี้ โดยมีกล้องวงจรปิดสาธารณะที่มีฉลากน้อยกว่า 20 ตัวในสหรัฐอเมริกา

โครงสร้างพื้นฐานการเฝ้าระวังวิดีโอมากมายในสหรัฐอเมริกามีเพียงการเชื่อมต่อกับรัฐเมื่อเจ้าหน้าที่ต้องการภาพบันทึกหลังเหตุการณ์ท้องถิ่นที่อาจถูกบันทึก นอกเหนือจากข้อบังคับเกี่ยวกับการแบ่งพื้นที่ และในบริบทของกฎหมายความเป็นส่วนตัวที่อนุญาตให้มีการเฝ้าระวังส่วนตัวในพื้นที่สาธารณะ ไม่มี โครงสร้างการบริหารของรัฐบาลกลาง ที่สามารถให้ข้อมูลทางสถิติที่แน่นอนเกี่ยวกับจำนวนกล้องที่หันหน้าเข้าสาธารณะในสหรัฐอเมริกา

ข้อมูลเชิงอ้างอิงและสำรวจที่จำกัดระบุว่าการแพร่กระจายของกล้องวิดีโอมากมายในสหรัฐอเมริกาอาจ เทียบเท่ากับจีน แต่ไม่ใช่เรื่องที่พิสูจน์ได้ง่าย

การระบุกล้องวิดีโอในภาพ Google Street View

เมื่อพิจารณาถึงการขาดข้อมูลที่มีอยู่ นักวิจัยจากมหาวิทยาลัยสแตนฟอร์ดได้ ดำเนินการวิจัย เกี่ยวกับการแพร่กระจาย ความถี่ และการกระจายของกล้องวิดีโอที่หันหน้าเข้าสาธารณะที่สามารถระบุได้ในภาพ Google Street View

นักวิจัยได้สร้างเฟรมเวิร์กการตรวจจับกล้องที่ประเมินภาพ Google Street View จำนวน 1.6 ล้านภาพใน 10 เมืองใหญ่ของสหรัฐอเมริกา และ 6 เมืองใหญ่อื่น ๆ ในเอเชียและยุโรป

ในลำดับการจัดเรียงจากความหนาแน่นของกล้องที่สูงสุด บอสตันอยู่ในอันดับต้นของเมืองในสหรัฐอเมริกาที่มีการศึกษา โดยมีความหนาแน่นล่าสุดหรือปัจจุบันอยู่ที่ 0.63 และจำนวนกล้องทั้งหมดอยู่ที่ 1,600 แม้ว่านิวยอร์กซิตี้จะมีกล้องมากกว่า (10,100) ที่กระจายอยู่ในพื้นที่ที่กว้างขึ้น Source: https://arxiv.org/pdf/2105.01764.pdf

ของเมืองในสหรัฐอเมริกา บอสตันพบว่ามีความหนาแน่นสูงสุดของกล้องที่ระบุได้ ในขณะที่นิวยอร์กซิตี้มีจำนวนกล้องสูงสุด (10,100) ที่กระจายอยู่ในพื้นที่ที่กว้างขึ้น ในเอเชีย โตเกียวมีกล้องประมาณ 21,700 ตัว แต่โซลมีกล้องน้อยกว่า (13,900) ที่กระจายอยู่ในพื้นที่ที่หนาแน่นกว่า แม้ว่ากล้อง 13,000 ตัวจะถูกระบุในภาพ Google Street View ของลอนดอน แต่ปารีสก็สามารถเอาชนะทั้งสองด้านในแง่ของการวางกล้อง (13,00) และความหนาแน่นของการครอบคลุม

นักวิจัยสังเกตว่าความหนาแน่นของกล้องแตกต่างกันอย่างกว้างขวางระหว่างย่านและโซนของเมือง

ในบรรดาปัจจัยที่จำกัดอื่น ๆ สำหรับความแม่นยำของการสำรวจ (ซึ่งเราจะกล่าวถึงต่อไป) นักวิจัยสังเกตว่ากล้องในพื้นที่ที่อยู่อาศัยมีความยากในการระบุสามเท่าเมื่อเทียบกับกล้องที่ติดตั้งในสวนสาธารณะ พื้นที่อุตสาหกรรม และพื้นที่ใช้สอยผสม – โดยสมมติว่า ‘ผลกระทบต่อการป้องกัน’ มีการใช้งานที่ไม่เหมาะสมหรือมีข้อขัดแย้งในพื้นที่ที่อยู่อาศัย ทำให้การวางกล้องที่ซ่อนอยู่หรือไม่เด่นชัดมีความน่าจะเป็นสูง

เมื่อพิจารณาจากเมืองที่ศึกษาในยุโรปและเอเชีย โซลมีอันดับหนึ่งในฐานะสภาพแวดล้อมเมืองที่มีการเฝ้าระวังมากที่สุด โดยปารีสไม่ห่างไกล

ความหนาแน่นของกล้องวงจรปิดทั่วเมืองในสหรัฐอเมริกา เอเชีย และยุโรป ตามการวิจัยของสแตนฟอร์ด

เมื่อใดก็ตามที่โซนมีประชากรส่วนใหญ่ที่เป็นชนกลุ่มน้อยหรือชนพื้นเมืองตามที่กำหนดโดยการสำรวจประชากร ความถี่ของการวางกล้องจะเพิ่มขึ้นอย่างมีนัยสำคัญ แม้ว่าจะมีการพิจารณาปัจจัยที่ชดเชยทั้งหมดโดยนักวิจัยของสแตนฟอร์ด

ความถี่ของกล้องวงจรปิดเพิ่มขึ้นตามสัดส่วนโดยตรงกับประชากรชนกลุ่มน้อยที่เพิ่มขึ้นในย่านชุมชน ตามการวิจัยของสแตนฟอร์ด

การวิจัยนี้ได้รับการดำเนินการในช่วงสองช่วงเวลา 2011–2015 และ 2016–2020 แม้ว่าข้อมูลจะแสดงการเติบโตที่สม่ำเสมอและบางครั้งผิดปกติของการวางกล้องวงจรปิดในช่วงเก้าปี นักวิจัยชี้ว่าการแพร่กระจายของกล้องวงจรปิดอาจได้ถึง ‘จุดสูงสุดชั่วคราว’

วิธีการ

นักวิจัยได้รวบรวมชุดข้อมูลสองชุดของภาพ Google Street View ชุดหนึ่งไม่มีการวางกล้องวิดีโอ และสร้างมาสก์สำหรับการแบ่งส่วนของภาพเหล่านี้ โมเดลการแบ่งส่วนได้รับการฝึกฝนจากชุดข้อมูลเหล่านี้เทียบกับชุดข้อมูลการตรวจสอบ (ของซานฟรานซิสโก – ดู ‘ปัจจัยที่จำกัด’ ด้านล่าง)

จากนั้นโมเดลเอาต์พุตได้รับการดำเนินการกับภาพ Google Street View ที่เลือกแบบสุ่ม โดยมีการยืนยันการตรวจจับกล้องที่เป็นบวกโดยมนุษย์และการลบการตรวจจับที่เป็นเท็จ

ซ้าย ภาพดั้งเดิมจาก Google Street View tiếp theo มาสก์แบ่งส่วนแบบปรับเปลี่ยน ต่อไป การระบุกล้องโดยใช้แอลกอริทึม สุดท้าย การวางกล้องที่ได้รับการยืนยันโดยมนุษย์

สุดท้าย เฟรมเวิร์กได้คำนวณมุมมองของมุมกล้องที่เกี่ยวข้องเพื่อประมาณการขอบเขตการครอบคลุม โดยรวบรวมข้อมูลกับพื้นที่อาคารที่เกี่ยวข้องและข้อมูลเกี่ยวกับเครือข่ายถนน

ข้อมูลอื่น ๆ ที่มีส่วนช่วยในการสร้างเมทริกซ์นี้รวมถึงข้อมูลเกี่ยวกับอาคารจาก OpenStreetMap และการใช้แผนที่สำรวจประชากรของสหรัฐอเมริกาเพื่อให้แน่ใจว่าการศึกษานี้ถูกจำกัดไว้ภายในขอบเขตการบริหารของเมืองแต่ละเมือง นอกจากนี้ โครงการนี้ยังใช้ข้อมูลตำแหน่งกล้องของซานฟรานซิสโกจาก การศึกษา โดยมูลนิธิ Electronic Frontier Foundation (EFF) โดยมีการเข้าถึงภาพ Google Street View ผ่าน Static API

นักวิจัยได้ประมาณการการครอบคลุมโดยการคำนวณมุมมองของกล้อง Google Street View เทียบกับข้อมูลจาก OpenStreetMap

ปัจจัยที่จำกัด

นักวิจัยยอมรับปัจจัยที่จำกัดหลายประการซึ่งควรพิจารณาเมื่อตรวจสอบผลลัพธ์

ประการแรก คือกล้องที่ระบุโดยระบบการเรียนรู้ของเครื่องจักรได้รับการยืนยันหรือการปฏิเสธโดยการตรวจสอบของมนุษย์ และการตรวจสอบนี้เป็นกระบวนการที่มีข้อผิดพลาด

ประการที่สอง การศึกษานี้ถูกจำกัดโดยความละเอียดที่มีอยู่ของภาพ Google Street View ซึ่งจำกัดนักวิจัยให้ระบุกล้องที่วางภายในระยะ 30 เมตรจากจุดมุ่งเน้น ซึ่งไม่เพียงแต่หมายความว่ากล้องบางตัวอาจถูก ‘สร้างขึ้น’ ผ่านความละเอียดที่จำกัด แต่ยังหมายความว่ากล้องหลายตัวที่อยู่นอกขอบเขตนี้ (เช่น กล้องระดับสูง การวางกล้องที่ซ่อนอยู่ และกล้องขนาดเล็กในอุปกรณ์doorbell) ไม่น่าจะถูกระบุ

สุดท้าย การประมาณการผลลัพธ์ของแบบจำลองเฉพาะเมืองอาจเป็นปัจจัยที่จำกัดความแม่นยำของผลลัพธ์ เนื่องจากเมืองซานฟรานซิสโก ซึ่งมีการระบุความถี่ของกล้องวงจรปิดในงานก่อนหน้าของ EFF ได้รับการนำไปใช้กับเขตอำนาจศาลอื่น ๆ เพื่อให้การศึกษานี้เป็นไปได้