ต้นขั้ว การกำหนดขอบเขตของการเฝ้าระวังวิดีโอผ่านข้อมูล Google Street View - Unite.AI
เชื่อมต่อกับเรา

การตรวจตรา

การกำหนดขอบเขตของการเฝ้าระวังวิดีโอผ่านข้อมูล Google Street View

mm
วันที่อัพเดท on

การครอบคลุมเส้นทางสัญจรทั่วโลกอย่างต่อเนื่องของ Google Street View แสดงถึงการบันทึกภาพสังคมโลกที่สมบูรณ์ สอดคล้องและเชื่อมโยงกันมากที่สุด ยกเว้นประเทศที่ กำหนดข้อห้าม บนยานพาหนะรวบรวมข้อมูลของยักษ์ใหญ่ด้านการค้นหา

ในฐานะผู้สร้างรายได้ให้กับโครงสร้างพื้นฐานของ Google Maps panopticon ของ Google Street View จึงเป็นรอยต่อข้อมูลที่สมบูรณ์สำหรับการวิเคราะห์การเรียนรู้ของเครื่อง นอกจากความโน้มเอียงที่จะจับกุมการกระทำผิดทางอาญาโดยไม่รู้ตัวแล้ว ยังเคยชินกับมันด้วย ประมาณการรายได้ของภูมิภาค จากคุณภาพรถในภาพ Google Street View ประเมินความเขียวขจี ในสภาพแวดล้อมในเมือง ระบุเสาไฟฟ้า, จำแนกประเภทอาคาร และ ประมาณการ ส่วนประกอบทางประชากรศาสตร์ของย่านต่างๆ ในสหรัฐอเมริกา ท่ามกลางความคิดริเริ่มอื่นๆ อีกมากมาย

สถิติที่จำกัดเกี่ยวกับการแพร่กระจายของกล้องวงจรปิดในสหรัฐอเมริกา

แม้จะมีการใช้ข้อมูล Google Maps อย่างกว้างขวางสำหรับโครงการริเริ่มการเรียนรู้ด้วยเครื่องที่ตระหนักรู้ทางสังคม แต่ก็มีชุดข้อมูลแบบ Street View น้อยมากที่มีตัวอย่างกล้องวงจรปิดที่ติดป้ายไว้ เดอะ ชุดข้อมูล Mapillary Vistas เป็นหนึ่งในจำนวนน้อยที่มีฟังก์ชันนี้ แม้ว่าจะมีกล้องวิดีโอสาธารณะที่มีป้ายกำกับน้อยกว่า 20 ตัวในสหรัฐอเมริกา

โครงสร้างพื้นฐานกล้องวงจรปิดส่วนใหญ่ในสหรัฐฯ จะตัดผ่านรัฐเมื่อเจ้าหน้าที่ต้องการฟุตเทจยืนยันหลังจากเหตุการณ์ในท้องถิ่นที่อาจได้รับการบันทึกไว้ นอกเหนือจากข้อบังคับการแบ่งเขตและในบริบทของกฎหมายความเป็นส่วนตัวที่อนุญาตซึ่งแทบไม่มีการจัดการกับการสอดแนมพื้นที่สาธารณะส่วนตัว ไม่มีกรอบการบริหารของรัฐบาลกลาง ที่สามารถให้สถิติที่ชัดเจนเกี่ยวกับจำนวนกล้องที่เปิดเผยต่อสาธารณะในสหรัฐอเมริกา

ข้อมูลโดยสังเขปและการสำรวจที่จำกัดยืนยันว่ากล้องวิดีโออาจแพร่ระบาดในสหรัฐอเมริกา ทัดเทียมกับจีนแต่ก็ไม่ง่ายที่จะพิสูจน์

การระบุกล้องวิดีโอในภาพ Google Street View

เมื่อพิจารณาถึงการขาดแคลนข้อมูลที่มีอยู่ นักวิจัยจากมหาวิทยาลัยสแตนฟอร์ดได้ ดำเนินการศึกษา ความแพร่หลาย ความถี่ และการกระจายของกล้องวิดีโอที่เปิดเผยต่อสาธารณะซึ่งสามารถระบุได้ในภาพ Google Street View

นักวิจัยได้สร้างกรอบการตรวจจับของกล้องที่ประเมินภาพ Google Street View จำนวน 1.6 ล้านภาพใน 10 เมืองใหญ่ของสหรัฐฯ และอีก XNUMX เมืองใหญ่ในเอเชียและยุโรป

ในลำดับความหนาแน่นของกล้องจากมากไปน้อย บอสตันอยู่ในอันดับต้น ๆ ของรายชื่อเมืองในสหรัฐอเมริกาที่ตรวจสอบในการวิจัย โดยมีความหนาแน่นล่าสุดหรือปัจจุบันที่ 0.63 และจำนวนกล้องทั้งหมด 1,600 ตัว อย่างไรก็ตาม นิวยอร์กซิตี้มีกล้องมากกว่า (10,100 ตัว) กระจายอยู่ทั่วบริเวณ ที่มา: https://arxiv.org/pdf/2105.01764.pdf

ในลำดับความหนาแน่นของกล้องจากมากไปน้อย บอสตันอยู่ในอันดับต้น ๆ ของรายชื่อเมืองในสหรัฐอเมริกาที่ตรวจสอบในการวิจัย โดยมีความหนาแน่นล่าสุดหรือปัจจุบันที่ 0.63 และจำนวนกล้องทั้งหมด 1,600 ตัว อย่างไรก็ตาม นิวยอร์กซิตี้มีกล้องมากกว่า (10,100 ตัว) กระจายอยู่ทั่วบริเวณ ที่มา: https://arxiv.org/pdf/2105.01764.pdf

ในบรรดาเมืองต่างๆ ของสหรัฐฯ บอสตันเป็นเมืองที่สูงที่สุด ของกล้องที่ระบุในขณะที่นิวยอร์กซิตี้มีสูงสุด จำนวน ของกล้องที่ 10,100 กระจายไปในระยะทางที่ไกลขึ้น ในเอเชีย โตเกียวมีกล้องประมาณ 21,700 ตัว แต่โซลมีจำนวนกล้องน้อยกว่า (13,900 ตัว) กระจุกตัวหนาแน่นกว่ามาก แม้ว่าจะมีการระบุกล้อง 13,000 ตัวสำหรับภาพ Street View ของลอนดอน แต่ปารีสก็เอาชนะสิ่งนี้ทั้งในแง่ของตำแหน่งที่ระบุ (13,00) และความหนาแน่นของการครอบคลุม

นักวิจัยสังเกตเห็นว่าความหนาแน่นของกล้องแตกต่างกันอย่างมากระหว่างย่านและโซนของเมือง

ความหนาแน่นของกล้องวงจรปิดในเมืองต่างๆ ของสหรัฐฯ จากการวิจัยของสแตนฟอร์ดในปี 2021

ท่ามกลางปัจจัยจำกัดอื่นๆ สำหรับความแม่นยำของแบบสำรวจ (ซึ่งเราจะกล่าวถึง) นักวิจัยสังเกตว่ากล้องในพื้นที่พักอาศัยนั้นยากต่อการระบุมากกว่ากล้องที่อยู่ในสวนสาธารณะ พื้นที่อุตสาหกรรม และเขตการใช้งานผสมถึง XNUMX เท่า ซึ่งสันนิษฐานได้ว่า เนื่องจากเอฟเฟกต์ 'ยับยั้ง' เป็นสิ่งที่น่ารังเกียจหรือขัดแย้งมากขึ้นในเขตที่อยู่อาศัย ทำให้การพรางตัวหรือตำแหน่งที่รอบคอบมีแนวโน้มมากขึ้น

เมื่อพิจารณาถึงเมืองที่ศึกษาในยุโรปและเอเชียแล้ว กรุงโซลมีสภาพแวดล้อมในเมืองที่ได้รับการเฝ้าระวังมากที่สุด โดยมีปารีสอยู่ไม่ไกล

ความหนาแน่นของกล้องวงจรปิดในเมืองต่างๆ ในสหรัฐอเมริกา เอเชีย และยุโรป จากการวิจัยของสแตนฟอร์ด

เมื่อโซนหนึ่งมีประชากรกลุ่มชาติพันธุ์หรือชนกลุ่มน้อยตามการสำรวจสำมะโนประชากร ความถี่ของการจัดวางกล้องจะพุ่งสูงขึ้นอย่างเห็นได้ชัด แม้จะมีปัจจัยบรรเทาทั้งหมดที่นำมาพิจารณาโดยนักวิจัยของสแตนฟอร์ดก็ตาม

ความถี่ของกล้องวงจรปิดเพิ่มขึ้นตามสัดส่วนโดยตรงกับประชากรกลุ่มน้อยที่เพิ่มขึ้นในละแวกใกล้เคียง จากการวิจัยของสแตนฟอร์ด

ความถี่ของกล้องวงจรปิดเพิ่มขึ้นตามสัดส่วนโดยตรงกับประชากรกลุ่มน้อยที่เพิ่มขึ้นในละแวกใกล้เคียง จากการวิจัยของสแตนฟอร์ด

การวิจัยดำเนินการในสองช่วงเวลาคือ 2011–2015 และ 2016–2020 แม้ว่าข้อมูลดังกล่าวจะแสดงให้เห็นการเติบโตของตำแหน่งกล้องวงจรปิดอย่างสม่ำเสมอและบางครั้งก็ผิดปกติในช่วงระยะเวลาเก้าปี แต่นักวิจัยแนะนำว่าการเพิ่มจำนวนของกล้องวงจรปิดนี้อาจถึง 'ที่ราบสูงชั่วคราว'

ระเบียบวิธี

ในตอนแรก นักวิจัยได้รวบรวมชุดข้อมูล XNUMX ชุดของภาพ Street View ชุดหนึ่งไม่มีตำแหน่งของกล้องวิดีโอ และสร้างมาสก์แบ่งส่วนสำหรับชุดข้อมูลเหล่านี้ โมเดลการแบ่งกลุ่มได้รับการฝึกอบรมในชุดข้อมูลเหล่านี้เทียบกับชุดข้อมูลการตรวจสอบความถูกต้อง (ของซานฟรานซิสโก – ดู 'ปัจจัยจำกัด' ด้านล่าง)

จากนั้นโมเดลผลลัพธ์จะถูกเรียกใช้กับภาพ Street View แบบสุ่ม โดยการตรวจหากล้องที่เป็นบวกทั้งหมดได้รับการยืนยันโดยมนุษย์ และนำผลบวกปลอมออก

ซ้าย ภาพดิบจาก Google Street View ถัดไป มาสก์การแบ่งส่วนที่ได้รับการดัดแปลง ประการที่สาม การระบุกล้องที่ได้มาจากอัลกอริทึม ใช่ ตำแหน่งที่ยืนยันโดยมนุษย์

ซ้าย ภาพดิบจาก Google Street View ถัดไป มาสก์การแบ่งส่วนที่ได้รับการดัดแปลง ประการที่สาม การระบุกล้องที่ได้มาจากอัลกอริทึม ใช่ ตำแหน่งที่ยืนยันโดยมนุษย์

ประการสุดท้าย กรอบนี้คำนวณขอบเขตการมองเห็นของมุมกล้องที่เกี่ยวข้องเพื่อประเมินขอบเขตการครอบคลุม เทียบกับรอยเท้าของอาคารที่เกี่ยวข้อง และข้อกำหนดของเครือข่ายถนน

ข้อมูลอื่นๆ ที่สนับสนุนสำหรับเมทริกซ์นี้รวมถึงข้อกำหนดเฉพาะของอาคารจาก OpenStreetMap และการใช้แผนที่สำมะโนประชากรของสหรัฐฯ เพื่อให้แน่ใจว่าการศึกษาจำกัดอยู่ในเขตการปกครองของแต่ละเมือง นอกจากนี้ โครงการยังใช้ข้อมูลตำแหน่งของกล้องในซานฟรานซิสโกจาก ศึกษา โดย Electronic Frontier Foundation (EFF) โดยสามารถเข้าถึงภาพ Google Street View ผ่านทาง API แบบคงที่.

นักวิจัยประเมินความครอบคลุมโดยการคำนวณขอบเขตการมองเห็นของกล้อง Google Street View กับข้อมูลจาก OpenStreetMap

นักวิจัยประเมินความครอบคลุมโดยการคำนวณขอบเขตการมองเห็นของกล้อง Google Street View กับข้อมูลจาก OpenStreetMap

ปัจจัย จำกัด

นักวิจัยยอมรับปัจจัยจำกัดหลายประการที่ควรพิจารณาเมื่อตรวจสอบผลลัพธ์

ประการแรก กล้องที่ระบุโดยระบบแมชชีนเลิร์นนิงนั้นได้รับการตรวจสอบหรือปฏิเสธโดยการตรวจสอบของมนุษย์ในภายหลัง และการตรวจสอบนี้เป็นกระบวนการที่ผิดพลาด

ประการที่สอง การศึกษาถูกจำกัดด้วยความละเอียดที่มีอยู่ของภาพ Street View ซึ่งจำกัดนักวิจัยในการระบุกล้องที่วางในระยะสามสิบเมตรจาก POV นี่ไม่เพียงหมายความว่ากล้องบางตัวอาจถูก 'ประดิษฐ์ขึ้น' ด้วยความละเอียดที่จำกัด แต่ยังรวมถึงกล้องหลายตัวที่อยู่นอกขอบเขตนี้ (เช่น กล้องระดับสูง ตำแหน่งที่ถูกบดบัง และกล้องขนาดเล็กในอุปกรณ์กริ่งประตู) มีแนวโน้มที่จะไม่ได้รับการระบุ

ประการสุดท้าย การประมาณค่าการเรียกคืนแบบจำลองเฉพาะเมืองอาจเป็นปัจจัยจำกัดความแม่นยำของผลลัพธ์ เนื่องจากเมืองซานฟรานซิสโกซึ่งมีการระบุความถี่ของกล้องวงจรปิดไว้ในงานก่อนหน้านี้จาก EFF แล้ว ถูกนำไปใช้กับเขตอำนาจศาลอื่นๆ เพื่อทำให้ การศึกษาเป็นไปได้