sơ khai Xác định mức độ giám sát video thông qua dữ liệu Google Street View - Unite.AI
Kết nối với chúng tôi

Giám sát

Xác định mức độ giám sát video thông qua dữ liệu Google Street View

mm
cập nhật on

Phạm vi phủ sóng liên tục của Google Street View về các tuyến đường trên thế giới có thể đại diện cho bản ghi hình ảnh đầy đủ, nhất quán và mạch lạc nhất về xã hội toàn cầu, ngoại trừ các quốc gia áp đặt lệnh cấm trên các phương tiện thu thập dữ liệu lưu động của gã khổng lồ tìm kiếm.

Với tư cách là người đóng góp mang lại doanh thu cho cơ sở hạ tầng của Google Maps, panopticon của Google Street View là một đường nối dữ liệu phong phú để phân tích máy học. Bên cạnh xu hướng vô tình nắm bắt được các hành vi phạm tội, nó còn được sử dụng để ước tính thu nhập khu vực từ chất lượng ô tô trong hình ảnh Google Street View, đánh giá cây xanh trong môi trường đô thị, xác định cột điện, phân loại tòa nhàước tính thành phần nhân khẩu học của các khu dân cư Hoa Kỳ, trong số nhiều sáng kiến ​​​​khác.

Số liệu thống kê hạn chế về mức độ phổ biến của camera giám sát tại Hoa Kỳ

Mặc dù sử dụng rộng rãi dữ liệu của Google Maps cho các sáng kiến ​​máy học nhận thức về mặt xã hội, có rất ít bộ dữ liệu dựa trên Chế độ xem phố bao gồm các ví dụ về camera giám sát được dán nhãn. Các Bộ dữ liệu Mapillary Vistas là một trong số ít máy quay có sẵn cung cấp chức năng này, mặc dù nó bao gồm ít hơn 20 máy quay video công cộng được dán nhãn ở Hoa Kỳ.

Phần lớn cơ sở hạ tầng giám sát video ở Hoa Kỳ chỉ giao nhau với Tiểu bang khi các nhà chức trách yêu cầu cảnh quay chứng thực sau các sự cố cục bộ có thể đã được ghi lại. Ngoài các quy định về phân vùng và trong bối cảnh luật riêng tư dễ dãi không giải quyết được vấn đề giám sát riêng tư đối với không gian công cộng, còn có không có khuôn khổ hành chính liên bang có thể cung cấp số liệu thống kê cứng về số lượng máy ảnh hướng tới công chúng ở Hoa Kỳ.

Dữ liệu giai thoại và các cuộc khảo sát hạn chế cho rằng sự phổ biến của máy quay video ở Hoa Kỳ có thể ngang hàng với Trung Quốcnhưng không dễ chứng minh.

Xác định máy quay video trong Google Street View Images

Xem xét sự thiếu hụt dữ liệu có sẵn này, các nhà nghiên cứu từ Đại học Stanford đã tiến hành một nghiên cứu vào mức độ phổ biến, tần suất và phân phối của các máy quay video công cộng có thể được xác định trong hình ảnh Chế độ xem phố của Google.

Các nhà nghiên cứu đã tạo ra một khung phát hiện máy ảnh để đánh giá 1.6 triệu hình ảnh Chế độ xem phố của Google trên 10 thành phố lớn của Hoa Kỳ và XNUMX thành phố lớn khác ở Châu Á và Châu Âu.

Theo thứ tự mật độ camera giảm dần, Boston đứng đầu danh sách các thành phố của Hoa Kỳ được kiểm tra trong nghiên cứu, với mật độ gần đây hoặc hiện tại là 0.63 và tổng số camera là 1,600. Mặc dù vậy, Thành phố New York có nhiều camera hơn (10,100) được phân tán trên một khu vực rộng lớn hơn. Nguồn: https://arxiv.org/pdf/2105.01764.pdf

Theo thứ tự mật độ camera giảm dần, Boston đứng đầu danh sách các thành phố của Hoa Kỳ được kiểm tra trong nghiên cứu, với mật độ gần đây hoặc hiện tại là 0.63 và tổng số camera là 1,600. Mặc dù vậy, Thành phố New York có nhiều camera hơn (10,100) được phân tán trên một khu vực rộng lớn hơn. Nguồn: https://arxiv.org/pdf/2105.01764.pdf

Trong số các thành phố của Hoa Kỳ, Boston được cho là có tỷ lệ cao nhất mật độ của các máy ảnh được xác định, trong khi Thành phố New York có mức cao nhất con số của máy ảnh ở mức 10,100, trải rộng trên một khoảng cách lớn hơn. Ở châu Á, Tokyo có số lượng lớn 21,700 camera ước tính, nhưng Seoul có số lượng camera nhỏ hơn (13,900) tập trung với mật độ cao hơn nhiều. Mặc dù 13,000 máy ảnh đã được xác định cho hình ảnh Chế độ xem phố của Luân Đôn, Paris đánh bại điều này cả về vị trí được xác định (13,00) và mật độ phủ sóng.

Các nhà nghiên cứu quan sát thấy rằng mật độ camera rất khác nhau giữa các vùng lân cận và khu vực của thành phố.

Mật độ camera giám sát khắp các thành phố của Mỹ, theo nghiên cứu của Stanford năm 2021

Trong số các yếu tố hạn chế khác đối với độ chính xác của cuộc khảo sát (mà chúng ta sẽ đề cập đến), các nhà nghiên cứu nhận thấy rằng camera ở các khu dân cư khó xác định hơn gấp ba lần so với các camera đặt ở công viên công cộng, khu công nghiệp và khu hỗn hợp – có lẽ là bởi vì hiệu ứng 'răn đe' ngày càng bị phản đối hoặc gây tranh cãi trong các khu dân cư, khiến cho các vị trí ngụy trang hoặc kín đáo có nhiều khả năng xảy ra hơn.

Khi xem xét các thành phố được nghiên cứu ở châu Âu và châu Á, Seoul có vị trí quan trọng là môi trường đô thị được giám sát nhiều nhất, với Paris không xa phía sau.

Mật độ camera giám sát trên khắp các thành phố ở Mỹ, Châu Á và Châu Âu, theo nghiên cứu của Stanford.

Khi một khu vực có đa số dân tộc thiểu số hoặc dân tộc thiểu số được xác định theo điều tra dân số, thì tần suất đặt camera tăng đột biến, ngay cả khi các nhà nghiên cứu của Stanford đã tính đến tất cả các yếu tố giảm nhẹ.

Theo nghiên cứu của Stanford, tần suất camera giám sát tăng tỷ lệ thuận với sự gia tăng nhân khẩu học thiểu số trong một khu phố.

Theo nghiên cứu của Stanford, tần suất camera giám sát tăng tỷ lệ thuận với sự gia tăng nhân khẩu học thiểu số trong một khu phố.

Nghiên cứu được thực hiện trong hai khoảng thời gian, 2011–2015 và 2016–2020. Mặc dù dữ liệu cho thấy sự tăng trưởng nhất quán và đôi khi bất thường của vị trí đặt camera giám sát trong khoảng thời gian XNUMX năm, nhưng các nhà nghiên cứu cho rằng sự gia tăng của các camera giám sát này có thể đã đạt đến một 'cao nguyên tạm thời'.

Phương pháp luận

Ban đầu, các nhà nghiên cứu đã biên soạn hai bộ dữ liệu về hình ảnh Chế độ xem phố, một trong số đó không có vị trí máy quay video và tạo mặt nạ phân đoạn cho những bộ này. Một mô hình phân khúc đã được đào tạo trên các tập dữ liệu này dựa trên tập dữ liệu xác thực (của San Francisco – xem 'Các yếu tố giới hạn' bên dưới).

Sau đó, mô hình đầu ra được chạy với các hình ảnh Chế độ xem phố ngẫu nhiên, với tất cả các phát hiện tích cực của máy ảnh được xác nhận bởi con người và loại bỏ các kết quả tích cực sai.

Còn lại, hình ảnh thô từ Google Street View. Tiếp theo, mặt nạ phân đoạn được điều chỉnh. Thứ ba, nhận dạng máy ảnh có nguồn gốc từ thuật toán. Phải, một vị trí đã được con người xác minh.

Còn lại, hình ảnh thô từ Google Street View. Tiếp theo, mặt nạ phân đoạn được điều chỉnh. Thứ ba, nhận dạng máy ảnh có nguồn gốc từ thuật toán. Phải, một vị trí đã được con người xác minh.

Cuối cùng, khung tính toán trường nhìn của các góc máy ảnh liên quan để ước tính phạm vi bao phủ, đối chiếu với dấu chân của các tòa nhà liên quan và thông số kỹ thuật của mạng lưới đường bộ.

Dữ liệu đóng góp khác cho ma trận này bao gồm thông số kỹ thuật tòa nhà từ OpenStreetMap và việc sử dụng bản đồ điều tra dân số Hoa Kỳ để đảm bảo rằng nghiên cứu được giới hạn trong phạm vi hành chính của mỗi thành phố. Ngoài ra, dự án đã sử dụng dữ liệu vị trí máy ảnh San Francisco từ một nghiên cứu bởi Electronic Frontier Foundation (EFF), với hình ảnh Google Street View được truy cập thông qua API tĩnh.

Các nhà nghiên cứu đã ước tính phạm vi bao phủ bằng cách tính toán trường nhìn của máy ảnh Chế độ xem phố của Google dựa trên dữ liệu từ OpenStreetMap.

Các nhà nghiên cứu đã ước tính phạm vi bao phủ bằng cách tính toán trường nhìn của máy ảnh Chế độ xem phố của Google dựa trên dữ liệu từ OpenStreetMap.

Các yếu tố hạn chế

Các nhà nghiên cứu thừa nhận một số yếu tố hạn chế cần được xem xét khi xem xét kết quả.

Đầu tiên, tất cả các camera được xác định bởi hệ thống máy học sau đó đều được xác minh hoặc phủ nhận bởi quá trình đánh giá của con người và quá trình đánh giá này là một quy trình có thể sai sót.

Thứ hai, nghiên cứu bị giới hạn bởi độ phân giải có sẵn của hình ảnh Chế độ xem phố, điều này đã hạn chế các nhà nghiên cứu xác định máy ảnh được đặt trong phạm vi XNUMX mét tính từ góc nhìn. Điều này không chỉ có nghĩa là một số camera có thể đã được 'phát minh' thông qua độ phân giải hạn chế mà còn có nhiều camera nằm ngoài phạm vi này (chẳng hạn như camera cấp cao, vị trí bị che khuất và camera siêu nhỏ trong phụ kiện chuông cửa) có khả năng không được xác định.

Cuối cùng, việc ước tính khả năng thu hồi mô hình của thành phố cụ thể có thể là một yếu tố hạn chế về độ chính xác của kết quả, vì thành phố San Francisco, nơi tần suất camera giám sát đã được EFF dán nhãn trong công việc trước đó, đã được áp dụng cho các khu vực pháp lý khác để thực hiện nghiên cứu khả thi.