Giám sát
Xác Định Mức Độ Giám Sát Video Thông Qua Dữ Liệu Google Street View

Google Street View với phạm vi bao phủ liên tục các tuyến đường trên thế giới đại diện cho có lẽ là bản ghi hình ảnh toàn diện, nhất quán và mạch lạc nhất về xã hội toàn cầu, ngoại trừ các quốc gia áp đặt lệnh cấm đối với các phương tiện thu thập dữ liệu di động của gã khổng lồ tìm kiếm này. Là một đóng góp mang lại doanh thu cho cơ sở hạ tầng của Google Maps, nhà tù toàn cảnh Google Street View là một mạch dữ liệu phong phú cho phân tích học máy. Bên cạnh xu hướng vô tình ghi lại các hành vi phạm tội, nó đã được sử dụng để ước tính thu nhập khu vực từ chất lượng xe hơi trong hình ảnh Google Street View, đánh giá mảng xanh trong môi trường đô thị, nhận diện cột điện, phân loại tòa nhà và ước tính thành phần nhân khẩu học của các khu phố ở Mỹ, cùng nhiều sáng kiến khác.
Số Liệu Hạn Chế Về Sự Lan Tỏa Của Camera Giám Sát Tại Hoa Kỳ
Mặc dù dữ liệu Google Maps được sử dụng rộng rãi cho các sáng kiến học máy có nhận thức xã hội, nhưng có rất ít bộ dữ liệu dựa trên Street View bao gồm các ví dụ được gán nhãn về camera giám sát. Bộ dữ liệu Mapillary Vistas là một trong số ít có sẵn cung cấp chức năng này, mặc dù nó bao gồm chưa đến 20 camera video công cộng được gán nhãn tại Hoa Kỳ. Phần lớn cơ sở hạ tầng giám sát video ở Mỹ chỉ giao thoa với Nhà nước khi chính quyền yêu cầu cảnh quay xác thực sau các sự cố địa phương có thể đã được ghi lại. Ngoài các quy định về phân vùng, và trong bối cảnh luật riêng tư dễ dãi ít giải quyết việc giám sát tư nhân không gian công cộng, không có khuôn khổ hành chính liên bang nào có thể cung cấp số liệu thống kê chắc chắn về số lượng camera hướng ra công cộng ở Mỹ. Dữ liệu giai thoại và các cuộc khảo sát hạn chế cho rằng sự lan tỏa của camera video ở Mỹ có thể ngang bằng với Trung Quốc, nhưng không dễ để chứng minh.
Nhận Diện Camera Video Trong Hình Ảnh Google Street View
Xem xét sự thiếu hụt này trong dữ liệu có sẵn, các nhà nghiên cứu từ Đại học Stanford đã tiến hành một nghiên cứu về mức độ phổ biến, tần suất và phân bố của các camera video hướng ra công cộng có thể được xác định trong hình ảnh Google Street View. Các nhà nghiên cứu đã tạo ra một khuôn khổ phát hiện camera đánh giá 1,6 triệu hình ảnh Google Street View trên 10 thành phố lớn của Mỹ và sáu thành phố lớn khác ở châu Á và châu Âu.

Theo thứ tự giảm dần về mật độ camera, Boston đứng đầu danh sách các thành phố Mỹ được kiểm tra trong nghiên cứu, với mật độ gần đây hoặc hiện tại là 0,63 và tổng số camera là 1.600. Mặc dù vậy, Thành phố New York có nhiều camera hơn rất nhiều (10.100) được phân tán trên một diện tích lớn hơn. Nguồn: https://arxiv.org/pdf/2105.01764.pdf
Trong số các thành phố Mỹ, Boston được phát hiện có mật độ camera được xác định cao nhất, trong khi Thành phố New York có số lượng camera cao nhất là 10.100, trải rộng trên một khoảng cách lớn hơn. Ở châu Á, Tokyo có ước tính khổng lồ 21.700 camera, nhưng Seoul có số lượng camera ít hơn (13.900) tập trung dày đặc hơn nhiều. Mặc dù 13.000 camera được xác định cho hình ảnh Street View của London, Paris vượt qua con số này cả về số vị trí được xác định (13.000) và mật độ bao phủ. Các nhà nghiên cứu nhận thấy rằng mật độ camera thay đổi đáng kể giữa các khu phố và khu vực của các thành phố. 



Tần suất camera giám sát tăng tỷ lệ thuận với sự gia tăng nhân khẩu học thiểu số trong một khu phố, theo nghiên cứu của Stanford.
Nghiên cứu được tiến hành trong hai khoảng thời gian, 2011–2015 và 2016–2020. Mặc dù dữ liệu cho thấy sự tăng trưởng ổn định và đôi khi bất thường trong việc đặt camera giám sát trong khoảng thời gian chín năm, các nhà nghiên cứu cho rằng sự gia tăng này của camera giám sát có thể đã đạt đến một ‘cao nguyên tạm thời’.
Phương Pháp Luận
Các nhà nghiên cứu ban đầu biên soạn hai bộ dữ liệu hình ảnh Street View, một trong số đó không có vị trí đặt camera video, và tạo mặt nạ phân đoạn cho chúng. Một mô hình phân đoạn được huấn luyện trên các bộ dữ liệu này so với một bộ dữ liệu xác thực (của San Francisco – xem ‘Yếu Tố Hạn Chế’ bên dưới). Sau đó, mô hình đầu ra được chạy trên các hình ảnh Street View ngẫu nhiên, với tất cả các phát hiện camera dương tính được con người xác nhận và các dương tính giả bị loại bỏ.

Bên trái, hình ảnh thô từ Google Street View. Tiếp theo, mặt nạ phân đoạn đã điều chỉnh. Thứ ba, nhận diện camera được suy ra bằng thuật toán. Bên phải, vị trí đã được con người xác minh.
Cuối cùng, khuôn khổ tính toán trường nhìn của các góc camera liên quan để ước tính mức độ bao phủ, được tổng hợp so với mặt bằng của các tòa nhà liên quan và thông số kỹ thuật của mạng lưới đường bộ. 

Các nhà nghiên cứu ước tính mức độ bao phủ bằng cách tính toán trường nhìn của camera Google Street View so với dữ liệu từ OpenStreetMap.
Yếu Tố Hạn Chế
Các nhà nghiên cứu thừa nhận một số yếu tố hạn chế cần được xem xét khi đánh giá kết quả. Thứ nhất, các camera được hệ thống học máy xác định sau đó đều được xác minh hoặc phủ nhận bởi đánh giá của con người, và quá trình đánh giá này có thể sai sót. Thứ hai, nghiên cứu bị giới hạn bởi độ phân giải có sẵn của hình ảnh Street View, điều này giới hạn các nhà nghiên cứu trong việc xác định camera được đặt trong vòng ba mươi mét từ điểm nhìn. Điều này không chỉ có nghĩa là một số camera có thể đã được ‘tạo ra’ do độ phân giải hạn chế, mà còn có nghĩa là nhiều camera ngoài phạm vi này (chẳng hạn như camera cao tầng, vị trí bị che khuất và camera siêu nhỏ trong chuông cửa) có khả năng không được xác định. Cuối cùng, việc ước tính khả năng thu hồi mô hình cụ thể cho thành phố có thể là một yếu tố hạn chế về độ chính xác của kết quả, vì thành phố San Francisco, nơi tần suất camera giám sát đã được gán nhãn trong công trình trước đó từ EFF, đã được áp dụng cho các khu vực pháp lý khác để làm cho nghiên cứu khả thi.












