Giám sát

Xác Định Mức Độ Giám Sát Video Thông Qua Dữ Liệu Google Street View

Published May 12, 2021

Updated March 16, 2026

Martin Anderson

Google Street View với phạm vi bao phủ liên tục các tuyến đường trên thế giới đại diện cho có lẽ là bản ghi hình ảnh toàn diện, nhất quán và mạch lạc nhất về xã hội toàn cầu, ngoại trừ các quốc gia áp đặt lệnh cấm đối với các phương tiện thu thập dữ liệu di động của gã khổng lồ tìm kiếm này. Là một đóng góp mang lại doanh thu cho cơ sở hạ tầng của Google Maps, nhà tù toàn cảnh Google Street View là một mạch dữ liệu phong phú cho phân tích học máy. Bên cạnh xu hướng vô tình ghi lại các hành vi phạm tội, nó đã được sử dụng để ước tính thu nhập khu vực từ chất lượng xe hơi trong hình ảnh Google Street View, đánh giá mảng xanh trong môi trường đô thị, nhận diện cột điện, phân loại tòa nhà và ước tính thành phần nhân khẩu học của các khu phố ở Mỹ, cùng nhiều sáng kiến khác.

Số Liệu Hạn Chế Về Sự Lan Tỏa Của Camera Giám Sát Tại Hoa Kỳ

Mặc dù dữ liệu Google Maps được sử dụng rộng rãi cho các sáng kiến học máy có nhận thức xã hội, nhưng có rất ít bộ dữ liệu dựa trên Street View bao gồm các ví dụ được gán nhãn về camera giám sát. Bộ dữ liệu Mapillary Vistas là một trong số ít có sẵn cung cấp chức năng này, mặc dù nó bao gồm chưa đến 20 camera video công cộng được gán nhãn tại Hoa Kỳ. Phần lớn cơ sở hạ tầng giám sát video ở Mỹ chỉ giao thoa với Nhà nước khi chính quyền yêu cầu cảnh quay xác thực sau các sự cố địa phương có thể đã được ghi lại. Ngoài các quy định về phân vùng, và trong bối cảnh luật riêng tư dễ dãi ít giải quyết việc giám sát tư nhân không gian công cộng, không có khuôn khổ hành chính liên bang nào có thể cung cấp số liệu thống kê chắc chắn về số lượng camera hướng ra công cộng ở Mỹ. Dữ liệu giai thoại và các cuộc khảo sát hạn chế cho rằng sự lan tỏa của camera video ở Mỹ có thể ngang bằng với Trung Quốc, nhưng không dễ để chứng minh.

Nhận Diện Camera Video Trong Hình Ảnh Google Street View

Xem xét sự thiếu hụt này trong dữ liệu có sẵn, các nhà nghiên cứu từ Đại học Stanford đã tiến hành một nghiên cứu về mức độ phổ biến, tần suất và phân bố của các camera video hướng ra công cộng có thể được xác định trong hình ảnh Google Street View. Các nhà nghiên cứu đã tạo ra một khuôn khổ phát hiện camera đánh giá 1,6 triệu hình ảnh Google Street View trên 10 thành phố lớn của Mỹ và sáu thành phố lớn khác ở châu Á và châu Âu.

Theo thứ tự giảm dần về mật độ camera, Boston đứng đầu danh sách các thành phố Mỹ được kiểm tra trong nghiên cứu, với mật độ gần đây hoặc hiện tại là 0,63 và tổng số camera là 1.600. Mặc dù vậy, Thành phố New York có nhiều camera hơn rất nhiều (10.100) được phân tán trên một diện tích lớn hơn. Nguồn: https://arxiv.org/pdf/2105.01764.pdf

Trong số các thành phố Mỹ, Boston được phát hiện có mật độ camera được xác định cao nhất, trong khi Thành phố New York có số lượng camera cao nhất là 10.100, trải rộng trên một khoảng cách lớn hơn. Ở châu Á, Tokyo có ước tính khổng lồ 21.700 camera, nhưng Seoul có số lượng camera ít hơn (13.900) tập trung dày đặc hơn nhiều. Mặc dù 13.000 camera được xác định cho hình ảnh Street View của London, Paris vượt qua con số này cả về số vị trí được xác định (13.000) và mật độ bao phủ. Các nhà nghiên cứu nhận thấy rằng mật độ camera thay đổi đáng kể giữa các khu phố và khu vực của các thành phố. Trong số các yếu tố hạn chế khác đối với độ chính xác của cuộc khảo sát (mà chúng ta sẽ đề cập), các nhà nghiên cứu nhận thấy rằng camera ở khu vực dân cư khó xác định gấp ba lần so với những camera được đặt ở công viên công cộng, khu vực công nghiệp và khu vực hỗn hợp – có lẽ vì hiệu ứng ‘răn đe’ ngày càng gây phản đối hoặc tranh cãi ở các khu dân cư, khiến việc đặt camera ngụy trang hoặc kín đáo có nhiều khả năng hơn. Xem xét các thành phố được nghiên cứu ở châu Âu và châu Á, Seoul giữ vị trí hàng đầu là môi trường đô thị bị giám sát nhiều nhất, với Paris không kém xa. Mật độ camera giám sát trên khắp các thành phố ở Mỹ, châu Á và châu Âu, theo nghiên cứu của Stanford. Ở những khu vực có đa số cư dân theo định nghĩa điều tra dân số là dân tộc hoặc thiểu số, tần suất đặt camera tăng đáng kể, ngay cả khi tất cả các yếu tố giảm nhẹ đã được các nhà nghiên cứu Stanford tính đến.

Tần suất camera giám sát tăng tỷ lệ thuận với sự gia tăng nhân khẩu học thiểu số trong một khu phố, theo nghiên cứu của Stanford.

Nghiên cứu được tiến hành trong hai khoảng thời gian, 2011–2015 và 2016–2020. Mặc dù dữ liệu cho thấy sự tăng trưởng ổn định và đôi khi bất thường trong việc đặt camera giám sát trong khoảng thời gian chín năm, các nhà nghiên cứu cho rằng sự gia tăng này của camera giám sát có thể đã đạt đến một ‘cao nguyên tạm thời’.

Phương Pháp Luận

Các nhà nghiên cứu ban đầu biên soạn hai bộ dữ liệu hình ảnh Street View, một trong số đó không có vị trí đặt camera video, và tạo mặt nạ phân đoạn cho chúng. Một mô hình phân đoạn được huấn luyện trên các bộ dữ liệu này so với một bộ dữ liệu xác thực (của San Francisco – xem ‘Yếu Tố Hạn Chế’ bên dưới). Sau đó, mô hình đầu ra được chạy trên các hình ảnh Street View ngẫu nhiên, với tất cả các phát hiện camera dương tính được con người xác nhận và các dương tính giả bị loại bỏ.

Bên trái, hình ảnh thô từ Google Street View. Tiếp theo, mặt nạ phân đoạn đã điều chỉnh. Thứ ba, nhận diện camera được suy ra bằng thuật toán. Bên phải, vị trí đã được con người xác minh.

Cuối cùng, khuôn khổ tính toán trường nhìn của các góc camera liên quan để ước tính mức độ bao phủ, được tổng hợp so với mặt bằng của các tòa nhà liên quan và thông số kỹ thuật của mạng lưới đường bộ. Các dữ liệu đóng góp khác cho ma trận này bao gồm thông số kỹ thuật tòa nhà từ OpenStreetMap, và việc sử dụng bản đồ điều tra dân số Mỹ để đảm bảo nghiên cứu chỉ giới hạn trong ranh giới hành chính của mỗi thành phố. Ngoài ra, dự án sử dụng dữ liệu vị trí camera San Francisco từ một nghiên cứu của Electronic Frontier Foundation (EFF), với các hình ảnh Google Street View được truy cập qua Static API.

Các nhà nghiên cứu ước tính mức độ bao phủ bằng cách tính toán trường nhìn của camera Google Street View so với dữ liệu từ OpenStreetMap.

Yếu Tố Hạn Chế

Các nhà nghiên cứu thừa nhận một số yếu tố hạn chế cần được xem xét khi đánh giá kết quả. Thứ nhất, các camera được hệ thống học máy xác định sau đó đều được xác minh hoặc phủ nhận bởi đánh giá của con người, và quá trình đánh giá này có thể sai sót. Thứ hai, nghiên cứu bị giới hạn bởi độ phân giải có sẵn của hình ảnh Street View, điều này giới hạn các nhà nghiên cứu trong việc xác định camera được đặt trong vòng ba mươi mét từ điểm nhìn. Điều này không chỉ có nghĩa là một số camera có thể đã được ‘tạo ra’ do độ phân giải hạn chế, mà còn có nghĩa là nhiều camera ngoài phạm vi này (chẳng hạn như camera cao tầng, vị trí bị che khuất và camera siêu nhỏ trong chuông cửa) có khả năng không được xác định. Cuối cùng, việc ước tính khả năng thu hồi mô hình cụ thể cho thành phố có thể là một yếu tố hạn chế về độ chính xác của kết quả, vì thành phố San Francisco, nơi tần suất camera giám sát đã được gán nhãn trong công trình trước đó từ EFF, đã được áp dụng cho các khu vực pháp lý khác để làm cho nghiên cứu khả thi.

Martin Anderson

Nhà văn về học máy, chuyên gia trong lĩnh vực tổng hợp hình ảnh con người. Nguyên trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]

Unite.AI

Xác Định Mức Độ Giám Sát Video Thông Qua Dữ Liệu Google Street View

Số Liệu Hạn Chế Về Sự Lan Tỏa Của Camera Giám Sát Tại Hoa Kỳ

Nhận Diện Camera Video Trong Hình Ảnh Google Street View

Phương Pháp Luận

Yếu Tố Hạn Chế

You may like