Connect with us

Xác định Phạm vi Giám sát Video thông qua Dữ liệu Google Street View

Giám sát

Xác định Phạm vi Giám sát Video thông qua Dữ liệu Google Street View

mm

Dữ liệu Google Street View liên tục bao phủ các con đường trên toàn thế giới đại diện cho bản ghi hình trực quan hoàn chỉnh, nhất quán và mạch lạc nhất của xã hội toàn cầu, ngoại trừ các quốc gia cấm các phương tiện thu thập dữ liệu di động của gã khổng lồ tìm kiếm.

Với vai trò là một yếu tố đóng góp doanh thu cho cơ sở hạ tầng của Google Maps, hệ thống giám sát toàn diện của Google Street View là một nguồn dữ liệu phong phú cho phân tích học máy. Ngoài khả năng vô tình ghi lại các hành vi phạm tội, nó đã được sử dụng để ước tính thu nhập khu vực từ chất lượng xe hơi trong hình ảnh Google Street View, đánh giá cây xanh trong môi trường đô thị, xác định cột tiện ích, phân loại tòa nhàước tính thành phần dân số của các khu phố ở Mỹ, trong số nhiều sáng kiến khác.

Thống kê Giới hạn về Sự Phổ biến của Máy ảnh Giám sát ở Hoa Kỳ

Mặc dù dữ liệu Google Maps được sử dụng rộng rãi cho các sáng kiến học máy nhận thức xã hội, nhưng có rất ít tập dữ liệu dựa trên Street View bao gồm các ví dụ được dán nhãn của máy ảnh giám sát. Tập dữ liệu Mapillary Vistas là một trong số ít có sẵn cung cấp chức năng này, mặc dù nó bao gồm ít hơn 20 máy ảnh công cộng được dán nhãn ở Hoa Kỳ.

Hầu hết cơ sở hạ tầng giám sát video ở Mỹ chỉ giao nhau với Nhà nước khi cơ quan chức năng yêu cầu hình ảnh hỗ trợ sau các sự kiện địa phương có thể đã được ghi lại. Ngoài các quy định về phân vùng, và trong bối cảnh các luật bảo mật cho phép ít được thực hiện để giải quyết giám sát tư nhân của không gian công cộng, không có khung hành chính liên bang nào có thể cung cấp số liệu thống kê cứng về số lượng máy ảnh công cộng ở Mỹ.

Dữ liệu giai thoại và khảo sát hạn chế cho rằng sự phổ biến của máy ảnh video ở Mỹ có thể tương đương với Trung Quốc, nhưng nó không dễ để chứng minh.

Xác định Máy ảnh Video trong Hình ảnh Google Street View

Xét đến sự thiếu hụt dữ liệu có sẵn, các nhà nghiên cứu từ Đại học Stanford đã tiến hành một nghiên cứu về sự phổ biến, tần suất và phân bố của máy ảnh video công cộng có thể được xác định trong hình ảnh Google Street View.

Các nhà nghiên cứu đã tạo ra một khuôn khổ phát hiện máy ảnh đánh giá 1,6 triệu hình ảnh Google Street View trên 10 thành phố lớn của Mỹ và sáu thành phố lớn khác ở châu Á và châu Âu.

Theo thứ tự giảm dần của mật độ máy ảnh, Boston đứng đầu danh sách các thành phố của Mỹ được nghiên cứu, với mật độ gần đây hoặc hiện tại là 0,63 và tổng số máy ảnh là 1.600. Mặc dù vậy, Thành phố New York có nhiều máy ảnh hơn (10.100) phân bố trên một khu vực rộng lớn hơn. Nguồn: https://arxiv.org/pdf/2105.01764.pdf

Theo thứ tự giảm dần của mật độ máy ảnh, Boston đứng đầu danh sách các thành phố của Mỹ được nghiên cứu, với mật độ gần đây hoặc hiện tại là 0,63 và tổng số máy ảnh là 1.600. Mặc dù vậy, Thành phố New York có nhiều máy ảnh hơn (10.100) phân bố trên một khu vực rộng lớn hơn. Nguồn: https://arxiv.org/pdf/2105.01764.pdf

Trong số các thành phố của Mỹ, Boston được tìm thấy có mật độ máy ảnh cao nhất, trong khi Thành phố New York có số lượng máy ảnh cao nhất với 10.100 máy ảnh, phân bố trên một khu vực rộng lớn hơn. Tại châu Á, Tokyo có 21.700 máy ảnh ước tính, nhưng Seoul có số máy ảnh ít hơn (13.900) tập trung dày đặc hơn. Mặc dù 13.000 máy ảnh được xác định cho hình ảnh Street View của London, Paris vượt qua cả về số lượng máy ảnh (13.000) và mật độ che phủ.

Các nhà nghiên cứu quan sát thấy rằng mật độ máy ảnh thay đổi rộng rãi giữa các khu phố và khu vực của các thành phố.

Mật độ máy ảnh giám sát trên các thành phố của Mỹ, theo nghiên cứu của Stanford năm 2021

Trong số các yếu tố hạn chế khác đối với độ chính xác của cuộc khảo sát (mà chúng tôi sẽ đến), các nhà nghiên cứu quan sát thấy rằng máy ảnh trong các khu vực dân cư khó xác định hơn ba lần so với những máy ảnh được đặt ở công viên công cộng, khu vực công nghiệp và khu vực sử dụng hỗn hợp – có lẽ vì hiệu ứng ‘ngăn chặn’ ngày càng không thể chấp nhận được hoặc gây tranh cãi trong các khu vực dân cư, khiến việc đặt máy ảnh ngụy trang hoặc kín đáo hơn.

Khi xem xét các thành phố được nghiên cứu ở châu Âu và châu Á, Seoul đứng đầu vị trí thành phố đô thị được giám sát nhiều nhất, với Paris không xa sau.

Mật độ máy ảnh giám sát trên các thành phố của Mỹ, châu Á và châu Âu, theo nghiên cứu của Stanford.

Ở nơi một khu vực có đa số cư dân dân tộc hoặc thiểu số theo định nghĩa của cuộc điều tra dân số, tần suất lắp đặt máy ảnh tăng đáng kể, ngay cả khi tất cả các yếu tố giảm nhẹ được các nhà nghiên cứu của Stanford xem xét.

Tần suất máy ảnh giám sát tăng tỷ lệ thuận với tăng tỷ lệ dân tộc thiểu số trong một khu phố, theo nghiên cứu của Stanford.

Tần suất máy ảnh giám sát tăng tỷ lệ thuận với tăng tỷ lệ dân tộc thiểu số trong một khu phố, theo nghiên cứu của Stanford.

Nghiên cứu được thực hiện trên hai giai đoạn thời gian, 2011-2015 và 2016-2020. Mặc dù dữ liệu cho thấy sự tăng trưởng nhất quán và đôi khi là bất thường của việc lắp đặt máy ảnh giám sát trong chín năm, các nhà nghiên cứu đề xuất rằng sự phổ biến của máy ảnh giám sát này có thể đã đạt đến một ‘đỉnh tạm thời’.

Phương pháp

Các nhà nghiên cứu ban đầu đã biên soạn hai tập dữ liệu của hình ảnh Street View, một trong số đó không có máy ảnh video, và tạo ra các mặt nạ phân đoạn cho những hình ảnh này. Một mô hình phân đoạn được đào tạo trên các tập dữ liệu này đối với một tập dữ liệu xác thực (của San Francisco – xem ‘Yếu tố hạn chế’ dưới đây).

Sau đó, mô hình đầu ra được chạy trên các hình ảnh Street View ngẫu nhiên, với tất cả các phát hiện máy ảnh dương tính được xác nhận bởi con người và loại bỏ các dương tính giả.

Trái, hình ảnh thô từ Google Street View. Tiếp theo, mặt nạ phân đoạn được điều chỉnh. Thứ ba, xác định máy ảnh được dẫn xuất bởi thuật toán. Phải, vị trí được xác nhận bởi con người.

Trái, hình ảnh thô từ Google Street View. Tiếp theo, mặt nạ phân đoạn được điều chỉnh. Thứ ba, xác định máy ảnh được dẫn xuất bởi thuật toán. Phải, vị trí được xác nhận bởi con người.

Cuối cùng, khuôn khổ tính toán trường nhìn của các góc máy ảnh liên quan để ước tính phạm vi che phủ, tổng hợp với các bản footprint của các tòa nhà liên quan và thông số kỹ thuật của mạng lưới đường.

Các dữ liệu đóng góp khác cho ma trận này bao gồm thông số kỹ thuật của tòa nhà từ OpenStreetMap, và việc sử dụng bản đồ điều tra dân số của Mỹ để đảm bảo rằng nghiên cứu được giới hạn trong ranh giới hành chính của từng thành phố. Ngoài ra, dự án sử dụng dữ liệu vị trí máy ảnh của San Francisco từ một nghiên cứu của Quỹ Tự do Điện tử (EFF), với hình ảnh Google Street View được truy cập thông qua Static API.

Các nhà nghiên cứu ước tính phạm vi che phủ bằng cách tính toán trường nhìn của máy ảnh Google Street View đối với dữ liệu từ OpenStreetMap.

Các nhà nghiên cứu ước tính phạm vi che phủ bằng cách tính toán trường nhìn của máy ảnh Google Street View đối với dữ liệu từ OpenStreetMap.

Yếu tố hạn chế

Các nhà nghiên cứu thừa nhận một số yếu tố hạn chế cần được xem xét khi xem xét kết quả.

Thứ nhất, rằng các máy ảnh được xác định bởi hệ thống học máy đều được xác nhận hoặc phủ định bởi xem xét của con người, và rằng quá trình xem xét này là một quá trình dễ bị lỗi.

Thứ hai, nghiên cứu bị giới hạn bởi độ phân giải có sẵn của hình ảnh Street View, điều này hạn chế các nhà nghiên cứu chỉ xác định được máy ảnh đặt trong vòng ba mươi mét từ điểm nhìn. Điều này không chỉ có nghĩa là một số máy ảnh có thể đã được ‘sáng tạo’ thông qua độ phân giải hạn chế, mà còn nhiều máy ảnh ngoài phạm vi này (như máy ảnh cấp cao, máy ảnh bị che khuất và máy ảnh vi mô trong khung cửa) có khả năng không được xác định.

Cuối cùng, việc ước tính khả năng nhớ lại mô hình cụ thể của thành phố có thể là một yếu tố hạn chế đối với độ chính xác của kết quả, vì thành phố San Francisco, nơi tần suất máy ảnh giám sát đã được dán nhãn trong công việc trước của EFF, đã được áp dụng cho các khu vực tài phán khác để làm cho nghiên cứu khả thi.

Nhà văn về học máy, chuyên gia lĩnh vực tổng hợp hình ảnh con người. Cựu trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]