Nadzór

Szacowanie prawdziwego stanu globalnego ubóstwa za pomocą uczenia maszynowego

Published April 20, 2021

Updated April 28, 2026

Martin Anderson

Współpraca pomiędzy UoC Berkeley, Stanford University i Facebook oferuje głębszy i bardziej szczegółowy obraz rzeczywistego stanu ubóstwa w i między narodami, za pomocą wykorzystania uczenia maszynowego.

Badanie badawcze, zatytułowane Mikro-estymaty majątku dla wszystkich krajów o niskich i średnich dochodach, jest uzupełnione o beta stronę internetową, która pozwala użytkownikom na interaktywne eksplorowanie absolutnego i względnego stanu ekonomicznego drobnych obszarów i enklaw ubóstwa w krajach o niskich i średnich dochodach.

Ramowa struktura obejmuje dane z obrazów satelitarnych, map topograficznych, sieci komórkowych i zagregowanych danych anonimowych z Facebooka, i jest weryfikowana przeciwko obszernym ankietom bezpośrednim, w celu raportowania względnej dysproporcji majątkowej w regionie, zamiast absolutnych szacunków dochodu.

Mapa globalnego ubóstwa, ważona w kierunku najbardziej dotkniętych obszarów. Niższe, powiększenia Południowej Afryki i Lesotho (b); 12 km² obszaru wokół township Khayelitsa w pobliżu Kapsztadu. Źródło: https://arxiv.org/ftp/arxiv/papers/2104/2104.07761.pdf

System został przyjęty przez rząd Nigerii jako podstawa do administrowania programami ochrony społecznej, i działa wraz z istniejącą ramą od World Bank, National Social Safety nets Project (NASSP). W lutym pierwszym odbiorcom w ramach schematu wypłacono transfer gotówkowy w wysokości 5000 nigerijskich nair, korzyść wypłacaną przez okres do sześciu miesięcy, do progu jednego miliona nair.

Artykuł twierdzi, że ubóstwo danych wnosi znaczący wkład w nieprawidłowe rozdział pomocy w krajach o minimalnych zasobach do gromadzenia danych lub ograniczonej infrastrukturze, i że politycznie motywowane nieprawidłowe raportowanie (problem nieograniczony do krajów o niskich dochodach) jest również czynnikiem w tym zakresie.

Rejestrowanie ‘niezarejestrowanych ubogich’

Symulacje badaczy na danych wykazały, że, zgodnie z istniejącymi przepisami dotyczącymi alokacji środków pomocy, dystrybucja oparta na tym systemie zwiększa płatności dla tych, którzy potrzebują ich najbardziej, i zmniejsza płatności dla istniejących odbiorców w wyższych grupach dochodowych. Artykuł zauważa również trudności, z którymi spotkali się administratorzy programów ochrony społecznej w przydzielaniu środków pomocy na początku kryzysu COVID-19, ze względu na brak kompleksowych lub szczegółowych danych. W Nigerii, na przykład, najnowsze dane ankiety obejmują gospodarstwa w zaledwie 13,8% wszystkich dystryktów Nigerii, w porównaniu z 100% pokryciem, które nowy system zapewnia.

Poprzednie prace nad szacowaniem ubóstwa z użyciem AI koncentrowały się głównie na danych pozyskiwanych z satelit (patrz poniżej), ale badacze twierdzą, że dane z łączności komórkowej zapewniają bardziej dokładne i szczegółowe spojrzenie na dysproporcje majątkowe w regionach, i że ten strumień danych stanowi połowę wszystkich danych przyczyniających się do projektu.

Z punktu widzenia uogólnienia w danych uczenia maszynowego, badacze zauważają, że modele szkolone w jednym kraju mogą być korzystnym i dokładnym szablonem dla modeli obejmujących sąsiadujące kraje. Zauważają również, że nowa ramowa struktura jest w stanie nie tylko odróżnić obszary miejskie i wiejskie, ale również dostarczyć mapy dysproporcji w obszarach zurbanizowanych, co przekracza zakres wielu ostatnich inicjatyw badawczych w tym sektorze.

Obrazowanie satelitarne w analizie ubóstwa

Główną zasadą analizy ubóstwa opartej na satelitach jest założenie, że biedni ludzie mają mało pieniędzy, aby utrzymać światła elektryczne w godzinach ciemności, lub mogą nie mieć w ogóle światła elektrycznego. Tam, gdzie brak precyzyjnych świateł może być skorelowany z obecnością ludzi, ustaloną za pomocą innych środków (takich jak dane z łączności komórkowej), można wygenerować wskaźnik deprywacji.

Ta technika została zaproponowana w 2016 roku w wcześniejszym artykule Stanford z innego zespołu badawczego. Metoda opisana w tym artykule była pionierskim wykorzystaniem pokrycia satelitarnego wieczornego czasu dostarczonego przez United States Air Force Defense Meteorological Satellite Program (DMSP) za pośrednictwem National Oceanic and Atmospheric Administration (NOAA-NGDC).

Cztery filtry konwolucyjne identyfikują, od lewej do prawej, cechy, które odnoszą się do stref miejskich, wiejskich, wody i dróg. Górny rząd pokazuje obrazy źródłowe z Google Maps, środkowy mapy aktywacji filtrów z analizy uczenia maszynowego, a dolny rząd nakładki map aktywacji na oryginalne obrazy map. Źródło: https://science.sciencemag.org/content/sci/353/6301/790.full.pdf

Projekt Stanford skorelował dowody z filtrowanych nocnych świateł w nadzorze satelitarnym z własną bazą danych ankiety DHS dla roku, w którym wystąpiły obie ankiety i agregowane wyniki satelitarnych. Było konieczne ustalenie średnich sumy wartości świateł nocnych jako proxy dla pewnych wskaźników ekonomicznych.

Prawda o globalnych statystykach ubóstwa

Dla nowego projektu Stanford, badacze zdecydowali się wywieść ramę danych z istniejącego programu Demographic and Health Survey (DHS), chociaż, jak przyznają, skutkuje to efektywnie replikacją schematu DHS w zbiorze danych. Badacze zauważają: ‘Zdecydowaliśmy się szkolić nasz model wyłącznie na danych DHS, ponieważ jest to najbardziej kompleksowe źródło publicznie dostępnych, międzynarodowo ustandaryzowanych danych majątkowych, które zapewniają szacunki majątku na poziomie gospodarstw domowych z sub-regionalnymi markerami geograficznymi.’

Jednakże, projekt działa na znacznie wyższej rozdzielczości niż DHS, a korzystanie z istniejącej ramy jako prawdy niesie dwa korzyści: po pierwsze, dane DHS nie polegają na formalnym raporcie dochodu, który jest niepewnym wskaźnikiem w krajach najbardziej dotkniętych ubóstwem, gdzie gospodarki nieformalne są powszechne; po drugie, dane są zbierane w ustandaryzowany sposób i według międzynarodowego szablonu, który pozwala ramie badaczy objąć inne kraje, które podlegają tej metody pomiaru, zamiast ustanawiania równoważności między konkurującymi ramami.

Łączność komórkowa jako wskaźnik ekonomiczny

Dla ludzi żyjących w obszarach ekonomicznie zagrożonych, łączność komórkowa stała się technologicznym ratunkiem w ciągu ostatnich dwóch dekad, odkąd telefony komórkowe są minimalną dostępną platformą technologiczną, na której można polegać w takich warunkach. Telefony komórkowe stały się również de facto platformami płatniczymi dla odbiorców pomocy, którzy nie mają konta bankowego lub innych konwencjonalnych środków otrzymywania pieniędzy.

Jednak, jak zauważono wcześniej, korzystanie z wskaźników sieci komórkowych jako wskaźnika ekonomicznego dla systemów uczenia maszynowego ma pewne potencjalne wady: są ludzie w dotkniętych regionach, którzy są tak biedni, że nie posiadają nawet telefonu komórkowego – ludzie, którym system jest najbardziej przeznaczony do pomocy; system może być potencjalnie oszukany przez użytkowników z wieloma telefonami komórkowymi w sytuacjach, w których telefon stał się proxy dla unikalnych identyfikatorów hashujących obywateli; i istnieją implikacje dotyczące prywatności przy tworzeniu tego rodzaju systemu identyfikacji, w przypadkach, w których lokalny lub narodowy rząd zachowuje pewną kontrolę nad projektem.