Connect with us

Szacowanie prawdziwego stanu globalnego ubóstwa za pomocą uczenia maszynowego

Nadzór

Szacowanie prawdziwego stanu globalnego ubóstwa za pomocą uczenia maszynowego

mm
Map of poverty through machine learning

Współpraca pomiędzy UoC Berkeley, Stanford University i Facebook oferuje głębszy i bardziej szczegółowy obraz rzeczywistego stanu ubóstwa w i między narodami, za pomocą wykorzystania uczenia maszynowego.

Badanie badawcze, zatytułowane Mikro-estymaty majątku dla wszystkich krajów o niskich i średnich dochodach, jest uzupełnione o beta stronę internetową, która pozwala użytkownikom na interaktywne eksplorowanie absolutnego i względnego stanu ekonomicznego drobnych obszarów i enklaw ubóstwa w krajach o niskich i średnich dochodach.

Interaktywna mapa światowego ubóstwa za pomocą uczenia maszynowego

Ramowa struktura obejmuje dane z obrazów satelitarnych, map topograficznych, sieci komórkowych i zagregowanych danych anonimowych z Facebooka, i jest weryfikowana przeciwko obszernym ankietom bezpośrednim, w celu raportowania względnej dysproporcji majątkowej w regionie, zamiast absolutnych szacunków dochodu.

Mikro-estymaty majątku - AI

Mapa globalnego ubóstwa, ważona w kierunku najbardziej dotkniętych obszarów. Niższe, powiększenia Południowej Afryki i Lesotho (b); 12 km² obszaru wokół township Khayelitsa w pobliżu Kapsztadu. Źródło: https://arxiv.org/ftp/arxiv/papers/2104/2104.07761.pdf

System został przyjęty przez rząd Nigerii jako podstawa do administrowania programami ochrony społecznej, i działa wraz z istniejącą ramą od World Bank, National Social Safety nets Project (NASSP). W lutym pierwszym odbiorcom w ramach schematu wypłacono transfer gotówkowy w wysokości 5000 nigerijskich nair, korzyść wypłacaną przez okres do sześciu miesięcy, do progu jednego miliona nair.

Artykuł twierdzi, że ubóstwo danych wnosi znaczący wkład w nieprawidłowe rozdział pomocy w krajach o minimalnych zasobach do gromadzenia danych lub ograniczonej infrastrukturze, i że politycznie motywowane nieprawidłowe raportowanie (problem nieograniczony do krajów o niskich dochodach) jest również czynnikiem w tym zakresie.

Rejestrowanie ‘niezarejestrowanych ubogich’

Symulacje badaczy na danych wykazały, że, zgodnie z istniejącymi przepisami dotyczącymi alokacji środków pomocy, dystrybucja oparta na tym systemie zwiększa płatności dla tych, którzy potrzebują ich najbardziej, i zmniejsza płatności dla istniejących odbiorców w wyższych grupach dochodowych. Artykuł zauważa również trudności, z którymi spotkali się administratorzy programów ochrony społecznej w przydzielaniu środków pomocy na początku kryzysu COVID-19, ze względu na brak kompleksowych lub szczegółowych danych. W Nigerii, na przykład, najnowsze dane ankiety obejmują gospodarstwa w zaledwie 13,8% wszystkich dystryktów Nigerii, w porównaniu z 100% pokryciem, które nowy system zapewnia.

Poprzednie prace nad szacowaniem ubóstwa z użyciem AI koncentrowały się głównie na danych pozyskiwanych z satelit (patrz poniżej), ale badacze twierdzą, że dane z łączności komórkowej zapewniają bardziej dokładne i szczegółowe spojrzenie na dysproporcje majątkowe w regionach, i że ten strumień danych stanowi połowę wszystkich danych przyczyniających się do projektu.

Z punktu widzenia uogólnienia w danych uczenia maszynowego, badacze zauważają, że modele szkolone w jednym kraju mogą być korzystnym i dokładnym szablonem dla modeli obejmujących sąsiadujące kraje. Zauważają również, że nowa ramowa struktura jest w stanie nie tylko odróżnić obszary miejskie i wiejskie, ale również dostarczyć mapy dysproporcji w obszarach zurbanizowanych, co przekracza zakres wielu ostatnich inicjatyw badawczych w tym sektorze.

Obrazowanie satelitarne w analizie ubóstwa

Główną zasadą analizy ubóstwa opartej na satelitach jest założenie, że biedni ludzie mają mało pieniędzy, aby utrzymać światła elektryczne w godzinach ciemności, lub mogą nie mieć w ogóle światła elektrycznego. Tam, gdzie brak precyzyjnych świateł może być skorelowany z obecnością ludzi, ustaloną za pomocą innych środków (takich jak dane z łączności komórkowej), można wygenerować wskaźnik deprywacji.

Ta technika została zaproponowana w 2016 roku w wcześniejszym artykule Stanford z innego zespołu badawczego. Metoda opisana w tym artykule była pionierskim wykorzystaniem pokrycia satelitarnego wieczornego czasu dostarczonego przez United States Air Force Defense Meteorological Satellite Program (DMSP) za pośrednictwem National Oceanic and Atmospheric Administration (NOAA-NGDC).

Analiza ubóstwa za pomocą satelity

Cztery filtry konwolucyjne identyfikują, od lewej do prawej, cechy, które odnoszą się do stref miejskich, wiejskich, wody i dróg. Górny rząd pokazuje obrazy źródłowe z Google Maps, środkowy mapy aktywacji filtrów z analizy uczenia maszynowego, a dolny rząd nakładki map aktywacji na oryginalne obrazy map. Źródło: https://science.sciencemag.org/content/sci/353/6301/790.full.pdf

Projekt Stanford skorelował dowody z filtrowanych nocnych świateł w nadzorze satelitarnym z własną bazą danych ankiety DHS dla roku, w którym wystąpiły obie ankiety i agregowane wyniki satelitarnych. Było konieczne ustalenie średnich sumy wartości świateł nocnych jako proxy dla pewnych wskaźników ekonomicznych.

Prawda o globalnych statystykach ubóstwa

Dla nowego projektu Stanford, badacze zdecydowali się wywieść ramę danych z istniejącego programu Demographic and Health Survey (DHS), chociaż, jak przyznają, skutkuje to efektywnie replikacją schematu DHS w zbiorze danych. Badacze zauważają: ‘Zdecydowaliśmy się szkolić nasz model wyłącznie na danych DHS, ponieważ jest to najbardziej kompleksowe źródło publicznie dostępnych, międzynarodowo ustandaryzowanych danych majątkowych, które zapewniają szacunki majątku na poziomie gospodarstw domowych z sub-regionalnymi markerami geograficznymi.’

Jednakże, projekt działa na znacznie wyższej rozdzielczości niż DHS, a korzystanie z istniejącej ramy jako prawdy niesie dwa korzyści: po pierwsze, dane DHS nie polegają na formalnym raporcie dochodu, który jest niepewnym wskaźnikiem w krajach najbardziej dotkniętych ubóstwem, gdzie gospodarki nieformalne są powszechne; po drugie, dane są zbierane w ustandaryzowany sposób i według międzynarodowego szablonu, który pozwala ramie badaczy objąć inne kraje, które podlegają tej metody pomiaru, zamiast ustanawiania równoważności między konkurującymi ramami.

Łączność komórkowa jako wskaźnik ekonomiczny

Dla ludzi żyjących w obszarach ekonomicznie zagrożonych, łączność komórkowa stała się technologicznym ratunkiem w ciągu ostatnich dwóch dekad, odkąd telefony komórkowe są minimalną dostępną platformą technologiczną, na której można polegać w takich warunkach. Telefony komórkowe stały się również de facto platformami płatniczymi dla odbiorców pomocy, którzy nie mają konta bankowego lub innych konwencjonalnych środków otrzymywania pieniędzy.

Jednak, jak zauważono wcześniej, korzystanie z wskaźników sieci komórkowych jako wskaźnika ekonomicznego dla systemów uczenia maszynowego ma pewne potencjalne wady: są ludzie w dotkniętych regionach, którzy są tak biedni, że nie posiadają nawet telefonu komórkowego – ludzie, którym system jest najbardziej przeznaczony do pomocy; system może być potencjalnie oszukany przez użytkowników z wieloma telefonami komórkowymi w sytuacjach, w których telefon stał się proxy dla unikalnych identyfikatorów hashujących obywateli; i istnieją implikacje dotyczące prywatności przy tworzeniu tego rodzaju systemu identyfikacji, w przypadkach, w których lokalny lub narodowy rząd zachowuje pewną kontrolę nad projektem.

Pisarz na temat uczenia maszynowego, specjalista ds. syntezowania obrazów ludzi. Były kierownik treści badawczych w Metaphysic.ai.