Ângulo de Anderson

Estimando o Verdadeiro Estado da Pobreza Global com Aprendizado de Máquina

Publicado em 20 de abril de 2021

Atualizado em 25 de maio de 2026

Por

Martin Anderson

Uma colaboração entre a Universidade de Berkeley, a Universidade de Stanford e o Facebook oferece uma visão mais profunda e granular do estado real da pobreza em e entre nações, por meio do uso de aprendizado de máquina.

A pesquisa, intitulada Micro-estimativas de Riqueza para Todos os Países de Baixa e Média Renda, é acompanhada por um site beta que permite aos usuários explorar interativamente o estado econômico absoluto e relativo de áreas e bolsões de pobreza em países de baixa e média renda.

O quadro incorpora dados de imagens de satélite, mapas topográficos, redes de telefonia móvel e dados agregados e anonimizados do Facebook, e é verificado contra extensas pesquisas face a face, para fins de relatar a disparidade de riqueza relativa em uma região, em vez de estimativas absolutas de renda.

Micro-estimativas de riqueza - Aprendizado de Máquina

Um mapa da pobreza global, ponderado para as áreas mais afetadas. Abaixo, ampliações da África do Sul e do Lesoto (b); uma área de 12 km² ao redor da cidade de Khayelitsa, perto do Cabo. Fonte: https://arxiv.org/ftp/arxiv/papers/2104/2104.07761.pdf

O sistema foi adotado pelo governo da Nigéria como base para administrar programas de proteção social, e funciona em conjunto com o quadro existente do Banco Mundial, o Projeto de Redes de Segurança Social Nacional (NASSP). Em fevereiro, os primeiros beneficiários do esquema receberam uma transferência de dinheiro de 5.000 nairas nigerianas, um benefício pago por até seis meses, até um limite de um milhão de nairas.

O artigo afirma que a pobreza de dados contribui significativamente para a distribuição incorreta de ajuda em países com recursos limitados de coleta de dados ou infraestrutura, e que a relatórios políticos motivados (um problema não limitado a países de baixa renda) também é um fator nesse sentido.

Registrando os ‘Pobres Não Registrados’

As simulações dos pesquisadores nos dados demonstraram que, sob as regulamentações existentes para alocação de recursos de ajuda, a distribuição com base nesse sistema aumenta o pagamento para aqueles que mais precisam e diminui o pagamento para os beneficiários existentes em faixas de renda mais altas. O artigo também observa a dificuldade que os administradores de programas de proteção social enfrentaram na alocação de recursos de ajuda no início da crise do COVID-19, devido à falta de dados abrangentes ou detalhados. Na Nigéria, por exemplo, os dados de pesquisa mais recentes cobrem apenas 13,8% de todos os distritos nigerianos, em comparação com a cobertura de 100% que o novo esquema oferece.

Trabalhos anteriores em estimação de pobreza assistida por IA se concentraram principalmente em dados obtidos por satélite (veja abaixo), mas os pesquisadores afirmam que os dados de conectividade móvel obtêm uma visão mais precisa e granular da disparidade de riqueza entre regiões, e essa informação é metade de todos os dados contribuintes para o projeto.

Do ponto de vista de generalização em dados de aprendizado de máquina, os pesquisadores observam que modelos treinados em um país podem ser um modelo benéfico e preciso para modelos que cobrem países adjacentes. Eles também observam que o novo quadro é capaz não apenas de distinguir entre locais urbanos e rurais, mas também de fornecer mapas de disparidade dentro de áreas urbanizadas, o que excede o escopo de muitas iniciativas de pesquisa recentes nesse setor.

Imagens de Satélite na Análise da Pobreza

O princípio por trás da análise de pobreza baseada em imagens de satélite é a suposição de que as pessoas pobres têm pouco dinheiro para pagar luzes elétricas durante a noite, ou podem não ter acesso a luzes elétricas. Onde a ausência de luzes pontuais pode ser correlacionada com a presença de pessoas, como determinado por outros meios (como dados de conectividade móvel), um índice de privação pode ser gerado.

Essa técnica foi proposta em 2016 em um artigo anterior da Stanford de outro grupo de pesquisa. O método detalhado nesse artigo pioneiro o uso de cobertura de satélite noturna fornecida pelo Programa de Satélite Meteorológico de Defesa da Força Aérea dos EUA (DMSP) por meio do Centro de Dados Geofísicos da Administração Oceânica e Atmosférica Nacional (NOAA-NGDC).

Análise de pobreza por meio de imagens de satélite noturno

Quatro filtros convolucionais identificam, da esquerda para a direita, recursos que se relacionam a zonas urbanas, zonas rurais, água e estradas. A linha superior mostra imagens de fonte do Google Maps, a linha do meio os mapas de ativação de filtros da análise de aprendizado de máquina e a linha inferior uma sobreposição de mapas de ativação sobre a imagem de mapa original. Fonte: https://science.sciencemag.org/content/sci/353/6301/790.full.pdf

O projeto da Stanford correlacionou as evidências filtradas de luzes noturnas nas imagens de satélite contra seu próprio banco de dados de pesquisas do DHS para o ano em que tanto as pesquisas quanto os resultados agregados de satélite ocorreram. Foi necessário estabelecer médias dos valores de luz noturna como proxies para certos indicadores econômicos.

Verdade Terrível para as Estatísticas Globais de Pobreza

Para o novo projeto da Stanford, os pesquisadores decidiram derivar o quadro de dados do existing Programa de Pesquisas Demográficas e de Saúde (DHS), embora, como eles admitam, isso efetivamente replique o esquema do DHS no conjunto de dados. Os pesquisadores observam: ‘Optamos por treinar nosso modelo exclusivamente com dados do DHS porque é a fonte mais abrangente de dados de riqueza pública e internacionalmente padronizados que fornece estimativas de riqueza em nível de domicílio com marcadores geográficos sub-regionais.’

No entanto, o projeto opera em uma resolução muito mais alta do que o DHS, e usar o quadro existente como verdade terrível fornece dois benefícios: primeiro, os dados do DHS não dependem de relatórios formais de renda, que é um indicador pouco confiável nos países mais afetados pela pobreza, onde as economias informais são comuns; e segundo, os dados são coletados de maneira padronizada e de acordo com um modelo internacional que permite que o quadro dos pesquisadores abranja outros países que estão sujeitos a esse método de medição, em vez de estabelecer equivalências entre quadros concorrentes.

Conectividade Móvel como um Índice Econômico

Para as pessoas que vivem em áreas economicamente desafiadoras, a conectividade móvel se tornou uma linha de vida tecnológica nos últimos 20 anos, desde que os telefones celulares são a plataforma tecnológica mínima disponível que pode ser confiável nessas condições. Os telefones celulares também se tornaram de facto plataformas de pagamento para os beneficiários de ajuda que não têm conta bancária ou outros meios convencionais de receber dinheiro.

No entanto, como foi observado anteriormente, usar indicadores de rede móvel como um índice econômico para sistemas de aprendizado de máquina tem algumas desvantagens potenciais: há pessoas nas regiões afetadas que são tão pobres que não possuem sequer um telefone celular – as pessoas que o sistema é projetado para ajudar; o sistema pode ser manipulado por usuários com vários telefones celulares em circunstâncias em que um telefone se tornou um proxy para hashes de ID de cidadãos únicos; e há implicações de privacidade para criar esse tipo de sistema de identificação, nos casos em que o governo local ou nacional retém algum controle sobre o projeto.