Connect with us

Vigilancia

Estimando el Verdadero Estado de la Pobreza Global con Aprendizaje Automático

mm
Map of poverty through machine learning

Una colaboración de la Universidad de California en Berkeley, la Universidad de Stanford y Facebook ofrece una imagen más profunda y detallada del estado real de la pobreza en y entre naciones, mediante el uso de aprendizaje automático.

La investigación, titulada Micro-estimaciones de riqueza para todos los países de bajos y medianos ingresos, viene acompañada de un sitio web beta que permite a los usuarios explorar de manera interactiva el estado económico absoluto y relativo de áreas y bolsillos de pobreza en países de bajos y medianos ingresos.

Mapa interactivo de la pobreza en el mundo a través del aprendizaje automático

El marco incorpora datos de imágenes de satélite, mapas topográficos, redes de teléfonos móviles y datos agregados y anonimizados de Facebook, y se verifica contra encuestas extensas y personales, con el fin de informar sobre la disparidad de riqueza relativa en una región, en lugar de estimaciones absolutas de ingresos.

Micro estimaciones de riqueza - IA

Un mapa de la pobreza global, ponderado hacia las áreas más afectadas. Abajo, ampliaciones de Sudáfrica y Lesoto (b); un área de 12 km² alrededor del municipio de Khayelitsa cerca de Ciudad del Cabo. Fuente: https://arxiv.org/ftp/arxiv/papers/2104/2104.07761.pdf

El sistema ha sido adoptado por el gobierno de Nigeria como base para administrar programas de protección social, y funciona en conjunto con el marco existente del Banco Mundial, el Proyecto de Redes de Seguridad Social Nacional (NASSP). En febrero, los primeros beneficiarios del esquema recibieron una transferencia de efectivo de 5.000 nairas nigerianas, un beneficio pagable hasta seis meses, hasta que se alcance un umbral de un millón de nairas.

El documento afirma que la pobreza de datos hace una contribución notable a la distribución incorrecta de ayuda en países con recursos mínimos de recolección de datos o infraestructura limitada, y que la informe incorrecta políticamente motivada (un problema no limitado a países de bajos ingresos) también es un factor en este respecto.

Registrar a los ‘Pobres no Reportados’

Las simulaciones de los investigadores sobre los datos demostraron que, bajo las regulaciones existentes para la asignación de recursos de ayuda, la distribución basada en este sistema aumenta el pago a quienes más lo necesitan y disminuye el pago para los receptores existentes en tramos de ingresos más altos. El documento también señala la dificultad que enfrentaron los administradores de programas de protección social para asignar recursos de ayuda al comienzo de la crisis del COVID-19, debido a la falta de datos comprehensivos o detallados. En Nigeria, por ejemplo, los datos de la encuesta más reciente cubren hogares en solo el 13,8% de todos los distritos nigerianos, en comparación con la cobertura del 100% que ofrece el nuevo esquema.

El trabajo previo en la estimación de la pobreza asistida por IA se ha centrado en gran medida en los datos obtenidos por satélite (ver abajo), pero los investigadores afirman que los datos de la conectividad móvil obtienen una visión más precisa y detallada de la disparidad de riqueza en las regiones, y esta corriente de datos proporciona la mitad de todos los datos contribuyentes del proyecto.

Desde el punto de vista de la generalización en los datos de aprendizaje automático, los investigadores observan que los modelos entrenados en un país pueden ser un modelo beneficioso y preciso para modelos que cubren países adyacentes. También señalan que el nuevo marco no solo puede distinguir entre áreas urbanas y rurales, sino que también puede proporcionar mapas de disparidad dentro de áreas urbanizadas, lo que supera el alcance de muchas iniciativas de investigación recientes en este sector.

Imágenes de Satélite en el Análisis de la Pobreza

El principio detrás del análisis de la pobreza basado en satélites es la presunción de que las personas pobres tienen poco dinero para pagar luces eléctricas en la hora de oscuridad, o pueden no tener instalaciones de luces eléctricas en absoluto. Donde la ausencia de luces precisas puede correlacionarse con la presencia de personas, como se determina por otros medios (como datos de conectividad móvil), se puede generar un índice de privación.

Esta técnica fue propuesta en 2016 en un documento anterior de Stanford de otro grupo de investigación. El método detallado en ese documento sentó las bases para el uso de la cobertura de satélite de la hora de la noche proporcionada por el Programa de Satélites Meteorológicos de Defensa de la Fuerza Aérea de los Estados Unidos (DMSP) a través de la Administración Nacional de Océanos y Atmósfera (NOAA-NGDC).

Análisis de la pobreza por luces nocturnas mediante satélite

Cuatro filtros convolucionales identifican, de izquierda a derecha, características que se relacionan con zonas urbanas, zonas rurales, agua y carreteras. La fila superior muestra imágenes de origen de Google Maps, la fila del medio los mapas de activación de filtros del análisis de aprendizaje automático, y la fila inferior una superposición de mapas de activación sobre la imagen de mapa original. Fuente: https://science.sciencemag.org/content/sci/353/6301/790.full.pdf

El proyecto de Stanford correlacionó la evidencia filtrada de luces nocturnas en la vigilancia por satélite con su propia base de datos de encuestas de DHS para el año en que ambas las encuestas y los resultados agregados de satélite ocurrieron. Fue necesario establecer promedios de la suma de valores de luces nocturnas como proxies para ciertos indicadores económicos.

Verdad de Tierra para las Estadísticas de Pobreza Global

Para el nuevo proyecto de Stanford, los investigadores decidieron derivar el marco de datos del existente Programa de Encuestas Demográficas y de Salud (DHS), aunque, como admiten, esto efectivamente replica el esquema de DHS en el conjunto de datos. Los investigadores observan: ‘Elegimos entrenar nuestro modelo exclusivamente con datos de DHS porque es la fuente más completa de datos de riqueza a nivel de hogar, con marcadores geográficos subregionales, que están disponibles públicamente y están estandarizados a nivel internacional.’

Sin embargo, el proyecto opera a una resolución mucho más alta que DHS, y el uso del marco existente como verdad de tierra proporciona dos beneficios: primero, los datos de DHS no dependen de la declaración formal de ingresos, lo cual es un indicador poco fiable en los países más afectados por la pobreza, donde las economías ilegales son comunes; y segundo, los datos se recopilan de manera estandarizada y según una plantilla internacional que permite que el marco de los investigadores abarque otros países que están sujetos a este método de medición, en lugar de establecer equivalencias entre marcos en competencia.

Conectividad Móvil como Índice Económico

Para las personas que viven en áreas económicamente desafiantes, la conectividad móvil se ha convertido en una línea de vida tecnológica en las últimas dos décadas, desde que los teléfonos móviles son la plataforma tecnológica mínima disponible que se puede confiar en tales condiciones. Los teléfonos móviles también se han convertido en de facto plataformas de pago para los receptores de ayuda que carecen de una cuenta bancaria o otros medios convencionales de recibir dinero.

Sin embargo, como se ha observado antes, el uso de indicadores de redes móviles como un índice económico para sistemas de aprendizaje automático tiene algunas desventajas potenciales: hay personas en las regiones afectadas que son tan pobres que ni siquiera poseen un teléfono móvil – las mismas personas a las que el sistema está diseñado para ayudar; el sistema podría potencialmente ser manipulado por usuarios con múltiples teléfonos móviles en circunstancias en las que un teléfono se ha convertido en un proxy para hashes de ID únicos de ciudadanos; y hay implicaciones de privacidad para crear este tipo de sistema de identificación, en casos en que el gobierno local o nacional retiene alguna supervisión del proyecto.

Escritor sobre aprendizaje automático, especialista en síntesis de imágenes humanas. Anterior jefe de contenido de investigación en Metaphysic.ai.