taló AI identifica els traficants de drogues d'Instagram amb una precisió gairebé del 95% - Unite.AI
Connecteu-vos amb nosaltres

Intel·ligència Artificial

L'IA identifica els traficants de drogues d'Instagram amb una precisió gairebé del 95%.

mm
actualitzat on

Els investigadors dels Estats Units han desenvolupat un sistema d'aprenentatge automàtic multimodal que és capaç d'identificar els comptes i les publicacions dels traficants de drogues a Instagram, mitjançant l'anàlisi de diversos continguts, inclòs el contingut d'imatges.

El investigació, titulat Identificació de traficants de drogues il·lícites a Instagram amb la fusió de dades multimodal a gran escala, és una col·laboració entre tres investigadors de la Universitat de West Virginia i un de la Case Western Reserve University.

Per facilitar el projecte, els investigadors van crear una base de dades anomenada Identificació de traficants de drogues a Instagram (IDDIG), amb 4000 comptes d'usuari, amb 1,400 comptes de narcotraficants, i la resta com a grup de control per provar el procés d'identificació.

El marc del sistema multimodal de detecció de distribuïdors. El model inclou imatges publicades, comentaris publicats, així com informació d'imatges de la pàgina d'inici i textos de biografia publicats a la pàgina d'inici. Font: https://arxiv.org/pdf/2108.08301.pdf

El marc del sistema multimodal de detecció de distribuïdors. El model inclou imatges publicades, comentaris publicats, així com informació d'imatges de la pàgina d'inici i textos de biografia publicats a la pàgina d'inici. Font: https://arxiv.org/pdf/2108.08301.pdf

Les proves inicials de la tècnica informen d'una taxa de precisió gairebé del 95% en la identificació de traficants de drogues basats en Instagram, i el marc també ha donat lloc a un projecte de detecció de la comunitat basat en hashtag dissenyat per descobrir els significats canviants de l'activitat relacionada amb la venda de drogues il·legals, utilitzant factors geogràfics i identificació de tipus de fàrmacs específics.

Com que la base de dades desenvolupada per al projecte requeria un etiquetatge manual, el marc inclou un sistema d'anotacions fàcil d'utilitzar, que utilitza un sistema de classificació basat en les representacions de codificadors bidireccionals de Transformers (BERT) de Google, així com la classificació d'imatges basada en ResNet.

El sistema d'anotació basat en web (amb indicacions addicionals dels autors de l'article) per a IDDIG.

El sistema d'anotació basat en web (amb indicacions addicionals dels autors de l'article) per a IDDIG.

Detectar els traficants en converses relacionades amb drogues

Les drogues recreatives es discuteixen en un gran nombre de contextos a través de plataformes de xarxes socials com Instagram. Molts dels que publiquen són consumidors més que venedors. Depenent de la normativa de la seva localitat i de la possibilitat de prescriure medicaments fins i tot en localitats que difereixen en la seva legislació sobre medicaments, també poden ser legal consumidors.

Imatges relacionades amb drogues introduïdes a la base de dades del projecte.

Imatges relacionades amb drogues introduïdes a la base de dades del projecte.

A més, el comportament dels traficants de drogues a Instagram no sempre és explícit; Sovint, els distribuïdors s'anuncien mitjançant comentaris i hashtags en lloc de publicacions multimèdia, que en general serien més fàcils d'identificar com a contingut de "tractament de drogues", tant per als sistemes de supervisió humana com de màquines. Per tant, els hashtags i l'activitat de comentaris s'han incorporat com a actius identificatius al nou sistema.

Múltiples patrons del tràfic de drogues a les publicacions d'Instagram.

Múltiples patrons del tràfic de drogues a les publicacions d'Instagram.

A més de l'anàlisi de text basada en BERT i la investigació d'imatges derivades de ResNet, el treball incorpora la fusió de dades multimodals a nivell de característiques, tal com es proposa a l'IEEE 2016. paper Anàlisi de correlació discriminant: fusió a nivell de característiques en temps real per al reconeixement biomètric multimodal.

Hashtags com a llavors per a una base de dades

El mecanisme de rastreig web del projecte comença el seu viatge cap a la identificació de comptes de tràfic de drogues traçant el camí de 200 hashtags relacionats amb drogues identificats per experts del domini, utilitzant el cerca d’etiquetes API.

Les imatges de les publicacions que utilitzen els hashtags es classifiquen mitjançant un binari basat en VGG-16 model de classificació. Les imatges que es relacionen amb les imatges de drogues conegudes es desen al sistema i la publicació es converteix en un objecte JSON per a la seva posterior recuperació.

Aleshores, el marc s'estén als comentaris i informació relacionats (tant text com imatges) continguts a la pàgina d'inici dels pòsters que han participat en l'etiqueta i el contingut dels quals s'ha marcat com a relacionat amb drogues. D'aquesta manera, es van incorporar al conjunt de dades 10,000 publicacions potencials i 23,034 pàgines d'inici d'usuaris.

Atès que els hashtags relacionats amb les drogues evolucionen constantment per evitar la detecció de patrons i l'atenció de les autoritats, qualsevol hashtag nou a la publicació marcada que no formi part de la col·lecció d'etiquetes de llavors s'anota i es registra per a un ús futur.

Després de l'etiquetatge a la interfície basada en web (vegeu la imatge superior), la fusió de dades multimodal ha d'acomodar el fet que no totes les publicacions contindran els quatre tipus de dades possibles. Per tant, l'algoritme és capaç de tolerar nou d'un total de 16 subpunts entre els quatre tipus de dades, utilitzant característiques de concatenació i fusió, on els elements que falten correspondran a zero en el càlcul.

XarxaX

El conjunt de dades s'utilitza finalment a través de Paquet de llenguatge NetworkX Python proposat el 2008 pel Laboratori Nacional de Los Alamos a Nou Mèxic. La xarxa X s'ha utilitzat àmpliament en operacions a gran escala, inclosos gràfics amb més de 10 milions de nodes.

En tractar els hashtags del conjunt de dades com si s'haguessin inclòs en una publicació, els investigadors van poder generar un gràfic no dirigit relacionat amb les drogues perquè NetworkX l'analitzés.

El conjunt de dades IDDIG es va provar amb una varietat de protocols, com ara la fusió de dades multimodal, la fusió de dades multifons i la fusió basada en quàdruple, i va aconseguir resultats de precisió de fins a un 95% pel que fa a la identificació de publicacions i usuaris relacionats amb drogues, mitjançant comparació amb els mètodes d'identificació human-in-the-loop.

També va ser possible generar "sunburst plots" que revelaven indicadors amplis per a la disposició geogràfica de l'activitat relacionada amb les drogues a Instagram, i altres possibles futures línies d'investigació en projectes similars.