Modely a platformy AI

6 Kroků K Získání Přehledů Z Sociálních Médií S Přirozeným Zpracováním Jazyka

mm
6 Steps to get insights from social media at scale with natural language processing(NLP)

Analýza sentimentu a přirozené zpracování jazyka (NLP) sociálních médií je osvědčeným způsobem, jak získat přehledy z lidí a společnosti. Místo toho, abyste požádali analytika, aby strávil týdny čtením komentářů na sociálních médiích a poskytováním zprávy, může analýza sentimentu poskytnout rychlý souhrn. To znamená, že můžete učinit rozhodnutí rychleji.

Proč Potřebujete Analýzu Sentimentu A NLP Ve Sociálních Médiích?

Žijete v éře velkých dat. Vezměme si jako příklad uživatele sociálních médií. V 2019existovalo 3,4 miliardy aktivních uživatelů sociálních médií na světě. Na YouTubesamotném je denně sledováno jedna miliarda hodin videa. Každý ukazatel naznačuje, že budeme vidět více dat vyproduktovaných v budoucnu, ne méně.

Existuje prostě příliš mnoho dat, aby je bylo možné přezkoumat ručně. I organizace s velkými rozpočty, jako jsou národní vlády a globální korporace, používají nástroje pro analýzu dat, algoritmy a přirozené zpracování jazyka.

Pomocí těchto technik můžete pochopit, co lidé říkají o vaší značce právě teď. Schopnost minimalizovat výběrový bias a vyhnout se spoléhání na anekdoty znamená, že vaše rozhodnutí budou mít pevný základ. To znamená, že budete dělat méně chyb, protože reagujete na rychle se měnící svět.

Analýza Sentimentu A NLP V Praxi: Nábor, Veřejné Zdraví A Marketing

Můžete se ptát, zda jsou tyto nástroje pro analýzu dat užitečné ve skutečném světě, nebo zda jsou spolehlivé k použití. Tyto nástroje existují již více než deset let a každý rok se zlepšují. S NLP a analýzou sentimentu můžete řešit problémy rychleji.

Ušetřete Čas Během Náboru

Při náboru je obtížné najít kvalitní kandidáty. Workopolisodhaduje, že “až 75 % uchazečů o určitou pozici nejsou vlastně kvalifikováni pro ni.” Strávit čas na těchto kandidátech není produktivní. Naštěstí mohou přirozené zpracování jazyka a analýza pomoci identifikovat vhodné kandidáty, aby jste mohli využít čas produktivně. Proto Blue Orange Digitalspolupracoval s hedge fondemna optimalizaci jejich lidských zdrojů. Používají deset let stará data a životopisy, firma nyní má sofistikovaný model hodnocení pro nalezení vhodných kandidátů.

Veřejné Zdraví A Nouzové Situace

V roce 2020 jsme všichni začali učit hodnotu rozsáhlé analýzy dat veřejného zdraví kvůli rychlému šíření COVID. V těchto krizích je zásadní rychlá detekce změn ve společenském chování. S NLP můžete analyzovat sociální média, aby vyhodnotily sentiment. Například nedávný projektanalyzoval více než 1 000 tweetů pomocí klíčového slova masky, aby pochopil, jak lidé myslí a cítí o maskách.

Marketing

V marketingu potřebujete zůstat informováni o tom, jak vaše cílové trhu myslí a cítí. Studie z roku 2019použila analýzu sentimentu na Twitteru, aby pochopila značky oblečení: Nike a Adidas lépe. Analyzujících 30 895 anglických tweetů, výzkumníci zjistili, “Adidas má více pozitivního sentimentu než Nike.” Nicméně, více než 50 % tweetů mělo neutrální sentiment. To znamená, že stále existuje významná příležitost získat více pozitivních zmínek z trhu.

Likes jsou nová měna, NLP ve sociálních médiích

Likes jsou nová měna, NLP ve sociálních médiích

Jak Funkční Analýza Sentimentu Technicky?

Aby analýza sentimentu fungovala efektivně, existují beberapa základních technických bodů, které je třeba mít na paměti.

1) Vyvinout Relevantní Obchodní Otázku

Rozhodněte, jaké otázky chcete zodpovědět a zda jsou tyto techniky dat vhodné pro tyto otázky. Zvažme dvě marketingové otázky

  • Měli bychom spustit marketingový partnerství s kreditní kartou, abychom zvýšili prodej?
  • Získáváme návratnost našich kampaní influencer marketingu?

První otázka se týká strategie a budoucích možností, takže nebude mnoho dat k analýze. Proto bychom doporučili nezkusit zodpovědět tuto otázku pomocí analýzy sentimentu. Naopak, druhá otázka je slibnější pro přirozené zpracování jazyka. Stále vyžaduje další úpravy, ale máte začátek vhodné otázky.

2) Najít Vaše Zdroj Dat

Vaše další krok je najít relevantní zdroj dat k analýze. Ideálně hledáte zdroje dat, které již máte, spíše než vytvářet něco nového. Pro nábor pravděpodobně máte databázi uchazečů a úspěšných náborů ve svém systému sledování uchazečů. V marketingu můžete stáhnout data ze sociálních médií pomocí API.

Tip: Objem dat je zásadní pro analýzu sentimentu, aby fungovala. Jako pravidlo palce by vaše sada dat měla mít alespoň 1 000 příkladů (například 1 000 tweetů nebo 1 000 profilů uchazečů). Cokoliv méně než to a jste méně pravděpodobně získat statisticky významné výsledky.

Přečtěte si více o alternativních zdrojích dat a doplnění vašich dat o třetí strany.

3) Předzpracovat Vaše Data

Většina zdrojů dat, zejména sociálních médií a uživatelsky generovaného obsahu, vyžaduje předzpracování předtím, než s nimi můžete pracovat. Předpokládejme, že analyzujete textový zdroj, začněte odstraněním zbytečných interpunkčních znamének, znaků a dalších textů. Strávit čas na tomto kroku zlepšuje kvalitu výsledné analýzy.

Pоскольку rozsáhlejší sady dat tendují produkovat lepší výsledky, použijte nástroje k dalšímu čištění dat. Například Algoritmus Porter Stemmerje užitečný způsob, jak vyčistit textová data. Tento algoritmus pomáhá identifikovat kořenová slova a snížit hluk ve vašich datech.

4) Analyzovat Data

V závislosti na vašich cílech existují různé softwarové nástroje a algoritmy k dispozici pro analýzu dat. Předpokládejme, že analyzujete text, algoritmus Naïve Bayes je správnou volbou pro provedení analýzy sentimentu.

5) Kriticky Hodnotit Výstupy

Nemůžete prostě přijmout data generovaná stroji bez kritiky. Výzkumníci zjistili, že nástroje strojového učení tendují k odrážení lidského biasu. Například Amazon zrušil algoritmus lidských zdrojůprotože diskriminoval proti ženským kandidátům. Vždyť historická data, v tomto případě, byla založena hlavně na mužích. To je místo, kde vaše hodnoty – jako je závazek k inkluzi a rozmanitosti – potřebují vyvážit datové přehledy.

To se také vztahuje na výstupy vygenerované vyhledávači. CEO KISSPatent D’vorah Graeser poskytuje příklad, jak NLP zlepšuje jejich výsledky vyhledávače při analýze informací z Světové organizace duševního vlastnictví

“Používání NLP je zvláště relevantní a užitečné, když se snažíte najít patenty pro nové technologie, jako je blockchain nebo umělá inteligence, které nemají definované kategorie ve Světové organizaci duševního vlastnictví, například. Být schopen vyhledávat a najít patenty je důležité pro všechny inovátory, protože tím můžete vědět, kdo pracuje na určitých inovacích a zda vaše inovace jsou tak jedinečné a nové, jak si myslíte.”

CEO KISSPatent, D’vorah Graeser

6) Určit Další Kroky

Sám o sobě analýza sentimentu nezmění váš podnik. Musíte přezkoumat tyto přehledy a učinit rozhodnutí. Například, můžete zjistit, že máte rostoucí množství negativního sentimentu o vaší značce online. V takovém případě můžete zahájit výzkumný projekt, aby identifikovat obavy zákazníků a poté uvolnit vylepšenou verzi vašeho produktu.

Nevíte, Kde Začít S NLP Ve Sociálních Médiích?

Najít správná data, aplikovat algoritmy na tato data a získat použitelné obchodní přehledy není snadné. Vždyť velké společnosti s hlubokými zdroji udělaly chyby ve svých projektech přirozeného zpracování jazyka. Proto se vyplatí získat vnější perspektivu na vaše data. Kontaktujte Blue Orange Digitaldnes, abyste zjistili, jak můžete získat rychlejší přehledy ze sociálních médií a dalších dat ve vaší organizaci.

Pro více informací o AI a technologických trendech, podívejte se na data-driven řešení CEO Blue Orange Digital, Joshe Miramanta, pro Řetězec dodávek, Automatizaci dokumentů zdravotní péče a další případové studie.

Josh Miramant je CEO a zakladatel Blue Orange Digital, špičkové agentury pro datové vědy a strojové učení s kancelářemi v New York City a Washington DC. Miramant je populární řečník, futurolog a strategický obchodní a technologický poradce pro podniky a startupy. Pomáhá organizacím optimalizovat a automatizovat své podnikání, implementovat analytické techniky založené na datech a pochopit důsledky nových technologií, jako je umělá inteligence, big data a Internet věcí.