Connect with us

6 kroků, jak získat informace ze sociálních médií pomocí zpracování přirozeného jazyka

Umělá inteligence

6 kroků, jak získat informace ze sociálních médií pomocí zpracování přirozeného jazyka

mm
6 Steps to get insights from social media at scale with natural language processing(NLP)

Analýza sentimentu a zpracování přirozeného jazyka (NLP) na sociálních médiích je osvědčeným způsobem, jak získat informace z lidí a společnosti. Místo toho, aby analytik strávil týdny čtením komentářů na sociálních médiích a poskytováním zprávy, může analýza sentimentu poskytnout rychlý souhrn. To znamená, že můžete učinit rozhodnutí rychleji.

Proč potřebujete analýzu sentimentu a NLP na sociálních médiích?

Žijete v éře velkých dat. Vzít si uživatele sociálních médií jako příklad. V 2019, bylo na světě 3,4 miliardy aktivních uživatelů sociálních médií. Na YouTube samotném je denně sledováno jedna miliarda hodin videa. Každý ukazatel naznačuje, že uvidíme více vyprodukovaných dat, ne méně.

Je prostě příliš mnoho dat, aby je bylo možné ručně přezkoumat. I organizace s velkými rozpočty, jako jsou národní vlády a globální korporace, používají nástroje pro analýzu dat, algoritmy a zpracování přirozeného jazyka.

Používáním těchto technik můžete pochopit, co lidé říkají o vaší značce právě teď. Schopnost minimalizovat výběrový bias a nezatěžovat se anekdotami znamená, že vaše rozhodnutí budou mít pevný základ. To znamená, že budete dělat méně chyb, protože reagujete na rychle se měnící svět.

Analýza sentimentu a NLP v akci: nábor, veřejná zdraví a marketing

Možná se ptáte, zda jsou tyto nástroje pro analýzu dat užitečné ve skutečném světě nebo zda jsou spolehlivé k použití. Tyto nástroje existují již více než deset let a zlepšují se každý rok. S NLP a analýzou sentimentu můžete řešit problémy rychleji.

Ušetřete čas při náboru

Při náboru je obtížné najít kvalitní kandidáty. Workopolis odhaduje, že “až 75 % uchazečů o určitou pozici nejsou vlastně kvalifikováni pro ni”. Strávit čas na těchto kandidátech není produktivní. Naštěstí mohou přírodní jazykové zpracování a analytika pomoci identifikovat vhodné kandidáty, aby jste mohli využít čas produktivně. Proto Blue Orange Digital spolupracoval s hedge fondem na optimalizaci jejich lidských zdrojů. Používáním deset let starých dat a životopisů má firma nyní sofistikovaný model hodnocení pro nalezení vhodných kandidátů.

Veřejná zdraví a nouzové situace

V roce 2020 jsme všichni začali učit se hodnotu rozsáhlé analýzy veřejných zdravotních dat kvůli rychlému šíření COVID. V těchto krizích je zásadní rychlá detekce změn ve společenském chování. S NLP můžete analyzovat sociální média, aby vyhodnotily sentiment. Například nedávný projekt analyzoval více než 1 000 tweetů pomocí klíčového slova masky, aby pochopil, jak lidé myslí a cítí o maskách.

Marketing

V marketingu potřebujete zůstat informováni o tom, jak vaše cílové trhu myslí a cítí. 2019 studie použila analýzu sentimentu na Twitteru, aby pochopila značky oblečení: Nike a Adidas lépe. Analýzou 30 895 anglických tweetů výzkumníci zjistili, “Adidas má více pozitivního sentimentu než Nike”. Nicméně více než 50 % tweetů mělo neutrální sentiment. To znamená, že stále existuje významná příležitost získat více pozitivních zmínek z trhu.

Likes are the new currency, NLP in social media

Likes are the new currency, NLP in social media

Jak technicky funguje analýza sentimentu?

Aby analýza sentimentu fungovala účinně, je třeba mít na paměti několik základních technických bodů.

1) Vyvinout relevantní obchodní otázku

Rozhodněte, jaké otázky chcete zodpovědět a zda jsou tyto datové techniky vhodné pro tyto otázky. Zvažme dvě marketingové otázky

  • Měli bychom spustit marketingovou spolupráci s кредитní kartou, aby jsme zvýšili prodej?
  • Získáváme návratnost z našich kampaní influencer marketingu?

První otázka se týká strategie a budoucích možností, takže nebude mnoho dat k analýze. Proto bychom vám nedoporučovali zkusit zodpovědět tuto otázku pomocí analýzy sentimentu. Naopak druhá otázka je slibnější pro přírodní jazykové zpracování. Stále vyžaduje další úpravy, ale máte začátek vhodné otázky.

2) Najít zdroj dat

Vaším dalším krokem je najít relevantní zdroj dat pro analýzu. Ideálně hledejte zdroje dat, které již máte, spíše než vytvářet něco nového. Pro nábor pravděpodobně máte databázi uchazečů a úspěšných náborů ve svém systému sledování uchazečů. V marketingu můžete stáhnout data ze sociálních médií pomocí API.

Tip: Objem dat je zásadní pro analýzu sentimentu, aby fungovala. Jako pravidlo by vaše datová sada měla mít alespoň 1 000 příkladů (například 1 000 tweetů nebo 1 000 profilů uchazečů). Cokoliv méně než to a jste méně pravděpodobně získají statisticky významné výsledky.

Přečtěte si více o alternativních zdrojích dat a doplnění vašich dat pomocí třetích stran.

3) Předzpracovat data

Většina zdrojů dat, zejména sociálních médií a uživatelsky generovaného obsahu, vyžaduje předzpracování předtím, než s nimi můžete pracovat. Předpokládejme, že analyzujete textový zdroj, začněte odstraněním zbytečných interpunkčních znamének, znaků a dalších textů. Strávit čas na tomto kroku zlepšuje kvalitu výsledné analýzy.

Použijte nástroje pro další čištění dat. Například Porter Stemmer Algorithm je užitečný způsob, jak vyčistit textová data. Tento algoritmus pomáhá identifikovat kořenová slova a snížit hluk ve vašich datech.

4) Analyzovat data

V závislosti na vašich cílech existují různé softwarové nástroje a algoritmy k dispozici pro analýzu dat. Předpokládejme, že analyzujete text, Naïve Bayes algoritmus je správnou volbou pro provedení analýzy sentimentu.

5) Kriticky vyhodnotit výstupy

Nemůžete prostě přijmout data generovaná stroji bez kritiky. Výzkumníci zjistili, že nástroje strojového učení tendují k odrážení lidského biasu. Například Amazon zrušil algoritmus lidských zdrojů, protože diskriminoval proti ženským kandidátům. Historická data, v tomto případě, byla založena hlavně na mužích. To je místo, kde vaše hodnoty – jako je závazek k inkluzi a rozmanitosti – potřebují vyvážit datové poznatky. 

To platí také pro výstupy vygenerované vyhledávači. CEO KISSPatent D’vorah Graeser poskytuje příklad toho, jak NLP zlepšuje jejich výsledky vyhledávače při analýze informací ze Světové organizace duševního vlastnictví 

“Používání NLP je zvláště relevantní a užitečné, když se snažíte najít patenty pro nové technologie, jako je blockchain nebo umělá inteligence, které nemají definované kategorie ve Světové organizaci duševního vlastnictví, například. Být schopni vyhledávat a najít patenty je důležité pro všechny inovátory, protože tak mohou vědět, kdo pracuje na určitých inovacích a zda jejich inovace jsou tak jedinečné a nové, jak si myslí.”

CEO KISSPatent, D’vorah Graeser

6) Určit další kroky

Sám o sobě analýza sentimentu nezmění váš podnik. Musíte přezkoumat tyto poznatky a učinit rozhodnutí. Například můžete zjistit, že máte rostoucí množství negativního sentimentu o vaší značce online. V takovém případě můžete zahájit výzkumný projekt, aby identifikovali obavy zákazníků a poté vydali vylepšenou verzi vašeho produktu.

Nevíte, kde začít s NLP na sociálních médiích?

Najít správná data, aplikovat algoritmy na tato data a získat využitelné obchodní poznatky není snadné. Velké společnosti s hlubokými zdroji udělaly chyby ve svých projektech NLP. Proto se vyplatí získat vnější perspektivu na vaše data. Kontaktujte Blue Orange Digital dnes, aby zjistili, jak můžete získat rychlejší poznatky ze sociálních médií a dalších dat ve vaší organizaci.

Pro více informací o AI a technologických trendech, podívejte se na Josh Miramant, CEO Blue Orange Digital’s datové řešení pro Supply Chain, Healthcare Document Automation a další případové studie.

Josh Miramant je CEO a zakladatel Blue Orange Digital, špičkové agentury pro datové vědy a strojové učení s kancelářemi v New York City a Washington DC. Miramant je populární řečník, futurolog a strategický obchodní a technologický poradce pro podniky a startupy. Pomáhá organizacím optimalizovat a automatizovat své podnikání, implementovat analytické techniky založené na datech a pochopit důsledky nových technologií, jako je umělá inteligence, big data a Internet věcí.