სტუბი 6 ნაბიჯი სოციალური მედიიდან ბუნებრივი ენის დამუშავებით ინფორმაციის მისაღებად - Unite.AI
დაკავშირება ჩვენთან ერთად

ხელოვნური ინტელექტი

6 ნაბიჯი სოციალური მედიიდან ბუნებრივი ენის დამუშავებით ინფორმაციის მისაღებად

mm
განახლებულია on
6 ნაბიჯი სოციალური მედიიდან მიღებული ინფორმაციის მისაღებად ბუნებრივი ენის დამუშავებით (NLP)
სურათის წყარო: canva

სოციალური მედიის სენტიმენტების ანალიზი და ბუნებრივი ენის დამუშავება (NLP) არის აპრობირებული გზა ხალხისა და საზოგადოებისგან რისთვისაც. იმის ნაცვლად, რომ ანალიტიკოსს სთხოვოთ, რომ კვირაობით გაატაროს სოციალური მედიის კომენტარების წაკითხვა და ანგარიშის მიწოდება, განწყობის ანალიზს შეუძლია მოგაწოდოთ სწრაფი შეჯამება. ეს ნიშნავს, რომ თქვენ შეგიძლიათ უფრო სწრაფად მიიღოთ გადაწყვეტილებები.

რატომ გჭირდებათ სენტიმენტის ანალიზი და NLP სოციალურ მედიაში?

თქვენ ცხოვრობთ დიდი მონაცემების ეპოქაში. მაგალითისთვის მიიღეთ სოციალური მედიის მომხმარებლები. In 2019, მსოფლიოში სოციალური მედიის 3.4 მილიარდი აქტიური მომხმარებელი იყო. ჩართულია YouTube მხოლოდ ყოველდღიურად უყურებს ერთი მილიარდი საათის ვიდეო კონტენტს. ყველა ინდიკატორი გვაფიქრებინებს, რომ დროთა განმავლობაში ჩვენ ვნახავთ მეტ მონაცემს, და არა ნაკლებს.

უბრალოდ ძალიან ბევრი მონაცემია, რომ ხელით გადახედოთ. დიდი ბიუჯეტის მქონე ორგანიზაციებიც კი, როგორიცაა ეროვნული მთავრობები და გლობალური კორპორაციები, იყენებენ მონაცემთა ანალიზის ინსტრუმენტებს, ალგორითმებს და ბუნებრივი ენის დამუშავებას.

ამ ტექნიკის გამოყენებით, თქვენ გესმით, რას ამბობენ ადამიანები თქვენი ბრენდის შესახებ. შერჩევის მიკერძოების მინიმიზაციის შესაძლებლობა და ანეკდოტებზე დაყრდნობის თავიდან აცილების უნარი ნიშნავს, რომ თქვენს გადაწყვეტილებებს ექნება მყარი საფუძველი. ეს ნიშნავს, რომ თქვენ დაუშვებთ ნაკლებ შეცდომებს, როდესაც რეაგირებთ სწრაფად ცვალებად სამყაროზე.

განწყობის ანალიზი და NLP მოქმედებაში: დაქირავება, საზოგადოებრივი ჯანმრთელობა და მარკეტინგი

შეიძლება გაინტერესებთ, არის თუ არა ეს მონაცემთა ანალიზის ხელსაწყოები გამოსადეგი რეალურ სამყაროში, თუ საიმედოა მათი გამოყენება. ეს ხელსაწყოები ათ წელზე მეტია არსებობს და ყოველწლიურად უმჯობესდება. NLP და სენტიმენტების ანალიზით შეგიძლიათ პრობლემების უფრო სწრაფად გადაჭრა.

დაზოგეთ დრო დაქირავების დროს

დაქირავებისას, ხარისხიანი კანდიდატების პოვნა რთულია. ვორკოპოლისი შეფასებულია, რომ „მოცემულ როლზე განმცხადებელთა 75% რეალურად არ არის კვალიფიცირებული ამის შესასრულებლად“. ამ კანდიდატებზე დროის დახარჯვა არ არის პროდუქტიული. საბედნიეროდ, ბუნებრივი ენის დამუშავება და ანალიტიკა დაგეხმარებათ კარგი კანდიდატების იდენტიფიცირებაში, რათა დრო პროდუქტიულად გამოიყენოთ. Ამიტომაც Blue Orange Digital მუშაობდა ჰეჯ-ფონდთან მათი ადამიანური რესურსების პროცესის ოპტიმიზაცია. განმცხადებლის მონაცემებისა და რეზიუმეების ათი წლის ღირებულების გამოყენებით, ფირმას ახლა აქვს დახვეწილი ქულების მოდელი, რათა მოძებნოს შესაფერისი კანდიდატები.

საზოგადოებრივი ჯანმრთელობა და გადაუდებელი შემთხვევები

2020 წელს ჩვენ ყველამ დავიწყეთ საზოგადოებრივი ჯანდაცვის მონაცემთა ფართომასშტაბიანი ანალიზის ღირებულების შესწავლა COVID-ის სწრაფი გავრცელების გამო. ამ კრიზისებში აუცილებელია სოციალური ქცევის ცვლილებების სწრაფად გამოვლენა. NLP-ით შეგიძლიათ გააანალიზოთ სოციალური მედია სენტიმენტების შესაფასებლად. მაგალითად, ბოლო დროს პროექტმა გააანალიზა 1,000-ზე მეტი ტვიტი საკვანძო სიტყვის ნიღბების გამოყენება იმის გასაგებად, თუ როგორ ფიქრობენ და გრძნობენ ადამიანები ნიღბებს.

მარკეტინგი

მარკეტინგში თქვენ უნდა იყოთ ინფორმირებული იმის შესახებ, თუ როგორ ფიქრობს და გრძნობს თქვენი სამიზნე ბაზარი. ა 2019 study გამოიყენა Twitter-ის განწყობის ანალიზი, რათა უკეთ გაეგო ტანსაცმლის ბრენდები: Nike და Adidas. 30,895 ინგლისურენოვანი ტვიტის გაანალიზებისას, მკვლევარებმა დაადგინეს, რომ „ადიდასს Nike-ზე მეტი დადებითი განწყობა აქვს“. თუმცა, ტვიტერების 50%-ზე მეტს ნეიტრალური განწყობა ჰქონდა. ეს ნიშნავს, რომ ჯერ კიდევ არის მნიშვნელოვანი შესაძლებლობა, მიიღოთ მეტი პოზიტიური მოხსენებები ბაზრიდან.

მოწონებები არის ახალი ვალუტა, NLP სოციალურ მედიაში

მოწონებები არის ახალი ვალუტა, NLP სოციალურ მედიაში

როგორ მუშაობს სენტიმენტების ანალიზი ტექნიკურად?

იმისათვის, რომ განწყობის ანალიზი ეფექტურად იმუშაოს, გასათვალისწინებელია რამდენიმე არსებითი ტექნიკური პუნქტი.

1) შეიმუშავეთ შესაბამისი ბიზნეს შეკითხვა

გადაწყვიტეთ, რომელ კითხვებზე გსურთ პასუხის გაცემა და არის თუ არა ეს მონაცემთა ტექნიკა ამ კითხვებისთვის. განვიხილოთ ორი მარკეტინგული კითხვა

  • უნდა დავიწყოთ მარკეტინგული პარტნიორობა საკრედიტო ბარათების კომპანიასთან მეტი გაყიდვისთვის?
  • ვიღებთ თუ არა შემოსავალს ჩვენი გავლენიანი მარკეტინგული კამპანიებიდან?

პირველი კითხვა ეხება სტრატეგიას და სამომავლო შესაძლებლობებს, ამიტომ არ იქნება ბევრი მონაცემი გასაანალიზებლად. ამიტომ, ჩვენ გირჩევთ არ ეცადოთ ამ კითხვაზე პასუხის გაცემა სენტიმენტალური ანალიზით. ამის საპირისპიროდ, მეორე კითხვა უფრო პერსპექტიულია ბუნებრივი ენის დამუშავებისთვის. ის მაინც მოითხოვს შემდგომ დახვეწას, მაგრამ თქვენ გაქვთ შესაბამისი კითხვის დაწყება.

2) იპოვნეთ თქვენი მონაცემთა წყარო

თქვენი შემდეგი ნაბიჯი არის ინფორმაციის შესაბამისი წყაროს პოვნა გასაანალიზებლად. იდეალურ შემთხვევაში, მოძებნეთ მონაცემთა წყაროები, რომლებიც უკვე გაქვთ, ვიდრე რაიმე ახლის შექმნა. დაქირავებისთვის, თქვენ ალბათ გაქვთ განმცხადებლებისა და წარმატებული დაქირავებების მონაცემთა ბაზა თქვენი განმცხადებლის თვალთვალის სისტემაში. მარკეტინგში შეგიძლიათ ჩამოტვირთოთ მონაცემები სოციალური მედიის პლატფორმებიდან API-ების გამოყენებით.

რჩევა: მონაცემთა მოცულობა სასიცოცხლოდ მნიშვნელოვანია განწყობის ანალიზისთვის. როგორც წესი, თქვენს მონაცემთა ნაკრებს უნდა ჰქონდეს მინიმუმ 1,000 მაგალითი (მაგ., 1,000 ტვიტი ან 1,000 განმცხადებლის პროფილი). ამაზე ნაკლები არაფერია და ნაკლებად სავარაუდოა, რომ მიიღოთ სტატისტიკურად მნიშვნელოვანი შედეგები.

წაიკითხეთ მეტი მონაცემთა ალტერნატიული წყაროების შესახებ და თქვენი მონაცემების დამატება მესამე მხარის მონაცემებით.

3) წინასწარ დაამუშავეთ თქვენი მონაცემები

მონაცემთა წყაროების უმეტესობა, განსაკუთრებით სოციალური მედია და მომხმარებლის მიერ გენერირებული კონტენტი, საჭიროებს წინასწარ დამუშავებას, სანამ მასთან მუშაობას შეძლებთ. ვივარაუდოთ, რომ თქვენ აანალიზებთ ტექსტის რესურსს, დაიწყეთ არასაჭირო პუნქტუაციის, სიმბოლოების და სხვა გამწმენდი ტექსტის წაშლით. ამ საფეხურზე დროის დახარჯვა გააუმჯობესებს მიღებული ანალიზის ხარისხს.

ვინაიდან მონაცემთა უფრო ვრცელი ნაკრები უკეთეს შედეგებს იძლევა, გამოიყენეთ ინსტრუმენტები მონაცემთა შემდგომი გასასუფთავებლად. მაგალითად, პორტერ სტემერის ალგორითმი ტექსტური მონაცემების გასასუფთავებლად სასარგებლო გზაა. ეს ალგორითმი დაგეხმარებათ ამოიცნოთ ძირითადი სიტყვები და შეამციროთ ხმაური თქვენს მონაცემებში.

4) გაანალიზეთ მონაცემები

თქვენი მიზნებიდან გამომდინარე, არსებობს სხვადასხვა პროგრამული ხელსაწყოები და ალგორითმები მონაცემთა გასაანალიზებლად. თუ ვივარაუდებთ, რომ თქვენ აანალიზებთ ტექსტს, Naive Bayes ალგორითმი არის სწორი არჩევანი სენტიმენტალური ანალიზის ჩასატარებლად.

5) კრიტიკულად შეაფასეთ შედეგები

თქვენ არ შეგიძლიათ უბრალოდ დაეთანხმოთ მანქანების მიერ წარმოქმნილ მონაცემთა ანალიზს არაკრიტიკულად. მკვლევარებმა აღმოაჩინეს, რომ მანქანათმცოდნეობის ხელსაწყოები ასახავს ადამიანის მიკერძოებას. Მაგალითად, ამაზონმა გააუქმა ადამიანური რესურსების ალგორითმი რადგან ის დისკრიმინაციას უწევდა ქალ კანდიდატებს. ისტორიული მონაცემები ხომ ამ შემთხვევაში ძირითადად მამაკაცებზე იყო დაფუძნებული. სწორედ აქ არის თქვენი ღირებულებები – როგორიცაა ჩართულობისა და მრავალფეროვნებისადმი ერთგულება – უნდა დააბალანსოს მონაცემებზე ორიენტირებული შეხედულებები. 

ეს ასევე ეხება საძიებო სისტემების მიერ მიღებულ შედეგებს. KISSPatent-ის აღმასრულებელი დირექტორი დ'ვორა გრეიზერი იძლევა მაგალითს, თუ როგორ აუმჯობესებს NLP საძიებო სისტემების შედეგებს ინტელექტუალური საკუთრების მსოფლიო ორგანიზაციის ინფორმაციის გაანალიზებისას. 

„NLP-ის გამოყენება განსაკუთრებით აქტუალური და სასარგებლოა ახალი ტექნოლოგიების პატენტების მოძიებისას, როგორიცაა ბლოკჩეინი ან ხელოვნური ინტელექტი, რომლებსაც არ აქვთ განსაზღვრული კატეგორიები, მაგალითად, ინტელექტუალური საკუთრების მსოფლიო ორგანიზაციაში. პატენტების მოძიება და პოვნა მნიშვნელოვანია ყველა ინოვატორისთვის, რადგან ამ გზით მათ შეუძლიათ იცოდნენ, ვინ მუშაობს გარკვეულ ინოვაციებზე და არის თუ არა მათი ინოვაციები ისეთივე უნიკალური და ახალი, როგორც ფიქრობენ. ”

KISSPatent-ის აღმასრულებელი დირექტორი, დ'ვორა გრეიზერი

6) განსაზღვრეთ შემდეგი ნაბიჯები

თავისთავად, განწყობის ანალიზი არ შეცვლის თქვენს ბიზნესს. თქვენ უნდა გადახედოთ ამ შეხედულებებს და მიიღოთ გადაწყვეტილება. მაგალითად, თქვენ შეიძლება აღმოაჩინოთ, რომ თქვენ გაქვთ მზარდი ნეგატიური განწყობა თქვენი ბრენდის შესახებ ონლაინ. ამ შემთხვევაში, თქვენ შეგიძლიათ დაიწყოთ კვლევითი პროექტი მომხმარებელთა პრობლემების დასადგენად და შემდეგ გამოუშვათ თქვენი პროდუქტის გაუმჯობესებული ვერსია.

არ იცით სად უნდა დაიწყოთ NLP სოციალურ მედიაში?

სწორი მონაცემების პოვნა, ამ მონაცემებზე ალგორითმების გამოყენება და გამოსაყენებელი ბიზნესის აზრების მიღება ადვილი არ არის. ყოველივე ამის შემდეგ, ღრმა რესურსების მქონე დიდმა კომპანიებმა დაუშვეს შეცდომები ბუნებრივი ენის დამუშავების პროექტებში. სწორედ ამიტომ ღირს თქვენი მონაცემების გარე პერსპექტივის მიღება. კონტაქტი ლურჯი ნარინჯისფერი ციფრული დღეს იმის გასარკვევად, თუ როგორ შეგიძლიათ მიიღოთ უფრო სწრაფი ინფორმაცია სოციალური მედიიდან და თქვენი ორგანიზაციის სხვა მონაცემებიდან.

ხელოვნური ინტელექტისა და ტექნოლოგიური ტენდენციების შესახებ მეტი ინფორმაციისთვის იხილეთ ჯოშ მირამანტი, Blue Orange Digital-ის აღმასრულებელი დირექტორი მონაცემთა დაფუძნებული გადაწყვეტილებების შესახებ. მიწოდებასა, ჯანდაცვის დოკუმენტების ავტომატიზაციადა სხვა შემთხვევის შესწავლა.

ჯოშ მირამანტი არის აღმასრულებელი დირექტორი და დამფუძნებელი ლურჯი ნარინჯისფერი ციფრული, მონაცემთა მეცნიერების და მანქანათმცოდნეობის უმაღლესი რანგის სააგენტო, რომელსაც აქვს ოფისები ნიუ-იორკსა და ვაშინგტონში. Miramant არის პოპულარული სპიკერი, ფუტურისტი და სტრატეგიული ბიზნესისა და ტექნოლოგიების მრჩეველი საწარმო კომპანიებისა და სტარტაპებისთვის. ის ეხმარება ორგანიზაციებს თავიანთი ბიზნესის ოპტიმიზაციაში და ავტომატიზაციაში, მონაცემთა ბაზაზე ორიენტირებული ანალიტიკური ტექნიკის დანერგვაში და ახალი ტექნოლოგიების გააზრებაში, როგორიცაა ხელოვნური ინტელექტი, დიდი მონაცემები და ნივთების ინტერნეტი.