Biz bilan ulang

AI Karyeralari 101:

Data Scientist nima? Ish haqi, mas'uliyat va bitta bo'lish uchun yo'l xaritasi

mm
ma'lumotlar olimi nima

Ma'lumotlar olimi - bu tashkilotlarga ma'lumotlarga asoslangan qarorlar qabul qilishda yordam berish uchun ma'lumotlarni to'playdigan, oldindan qayta ishlaydigan va tahlil qiladigan shaxs. Ma'lumotlar ilmi bir muncha vaqtdan beri mehnat bozorida shov-shuvli so'z bo'lib kelgan, ammo bugungi kunda u shulardan biridir eng tez o'sadigan ish rollari. Bundan tashqari, ma'lumotlar bo'yicha olimlarning o'rtacha maoshi yiliga 125,891 dollarni tashkil qiladi Glassdoor.

lekin ma'lumotlar fani nima? Kuzatish va tajriba - bu fan. Ma'lumotlardagi yashirin naqshlarni kuzatish va ma'lumotlarga asoslangan strategiyani yaratish uchun turli xil mashina o'rganish va statistik usullar bilan tajriba o'tkazish ma'lumotlar fani deb ataladi.

Ushbu blogda biz ma'lumotlar olimining roli va mas'uliyati, bitta bo'lish yo'l xaritasi va ma'lumotlar olimi va ma'lumotlar tahlilchisi o'rtasidagi jiddiy farqlarni bilib olamiz.

Ma'lumotlar bo'yicha mutaxassisning mas'uliyati

Ma'lumotlar olimining vazifalari uning maqsadlari, ma'lumotlar strategiyasi va tashkilot hajmiga qarab tashkilotdan tashkilotga farq qilishi mumkin. Kundalik majburiyatlar quyidagilardan iborat:

  • Ma'lumotlarni yig'ish va qayta ishlash
  • Yashirin naqshlarni topish uchun ma'lumotlarni tahlil qiling
  • Algoritmlar va ma'lumotlar modellarini yaratish
  • Trendlarni bashorat qilish uchun mashinani o'rganishdan foydalaning
  • Natijalarni jamoa va manfaatdor tomonlar bilan bog'lang
  • Modelni ishlab chiqarishda qo'llash uchun dasturiy ta'minot muhandislari bilan hamkorlik qilish
  • Maʼlumotlar fani ekotizimidagi eng soʻnggi texnologiya va usullardan xabardor boʻling

Qanday qilib Data Scientist bo'lish mumkin?

Bakalavr darajasi

Kompyuter fanlari bo'yicha bakalavr darajasi ma'lumotlar olimi bo'lish uchun yaxshi qadamdir. Siz dasturlash va dasturiy ta'minot muhandisligi tamoyillari bilan tanishasiz. Statistika yoki fizika bo'yicha bakalavr ham yaxshi poydevor yaratishi mumkin.

Ko'nikmalarni o'rganing

dasturlash

bir ko'ra tahlil 15,000 77 ta maʼlumotlar fanlari boʻyicha ish eʼlonlarining 59 foizi Python tilini va 101 foizi SQLni lavozimga ariza berish uchun zarur boʻlgan mahorat sifatida qayd etgan. Shunday qilib, Python va SQL-ni o'rganish mutlaq shartdir. XNUMX dasturlashni o'rganganingizdan so'ng, siz Machine Learning kutubxonalari va ramkalari bo'yicha tajribaga ega bo'lishingiz kerak, ular quyidagilardan iborat:

  • Yomon
  • Pandas
  • SciPy
  • Skikit o'rganing
  • Tensorflow/PyTorch

Ma'lumotlarni ko'rish

Bizning miyamiz vizual ma'lumotni yozma ma'lumotlarga qaraganda 60,000 XNUMX marta tezroq qayta ishlaydi. Boshqaruv panellari yordamida ma'lumotlarni tahlil qilish natijasida olingan tushunchalarni taqdim etish Ma'lumotlarni vizualizatsiya qilish deb ataladi. Ma'lumotni vizualizatsiya qilishda ma'lumotlar olimlari ma'lumotlarni manfaatdor tomonlarga va jamoaga etkazish uchun mos grafiklardan foydalanadilar. Ma'lumotlarni vizualizatsiya qilish uchun quyidagi vositalardan birortasini bilish etarli:

  • stol
  • Power BI
  • Qarash

Machine Learning

Ushbu bosqich dasturlash bilan bog'liq. haqida tushuncha kompyuterni o'rganish ko'rinmas ma'lumotlar to'plamidagi kelajakdagi tendentsiyalarni bashorat qilish uchun kerak. Har bir ma'lumot olimi bilishi kerak bo'lgan asosiy ML tushunchalari quyidagilardan iborat:

  • Nazorat ostida o‘rganish, nazoratsiz o‘rganish, anomaliyalarni aniqlash, o‘lchamlarni qisqartirish va klasterlash
  • Xususiyat muhandisligi
  • Modelni baholash va tanlash
  • Ansambl usullari
  • Chuqur o'rganish

Ko'p EdTech platformalar va kurslar ma'lumotlar olimi bo'lish uchun zarur bo'lgan yuqorida aytib o'tilgan texnik ko'nikmalarni o'rgatish.

Katta ma'lumot

Katta ma'lumotlar, katta biznes. Har 1 ta ish e'lonidan 5 tasi abituriyentlardan katta ma'lumotlar bilan ishlash ko'nikmalariga ega bo'lishini kutadi. Katta ma'lumotlarni qayta ishlash uchun Spark va Hadoop Frameworks bilimlari talab qilinadi.

Portfel loyihalarini yaratish

Maʼlumotlar boʻyicha oʻquv dasturining yoʻl xaritasini tugatganingizdan soʻng, maʼlumotlar fanlari boʻyicha loyihalarni yaratish orqali bilimlaringizni amaliyotda qoʻllash vaqti keldi. Muammolarni hal qilish orqali qiymatga asoslangan loyihalarni amalga oshiring. Kaggle yoki boshqa ishonchli manbalar orqali real dunyo ma'lumotlarini topish - boshlashning eng yaxshi usuli.

Keyinchalik, ma'lumotlar fanining butun hayotiy tsiklini qo'llang, jumladan: Oldindan ishlov berish, tahlil qilish, modellashtirish, baholash va nihoyat, loyihangizga joylashtirish. O'zingiz erishgan natijalar haqida blog yozish orqali loyihangiz haqida hikoya qiling. Agar siz boshlayotgan bo'lsangiz, ushbu faoliyat ish tajribasini almashtirishi mumkin.

Yumshoq ko'nikmalar

Ma'lumot olimi bo'lish uchun Soft Skills texnik ko'nikmalar kabi muhimdir. Ma'lumotlar bo'yicha olimlar texnik tushunchalarni manfaatdor tomonlarga samarali etkazishlari kerak. Innovatsion ma'lumotlar echimlarini yaratish uchun muammolarni hal qilish va ijodkorlik zarur. Ma'lumotlar bo'yicha olimlar ma'lumotlar tahlilchilari, ma'lumotlar muhandislari va dasturiy ta'minot muhandislari bilan ishlaydi; shuning uchun hamkorlik va jamoaviy ish zarur.

Kirish darajasidagi ishlar

Ma'lumotlar tahlili bo'yicha boshlang'ich darajadagi ishga kirish ma'lumotlar olimi bo'lish uchun ajoyib qadam bo'lishi mumkin. Shu maqsadda rezyumeingizda portfel loyihalarini eslatib o'tish ish beruvchilar oldida ajralib turishingizga yordam beradi. Tajriba va ko'nikmalarga ega bo'lgach, ma'lumotlar fanining roliga o'tishingiz mumkin.

Data Scientist va Data Analyst: Farqi nimada?

Ma'lumotlar olimlari va ma'lumotlar tahlilchilari o'xshash ko'rinishi mumkin. Shunga qaramay, ikkita rol o'rtasida sezilarli farqlar mavjud, ular quyidagilar:

Parameters Ma'lumotlarni tahlilchi Ma'lumotlar olimi
maqsad Muayyan biznes savollariga javob berish uchun ma'lumotlarni tahlil qiladi Ochiq muammolar ustida ishlaydi va bashoratli modellashtirishdan foydalangan holda amaliy tushunchalarni yaratadi
Texnik ko'nikmalar Ma'lumotlar tahlilchisi SQL, Excel va ma'lumotlarni vizualizatsiya qilish vositalarini yaxshi biladi Ma'lumotlar olimi ma'lumotlarni tahlil qilishdan tashqari Python ramkalari va mashinani o'rganish usullari bo'yicha mutaxassis
usullari Ma'lumotlar tahlilchisi tomonidan qo'llaniladigan usullarga regressiya tahlili va gipoteza testi kiradi. Ma'lumot olimi muammoni tahlil qilish uchun mashinani o'rganish va chuqur o'rganish algoritmlari va arxitekturasidan foydalanadi.
Ish hajmi Ko'pincha tuzilgan ma'lumotlar, jumladan ma'lumotlar bazalari va elektron jadvallar bilan ishlaydi. Ish doirasi tuzilgan ma'lumotlar bilan cheklanmaydi. Ma'lumot olimi matn, rasm va audio ma'lumotlar kabi tuzilmagan ma'lumotlarni ham boshqarishi mumkin.

 

Yaratilgan, iste'mol qilingan va qo'lga kiritilgan ma'lumotlarning umumiy hajmi taxminan 64 zettabaytni tashkil etdi 2020, va 181 yilga borib 2025 zettabaytga yetishi prognoz qilinmoqda. Bunday katta hajmdagi maʼlumotlarning imkoniyatlarini ishga solish uchun bizga maʼlumotshunos olimlar kerak. Ma'lumot olimi ma'lumotlarni tahlil qiladi va ma'lumotlarga asoslangan echimlarni taqdim etadi. Ma'lumotlar bo'yicha olimlar eng yuqori qiymatga erishish uchun o'zlarini ilg'or tadqiqot usullari va vositalari bilan yangilab turishlari kerak.

Maʼlumotlar faniga oid koʻproq kontentni xohlaysizmi? Tashrif buyuring unit.ai