الذكاء الاصطناعي 101
ما هي علم البيانات؟

يبدو أن مجال علم البيانات ينمو ويصبح أكثر شعبية كل يوم. وفقًا لشركة LinkedIn، كان علم البيانات واحدًا من أسرع المجالات الوظيفية نموًا في عام 2017 وصنفته Glassdoor في عام 2020 كواحد من أفضل ثلاث وظائف في الولايات المتحدة. نظرًا للشعبية المتزايدة لعلم البيانات، فلا ي驚 أن يصبح المزيد من الناس مهتمين بهذا المجال. ومع ذلك، ما هو علم البيانات بالضبط؟
دعونا نتعرف على علم البيانات، ون花 بعض الوقت في تعريف علم البيانات، واستكشاف كيف يغير البيانات الكبيرة والذكاء الاصطناعي هذا المجال، وتعلم بعض أدوات علم البيانات الشائعة، وفحص بعض الأمثلة على علم البيانات.
ما هو علم البيانات؟
قبل أن نستكشف أي أدوات أو أمثلة لعلم البيانات، سنرغب في الحصول على تعريف دقيق لعلم البيانات.
تعريف “علم البيانات” هو في الواقع قليلاً صعباً، لأن المصطلح يُطبق على العديد من المهام والأساليب المختلفة للتحقيق والتحليل. يمكننا أن نبدأ بذكر ما يعنيه المصطلح “علم”. العلم هو الدراسة المنهجية للعالم المادي والطبيعي من خلال الملاحظة والتجربة، بهدف تحسين الفهم البشري للعمليات الطبيعية. الكلمات المهمة في هذا التعريف هي “ملاحظة” و “فهم”.
إذا كان علم البيانات هو عملية فهم العالم من خلال الأنماط في البيانات، فإن مسؤولية عالم البيانات هي تحويل البيانات، وتحليل البيانات، واستخراج الأنماط من البيانات. بعبارة أخرى، يتم تزويد عالم البيانات بالبيانات، وهم يستخدمون مجموعة من الأدوات والتقنيات لتحضير البيانات (جعلها جاهزة للتحليل) ومن ثم تحليل البيانات لاكتشاف أنماط ذات معنى.
دور عالم البيانات مشابه لدور عالم تقليدي. كلاهما مهتم بتحليل البيانات لدعم أو دحض الفرضيات حول كيفية عمل العالم، ومحاولة فهم الأنماط في البيانات لتحسين فهمنا للعالم. يستخدم علماء البيانات نفس الأساليب العلمية التي يستخدمها عالم تقليدي. يبدأ عالم البيانات بجمع الملاحظات حول ظاهرة معينة التي يرغب في دراستها. ثم يصيغ فرضية حول الظاهرة المعنية ويحاول العثور على بيانات تثبت أو تدحض فرضيته.
ماذا يفعل علماء البيانات؟
قد تلاحظ أن أي نشاط ي涉ل تحليل البيانات بطريقة علمية يمكن أن يُسمى علم البيانات، وهذا جزء من ما يجعل تعريف علم البيانات صعباً. لجعل الأمر أكثر وضوحاً، دعونا نستكشف بعض الأنشطة التي قد يقوم بها عالم البيانات يومياً.

يجمع علم البيانات العديد من التخصصات والاختصاصات المختلفة. الصورة: Calvin Andrus via Wikimeedia Commons, CC BY SA 3.0 (https://commons.wikimedia.org/wiki/File:DataScienceDisciplines.png)
في أي يوم معين، قد يُطلب من عالم البيانات إنشاء مخططات تخزين واسترجاع البيانات، وإنشاء أنابيب ETL (استخراج، تحويل، تحميل) وتنظيف البيانات، وتطبيق الأساليب الإحصائية، وإنشاء تصورات بيانات ولوحات تحكم، وتنفيذ خوارزميات الذكاء الاصطناعي والتعلم الآلي، ووضع توصيات للactions بناءً على البيانات.
الأساليب الإحصائية لعلم البيانات
تطبيق الإحصاء ضروري لتحويل مجرد النظر إلى البيانات وتفسيرها إلى علم حقيقي. يستخدم علماء البيانات الأساليب الإحصائية لاستخراج الأنماط ذات المعنى من مجموعات البيانات، ويتطلب ذلك منهم أن يكونوا على دراية جيدة بالConcepts الإحصائية. يجب أن يكونوا قادرين على التمييز بين الارتباطات المهمة والارتباطات الزائفة عن طريق التحكم في المتغيرات المضطربة. كما يجب أن يعرفوا الأدوات المناسبة لاستخدامها لتحديد الميزات المهمة في مجموعة البيانات.
تصوير البيانات
جزء حاسم من عمل عالم البيانات هو التواصل مع الآخرين حول النتائج. إذا لم يكن عالم البيانات قادراً على التواصل بشكل فعال مع الآخرين، فإن أهمية نتائجه لا تهم. يجب أن يكون عالم البيانات قاصاً فعالاً أيضاً. هذا يعني إنتاج تصورات تواصل النقاط المهمة حول مجموعة البيانات والأنماط المكتشفة فيها.
التوصيات والتطبيقات التجارية
يحتاج عالم البيانات إلى بعض الفهم لمتطلبات وأهداف المنظمة أو الشركة. يحتاج علماء البيانات إلى فهم هذه الأشياء لأنهم يحتاجون إلى معرفة أنواع المتغيرات والميزات التي يجب أن يكونوا يحللونها، واستكشاف الأنماط التي ستساعد منظمتها في تحقيق أهدافها.
التعلم الآلي والذكاء الاصطناعي
خوارزميات التعلم الآلي والذكاء الاصطناعي هي أدوات يستخدمها علماء البيانات لتحليل البيانات، واكتشاف الأنماط داخل البيانات، واكتشاف العلاقات بين المتغيرات، وتوقعات الأحداث المستقبلية.
علم البيانات التقليدية مقابل علم البيانات الكبير
随着 تحسين أساليب جمع البيانات وتوسيع قواعد البيانات، ظهرت فروق بين علم البيانات التقليدية وعلم “البيانات الكبيرة”.
العلم التقليدية والتحليلات البيانية يتم بها التحليلات الوصفية والاستكشافية، بهدف العثور على الأنماط وتحليل نتائج أداء المشاريع. غالباً ما تركز الأساليب التقليدية للتحليلات البيانية على البيانات الماضية والحالية. يتعامل محللو البيانات غالباً مع البيانات التي تم تنظيفها ومعيارها بالفعل، بينما يتعامل علماء البيانات غالباً مع بيانات معقدة وملوثة.
أدوات علم البيانات
تتضمن أدوات علم البيانات الشائعة أدوات لتخزين البيانات، وتنفيذ التحليلات الاستكشافية، ونمذجة البيانات، وتنفيذ ETL، وتصوير البيانات. توفر منصات مثل Amazon Web Services، وMicrosoft Azure، وGoogle Cloud أدوات لمساعدة علماء البيانات على تخزين، وtransform، وتحليل، ونمذجة البيانات.
أمثلة على علم البيانات
توجد أمثلة على علم البيانات وتطبيقاته في كل مكان. علم البيانات له تطبيقات في كل شيء من توصيل الطعام، والرياضة، والمرور، والصحة.












