البيانات هي كميات هائلة من المعلومات المسجلة رقميا عنّا وعن العالم. هذه المعلومات تأتي من عدة مصادر من أهمها وسائل التواصل الإجتماعي مثل الفيس بوك ولينكد ان وتويتر، كذلك تأتي من بعض التطبيقات مثل أوبر وامازون، بالإضافة إلى وجود إنترنت الأشياء الذي سيجعل الكثير من الأجهزة متصلة بالإنترنت. ويقدر أنه بنهاية العام القادم سيكون هناك أكثر من 40 مليار جهاز متصل بالانترنت.
هذه هي البيانات، إذا ما هو علم البيانات؟
علم البيانات لديه الكثير من التعريفات. لكن لابد أن تعرف أن علم البيانات يتضمن ثلاثة أنواع من التحليلات:
تحليل وصفي وتحليل تنبئي و تحليل إلزامي.
التحليل الوصفي هو استخراج معرفة من كميات هائلة من البيانات، وعرض تلك المعرفة من خلال عروض و رسومات سهلة للمستخدم.
التحليل التنبئي هو استخدام البيانات الموجودة حاليا للتنبؤ بالمستقبل. مثل استخدام بيانات لمرضى مصابين بورم ما إذا كانت هذه الأورام حميدة أم خبيثة. حيث يمكننا استخدام هذه البيانات للتنبؤ بأنواع المرض للمرضى الجدد.
التحليل الإلزامي هو بناء منتجات تعتمد على التحليلات الوصفية والتنبئية.
مثل تطبيق fitbit: يستخدم التحليل الوصفي للبيانات عن الحركة الجسدية ويقوم بعرضها للمستخدم. بهذا الشكل هو يقع تحت التحليل الالزامي للبيانات.
لماذا الضجة حول علم البيانات؟
رغم أن الكثير من التقنيات التي يعتمد عليها علم البيانات موجودة منذ أكثر من 20 عاما. إلا أن مفهوم علم البيانات ظهر حديثا. وأهمية علم البيانات في السنوات الأخيره سببها تضخم البيانات و الزيادة المفرطة في الإمكانيات الحاسوبية، وكذلك إمكانيات التخزين الحاسوبية التي يتم الوصول إليها بسهولة وبأسعار قليلة. كل هذه الأسباب أدت إلى زيادة علم البيانات والطلب على علماء البيانات في السنوات الأخيرة.
عالم البيانات يستخدم النظريات العلمية لاستخراج الأفكار والمعرفة من البيانات. لذا نحن نراه فن. لأنه يدمج بين العديد من المجالات المختلفة.
يمكننا تلخيص هذه المجالات في ثلاثة مجالات رئيسية:
مجال المهارات المعلوماتية
مجال علم الرياضيات والإحصاء
مجال الخبرة الموضوعية
لذا لتصبح عالم بيانات أنت بحاجة إلى مهارات في البرمجة خاصة باستخدام لغات مثل بايثون. كذلك لابد من وجود معرفة بعلم الجبر والتفاضل والإحصاء. وأ��يرا على حسب المجال الذي ستعمل به لابد أن يكون لديك خلفية مسبقة عنه.
بعض التطبيقات لعلم البيانات:
التنبؤ بأفضل فيديو/فيلم/مقالة ستثير اهتمام المستخدم
التنبؤ بمرض ان كان حميد أو خبيث من خلال تحليل بيانات المرضى السابقين
فهم رد فعل الناس من خلال تحليل سلوكيات مستخدمي الانترنت ومواقع التواصل الإجتماعي
استكشاف أي فعل غريب على الخوادم للتنبؤ بالاختراقات والهجمات قبل أن تتم
تمرين الآلة على التعرف على الأشياء وتحديد صفاتها. مثل التعرف على الثمرة وتحديد جودتها، أو التعرف على- الإنسان وتحديد هويته.