بحيرة بيانات محددة
هذا يتضمن بحيرة البيانات يحتوي على كمية عدد ضخم من البيانات الأولية والبيانات غير المهيكلة بتنسيق خام.
لذلك ، كل ما تحتاجه هو جهاز يدعم نظام ملفات ثابت ، مما يعني أنه يمكنك استعمال الحاسوب المركزي حسب الحاجة. يتم نقل البيانات لـ خوادم أخرى للمعالجة.
تستخدم معظم الشركات ملفات نظام ملفات Hadoop (HDFS)) ، لأنه مصمم للمعالجة السريعة لمجموعات البيانات الكبيرة ، ويستخدم في بيئة بيانات واسعة حيث يمكن استعمال بحيرات البيانات.
لقد جلب هذا الدعم لبيانات التنسيق الأصلي فائدة واسعة ، أي إذا كنت أرغب في الحصول على الكثير من البيانات ومعرفة طريقة التعامل معها في الحاضر ، فإنه يتوافق مع شعار What Data Lakes Do Now.
تفترض Data Lake كل الأشياء التي قد تكون مثيرة للاهتمام أو غبية أو حتى غير مفهومة ، ولا يمكننا تخمين ذات قيمة هذه البيانات ومعرفة أهميتها اليوم ، ولكنها قد تكون مهمة جدًا في الحاضر.
هذا يعني أنه إذا لم تكن متأكدًا من وقت استعمال البيانات ، ولا يهم ما إذا كان لديك وصول ثانوي وترغب في تخزينه في نموذج منخفض التكلفة ، فإن بحيرة البيانات هي الحل الأفضل ، وعادةً ما تكون يتماشى مع الشعار. بدون جمع البيانات ، لن تحصل عليها مرة ثانية أبدًا.
بحيرة البيانات ومستودع البيانات
قاعدة البيانات هذا ليس بجديد ، حيث توجد مستودعات البيانات منذ عقود ، وعلى الرغم من أنه من الطبيعي مقارنة مستودعات البيانات ببحيرات البيانات ، إلا أن هناك اختلافات جوهرية بين مستودعات البيانات وبحيرات البيانات من أنواع تخزين البيانات لـ طرق معالجة البيانات.
أحد الاختلافات الرئيسية بين بحيرة البيانات مستودع البيانات هو أن بحيرة البيانات لا تتطلب أجهزة أو برامج خاصة مثل مستودع البيانات.
ما هي بحيرة البيانات؟