Data Mart چیست ؟ — شرح مفهوم بازار داده و تفاوت آن با انبار داده

در دنیایی که به وسیله «کلان داده‌ها» (Big Data) و «تجزیه و تحلیل داده» (Analytics) تحت تحولات عظیمی قرار گرفته است، «بازارهای داده» (Data Mart) کلید اصلی بهینگی برای تبدیل اطلاعات به بینش‌های مختلف به حساب می‌آیند. در بحث انبارهای داده (Data Warehouse) معمولاً با مجموعه داده‌های بزرگ سر و کار داریم، اما «تحلیل داده‌ها» (Data Analysis) نیازمند داده‌هایی است که به راحتی پیدا می‌شوند و حاضر و آماده در دسترس هستند. آیا یک شخص فعال در تجارت و کسب و کار باید حتماً جهت دسترسی به داده‌های مورد نیاز برای گزارش‌های خود کوئری‌های پیچیده اجرا کند؟ خیر و به همین دلیل است که شرکت‌های تجاری هوشمند و هوشیار از بازارهای داده یا همان Data Mart استفاده می‌کنند. اما دقیقاً Data Mart چیست ؟ در این مقاله سعی شده است تا این سوال به‌طور جامع پاسخ داده شود.

بازار داده چیست

بازار داده یا Data Mart چیست ؟

بازار داده یا همان Data Mart یک پایگاه داده موضوع‌گرا است که اغلب بخشی قسمت‌بندی شده از یک انبار داده در سطح سازمانی و تجاری به حساب می‌آید. زیرمجموعه داده‌هایی که در یک Data Mart نگهداری می‌شوند معمولاً با یک واحد خاص در یک سازمان تجاری مثل واحد فروش، واحد مالی یا واحد بازاریابی همگام و هم‌راستا هستند.

بازارهای داده فرایندهای کسب و کار را به وسیله فراهم کردن امکان دسترسی به داده‌های مرتبط در یک انبار داده یا مخزن فعال داده‌ سرعت می‌بخشند و این فرایند به جای ماه‌ها یا سال‌ها، تنها در طول چند روز قابل انجام خواهد بود. به دلیل اینکه بازار داده تنها حاوی داده‌های مناسب برای یک زمینه کسب و کاری خاص است، روشی سودآور، مقرون‌به‌صرفه و سریع برای بدست آوردن بینش‌هایی قابل اقدام به حساب می‌آید.

بازار داده یا Data Mart چیست ؟

بازار داده (Data Mart) چه تفاوتی با انبار داده (Data Warehouse) دارد؟

بازارهای داده و انبارهای داده هر دو مخزن‌های ذخیره‌سازی به شدت ساخت‌یافته‌ای هستند که داده‌ها در آن‌ها تا زمانی که لازم باشد ذخیره می‌شوند. اگرچه، این دو از لحاظ دامنه داده‌های ذخیره شده در آن‌ها متفاوت هستند. انبارهای داده جهت استفاده به عنوان مرکز ذخیره داده‌ها برای کل یک سازمان به کار می‌روند، در حالی که Data Mart درخواست‌ها و نیازهای یک بخش خاص یا کارکرد خاص از سازمان را برآورده می‌کند.

به دلیل اینکه یک انبار داده حاوی تمام داده‌های یک شرکت است، ضرورت دارد نظارت ویژه‌ای در خصوص اجازه دسترسی و تعیین سطح دسترسی به آن وجود داشته باشد. علاوه بر این، کوئری زدن برای رسیدن به داده‌های مورد نیاز در یک انبار داده وظیفه و ماموریتی بسیار دشوار برای یک سازمان به حساب می‌آید. بنابراین، هدف اصلی یک بازار داده یا Data Mart این است که مجموعه‌های کوچک‌تری از داده‌ها براساس کل مجموعه داده‌ها جداسازی یا بخش‌بندی شوند تا امکان دسترسی آسان‌تر به داده‌ها برای کاربران و مصرف‌کنندگان نهایی بوجود آید.

مقایسه Data Mart با Data Warehouse

یک بازار داده را می‌توان از یک انبار داده از پیش ساخته شده با استفاده از رویکردی بالا به پایین ایجاد کرد یا می‌توان آن را بر اساس سایر منابعی مثل سیستم‌های عملیاتی داخلی یا داده‌های خارجی ساخت.

درست مشابه انبار داده، در Data Mart هم از یک بانک اطلاعاتی رابطه‌ای برای ذخیره‌سازی داده‌های تراکنشی (مقدار زمانی، ترتیب عددی، ارجاع به یک یا بیش از یک شی) در قالب سطرها و ستون‌ها استفاده می‌شود و به این ترتیب، سازمان‌دهی و دسترسی به داده‌ها آسان است.

از سوی دیگر، هر بخش یا دپارتمان از کسب و کار، بازار داده یا Data Mart خاص خود را براساس نیازمندی‌های داده‌ای خودشان ایجاد می‌کنند. اگر نیازهای کسب و کار ایجاب کنند، می‌توان چندین Data Mart را برای ایجاد یک انبار داده واحد با هم ادغام کرد. به این روش، «رویکرد پایین به بالا» گفته می‌شود.

انواع بازار داده یا انواع Data Mart چیست ؟

۳ نوع Data Mart وجود دارد:

  1. بازار داده وابسته
  2. Data Mart مستقل
  3. بازار داده ترکیبی (هیبریدی)

این انواع بازار داده، بر‌اساس ارتباط آن‌ها با انبار داده و منابع داده‌ای دسته‌بندی شده‌اند که برای ایجاد سیستم استفاده می‌شوند. در ادامه به ارائه توضیحات بیشتر پیرامون هر یک از انواع Data Mart پرداخته شده است.

آموزش تلفیق داده Data Fusion – مبانی و کاربردها

بازار داده وابسته (Dependent Data Mart) چیست ؟

بازار داده وابسته (Dependent Data Mart) از یک انبار داده موجود در سازمان ایجاد می‌شود. این رویکردی بالا به پایین است که با ذخیره‌سازی تمام داده‌های تجاری در یک محل مرکزی شروع می‌شود و به دنبال آن می‌توان هر وقت که لازم بود، بخش به وضوح توصیف شده داده‌ها را استخراج کرد.

برای تشکیل و ایجاد یک انبار داده، مجموعه مشخصی از داده‌ها (در قالب یک خوشه) گردآوری می‌شوند، سپس داده‌ها را از آن انبار داده دریافت و ساختاردهی می‌کنند و بعد بارگذاری این داده‌های ساختارمند در بازار داده را انجام می‌دهند و اینجاست که می‌توان داده‌ها را جست‌وجو و کوئری‌های لازم را اجرا کرد. این می‌تواند نمایی منطقی یا زیرمجموعه‌ای فیزیکی از انبار داده‌ها باشد:

  • نمای منطقی (Logical View): جدول یا نمایی مجازی به حساب می‌آید که به صورت منطقی و نه فیزیکی از انبار داده‌ها جداسازی شده است.
  • زیرمجموعه فیزیکی (Physical Subset): استخراج داده‌ای را گویند که به لحاظ فیزیکی پایگاه داده‌ای مستقل از انبار داده است.

پایین‌ترین سطح داده‌ها در مجموعه هدف که به آن داده‌های انبوهیده (Granular) می‌گویند، در انبار داده به عنوان تنها نقطه مرجع برای تمام بازارهای داده‌ای به حساب می‌آیند که ایجاد شده‌اند.

Data Mart چیه

 

بازار داده مستقل (Independent Data Mart) چیست ؟

بازار داده مستقل سیستمی غیروابسته به حساب می‌آید که بدون استفاده از انبار داده‌ها ایجاد شده است و تمرکز آن تنها بر یک زمینه موضوعی یا کارکرد تجاری معطوف می‌شود. داده‌ها از منابع داده داخلی یا خارجی (یا هر دوی آن‌ها) استخراج، پردازش و سپس در مخزن Data Mart بارگذاری و آنجا ذخیره می‌شوند تا در صورت نیاز به تجزیه و تحلیل از آن‌ها استفاده شود.

طراحی و توسعه بازارهای داده مستقل اصلاً دشوار نیست. این نوع از بازارهای داده برای رسیدن به اهداف کوتاه مدت بسیار مفید هستند، اما مدیریت آن‌ها ممکن است با گذشت زمان سخت‌تر شود، چرا که هر کدام از آن‌ها دارای ابزار استخراج، تبدیل و بارگذاری (ETL Tool) و همچنین منطق مخصوص به خود هستند و نیازهای کسب و کار در طول زمان بیشتر و پیچیده‌تر می‌شوند.

بازار داده ترکیبی (Hybrid Data Mart) چیست؟ 

در بازار داده ترکیبی داده‌های مربوط به انبار داده فعلی و سایر سیستم‌های منبع عملیاتی با هم ترکیب می‌شوند. بازار داده ترکیبی سرعت و تمرکز برای کاربر نهایی از رویکرد بالا به پایین را با مزایای ادغام سطح سازمانی روش پایین به بالا پیوند می‌دهد.

آموزش پانداس pandas برای تحلیل اطلاعات در پایتون

ساختار Data Mart چگونه است ؟

درست مشابه انبار داده‌ها، یک Data Mart را هم می‌توان با استفاده از ستاره، دانه برف، گنبد‌ یا دیگر طرح‌واره‌ها به عنوان نقشه‌ساخت سازماندهی کرد. تیم‌های IT معمولاً از آن طرح‌واره‌های ستاره‌ای استفاده می‌کنند که از یک یا بیش از یک جدول حقیقت (مجموعه‌ای از معیارهای مربوط به یک فرایند یا رویداد تجاری) در یک پایگاه داده رابطه‌ای تشکیل شده است که به جدول‌های ابعاد ارجاع می‌دهند. جدول‌های ابعاد به کلید اصلی مربوط می‌شوند که با یک جدول حقیقت پیوند خورده است.

مزیت طرح‌واره ستاره‌ای این است که در زمان نوشتن کوئری‌ها، پیوندهای کم‌تری مورد نیاز است، چرا که هیچ وابستگی میان ابعاد وجود ندارد. این مسئله فرایند درخواست ETL را ساده‌تر می‌کند و باعث می‌شود دسترسی و موقعیت‌یابی برای تحلیل‌گران آسان شود.

بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده دارد

در طرح‌واره دانه برفی ابعاد به وضوح تعریف نمی‌شوند. در این روش، ابعاد نرمال‌سازی می‌شوند تا بتوان به کاهش افزونگی داده کمک کرد و حفاظت لازم را از تمامیت داده‌ها به عمل آورد. در این روش، فضای کم‌تری برای ذخیره‌سازی جدول‌های ابعاد مصرف می‌شود، اما ساختار بسیار پیچیده‌تری وجود دارد. زیرا چندین جدول برای وارد کردن اطلاعات و همگم‌سازی مورد نیاز خواهد بود. در نتیجه نگهداری از بازار داده ساخته شده براساس طرح‌واره دانه‌برفی دشوار است.

مزایای Data Mart چیست ؟

مدیریت کلان داده‌ها و بدست آوردن بینش‌های ارزشمند در کسب و کار چالشی است که همه شرکت‌ها با آن مواجه هستند و اکثر این چالش‌ها با استفاده از بازارهای داده راهبردی قابل پاسخ‌دهی هستند. برخی از مزایای Data Mart در ادامه فهرست شده‌اند:

  • دسترسی کارآمد: Data Mart راهکاری صرفه‌جویانه به لحاظ زمانی جهت دسترسی به مجموعه خاصی از داده‌ها برای هوش تجاری (Business Intelligence) است.
  • جایگزینی کم‌هزینه‌تر نسبت به انبارش داده‌ها: می‌توان Data Mart را به عنوان جایگزینی کم‌هزینه‌تر در مقایسه با توسعه یک انبار داده سازمانی به حساب آورد. زیرا مجموعه داده‌های مورد نیاز در یک Data Mart به مراتب کوچک‌تر هستند و یک بازار داده مستقل را می‌توان در عرض یک هفته یا در زمان کم‌تر راه‌اندازی کرد.
  • کمک به بهوبد عملکرد انبار داده: بازارهای داده وابسته و ترکیبی می‌توانند عملکرد انبار داده را به این صورت بهبود دهند که بار پردازش‌ها را برای پاسخگویی به نیاز تحلیل‌گران تحمل کنند. وقتی که بازارهای داده وابسته در یک قالب تشکیلات جایگذاری شوند، به میزان قابل توجهی باعث کاهش هزینه‌های تجزیه و تحلیل هم خواهند شد.

آموزش مقدماتی آپاچی اسپارک برای پردازش کلان داده

شروع استفاده از Data Mart

شرکت‌ها و سازمان‌های تجاری با حجم پایان‌ناپذیری از اطلاعات مواجه هستند و همواره نیازهایی دائماً در حال تغییر برای تبدیل این اطلاعات به بخش‌هایی قابل مدیریت جهت انجام تجزیه و تحلیل و استخراج بینش دارند. با پیاده‌سازی Data Mart در Cloud، راهکاری طولانی مدت و قابل گسترش فراهم می‌شود.

برای ایجاد بازار داده باید حتماً یک ابزار ETL را پیدا کرد تا امکان اتصال انبار داده فعلی یا سایر منابع داده ضروری مورد نیاز کاربران کسب و کار شما برای بیرون کشیدن بینش از داده‌ها فراهم شود. علاوه‌بر آن، باید اطمینان حاصل کرد که ابزار ادغام داده‌ها می‌تواند به‌طور منظم Data Mart را بروزرسانی کند تا به این وسیله اطمینان حاصل شود که داده‌ها و تحلیل‌های بدست آمده از آن‌ها به‌روز و آپدیت شده هستند.

جمع‌بندی

در این مقاله سعی شد تا حد امکان به بیانی ساده و جامع به این سوال پاسخ داده شود که Data Mart چیست و به سایر مباحث پیرامون Data Mart هم پرداخته شد که به آن بازار داده هم می‌گویند. امید است این مقاله مفید واقع شود.

 

اگر این مطلب مفید بوده است، استفاده از دوره‌های آموزشی و مقالات زیر نیز پیشنهاد می‌شود:

 

منبع [+]

یک نظر در "Data Mart چیست ؟ — شرح مفهوم بازار داده و تفاوت آن با انبار داده"

پاسخ دادن به کپل لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *