Data Mart چیست ؟ — شرح مفهوم بازار داده و تفاوت آن با انبار داده
در دنیایی که به وسیله «کلان دادهها» (Big Data) و «تجزیه و تحلیل داده» (Analytics) تحت تحولات عظیمی قرار گرفته است، «بازارهای داده» (Data Mart) کلید اصلی بهینگی برای تبدیل اطلاعات به بینشهای مختلف به حساب میآیند. در بحث انبارهای داده (Data Warehouse) معمولاً با مجموعه دادههای بزرگ سر و کار داریم، اما «تحلیل دادهها» (Data Analysis) نیازمند دادههایی است که به راحتی پیدا میشوند و حاضر و آماده در دسترس هستند. آیا یک شخص فعال در تجارت و کسب و کار باید حتماً جهت دسترسی به دادههای مورد نیاز برای گزارشهای خود کوئریهای پیچیده اجرا کند؟ خیر و به همین دلیل است که شرکتهای تجاری هوشمند و هوشیار از بازارهای داده یا همان Data Mart استفاده میکنند. اما دقیقاً Data Mart چیست ؟ در این مقاله سعی شده است تا این سوال بهطور جامع پاسخ داده شود.
بازار داده یا Data Mart چیست ؟
بازار داده یا همان Data Mart یک پایگاه داده موضوعگرا است که اغلب بخشی قسمتبندی شده از یک انبار داده در سطح سازمانی و تجاری به حساب میآید. زیرمجموعه دادههایی که در یک Data Mart نگهداری میشوند معمولاً با یک واحد خاص در یک سازمان تجاری مثل واحد فروش، واحد مالی یا واحد بازاریابی همگام و همراستا هستند.
بازارهای داده فرایندهای کسب و کار را به وسیله فراهم کردن امکان دسترسی به دادههای مرتبط در یک انبار داده یا مخزن فعال داده سرعت میبخشند و این فرایند به جای ماهها یا سالها، تنها در طول چند روز قابل انجام خواهد بود. به دلیل اینکه بازار داده تنها حاوی دادههای مناسب برای یک زمینه کسب و کاری خاص است، روشی سودآور، مقرونبهصرفه و سریع برای بدست آوردن بینشهایی قابل اقدام به حساب میآید.
بازار داده (Data Mart) چه تفاوتی با انبار داده (Data Warehouse) دارد؟
بازارهای داده و انبارهای داده هر دو مخزنهای ذخیرهسازی به شدت ساختیافتهای هستند که دادهها در آنها تا زمانی که لازم باشد ذخیره میشوند. اگرچه، این دو از لحاظ دامنه دادههای ذخیره شده در آنها متفاوت هستند. انبارهای داده جهت استفاده به عنوان مرکز ذخیره دادهها برای کل یک سازمان به کار میروند، در حالی که Data Mart درخواستها و نیازهای یک بخش خاص یا کارکرد خاص از سازمان را برآورده میکند.
به دلیل اینکه یک انبار داده حاوی تمام دادههای یک شرکت است، ضرورت دارد نظارت ویژهای در خصوص اجازه دسترسی و تعیین سطح دسترسی به آن وجود داشته باشد. علاوه بر این، کوئری زدن برای رسیدن به دادههای مورد نیاز در یک انبار داده وظیفه و ماموریتی بسیار دشوار برای یک سازمان به حساب میآید. بنابراین، هدف اصلی یک بازار داده یا Data Mart این است که مجموعههای کوچکتری از دادهها براساس کل مجموعه دادهها جداسازی یا بخشبندی شوند تا امکان دسترسی آسانتر به دادهها برای کاربران و مصرفکنندگان نهایی بوجود آید.
یک بازار داده را میتوان از یک انبار داده از پیش ساخته شده با استفاده از رویکردی بالا به پایین ایجاد کرد یا میتوان آن را بر اساس سایر منابعی مثل سیستمهای عملیاتی داخلی یا دادههای خارجی ساخت.
درست مشابه انبار داده، در Data Mart هم از یک بانک اطلاعاتی رابطهای برای ذخیرهسازی دادههای تراکنشی (مقدار زمانی، ترتیب عددی، ارجاع به یک یا بیش از یک شی) در قالب سطرها و ستونها استفاده میشود و به این ترتیب، سازماندهی و دسترسی به دادهها آسان است.
- مقاله مرتبط: رابطه در پایگاهداده | به زبان ساده
از سوی دیگر، هر بخش یا دپارتمان از کسب و کار، بازار داده یا Data Mart خاص خود را براساس نیازمندیهای دادهای خودشان ایجاد میکنند. اگر نیازهای کسب و کار ایجاب کنند، میتوان چندین Data Mart را برای ایجاد یک انبار داده واحد با هم ادغام کرد. به این روش، «رویکرد پایین به بالا» گفته میشود.
انواع بازار داده یا انواع Data Mart چیست ؟
۳ نوع Data Mart وجود دارد:
- بازار داده وابسته
- Data Mart مستقل
- بازار داده ترکیبی (هیبریدی)
این انواع بازار داده، براساس ارتباط آنها با انبار داده و منابع دادهای دستهبندی شدهاند که برای ایجاد سیستم استفاده میشوند. در ادامه به ارائه توضیحات بیشتر پیرامون هر یک از انواع Data Mart پرداخته شده است.
بازار داده وابسته (Dependent Data Mart) چیست ؟
بازار داده وابسته (Dependent Data Mart) از یک انبار داده موجود در سازمان ایجاد میشود. این رویکردی بالا به پایین است که با ذخیرهسازی تمام دادههای تجاری در یک محل مرکزی شروع میشود و به دنبال آن میتوان هر وقت که لازم بود، بخش به وضوح توصیف شده دادهها را استخراج کرد.
برای تشکیل و ایجاد یک انبار داده، مجموعه مشخصی از دادهها (در قالب یک خوشه) گردآوری میشوند، سپس دادهها را از آن انبار داده دریافت و ساختاردهی میکنند و بعد بارگذاری این دادههای ساختارمند در بازار داده را انجام میدهند و اینجاست که میتوان دادهها را جستوجو و کوئریهای لازم را اجرا کرد. این میتواند نمایی منطقی یا زیرمجموعهای فیزیکی از انبار دادهها باشد:
- نمای منطقی (Logical View): جدول یا نمایی مجازی به حساب میآید که به صورت منطقی و نه فیزیکی از انبار دادهها جداسازی شده است.
- زیرمجموعه فیزیکی (Physical Subset): استخراج دادهای را گویند که به لحاظ فیزیکی پایگاه دادهای مستقل از انبار داده است.
پایینترین سطح دادهها در مجموعه هدف که به آن دادههای انبوهیده (Granular) میگویند، در انبار داده به عنوان تنها نقطه مرجع برای تمام بازارهای دادهای به حساب میآیند که ایجاد شدهاند.
بازار داده مستقل (Independent Data Mart) چیست ؟
بازار داده مستقل سیستمی غیروابسته به حساب میآید که بدون استفاده از انبار دادهها ایجاد شده است و تمرکز آن تنها بر یک زمینه موضوعی یا کارکرد تجاری معطوف میشود. دادهها از منابع داده داخلی یا خارجی (یا هر دوی آنها) استخراج، پردازش و سپس در مخزن Data Mart بارگذاری و آنجا ذخیره میشوند تا در صورت نیاز به تجزیه و تحلیل از آنها استفاده شود.
طراحی و توسعه بازارهای داده مستقل اصلاً دشوار نیست. این نوع از بازارهای داده برای رسیدن به اهداف کوتاه مدت بسیار مفید هستند، اما مدیریت آنها ممکن است با گذشت زمان سختتر شود، چرا که هر کدام از آنها دارای ابزار استخراج، تبدیل و بارگذاری (ETL Tool) و همچنین منطق مخصوص به خود هستند و نیازهای کسب و کار در طول زمان بیشتر و پیچیدهتر میشوند.
بازار داده ترکیبی (Hybrid Data Mart) چیست؟
در بازار داده ترکیبی دادههای مربوط به انبار داده فعلی و سایر سیستمهای منبع عملیاتی با هم ترکیب میشوند. بازار داده ترکیبی سرعت و تمرکز برای کاربر نهایی از رویکرد بالا به پایین را با مزایای ادغام سطح سازمانی روش پایین به بالا پیوند میدهد.
ساختار Data Mart چگونه است ؟
درست مشابه انبار دادهها، یک Data Mart را هم میتوان با استفاده از ستاره، دانه برف، گنبد یا دیگر طرحوارهها به عنوان نقشهساخت سازماندهی کرد. تیمهای IT معمولاً از آن طرحوارههای ستارهای استفاده میکنند که از یک یا بیش از یک جدول حقیقت (مجموعهای از معیارهای مربوط به یک فرایند یا رویداد تجاری) در یک پایگاه داده رابطهای تشکیل شده است که به جدولهای ابعاد ارجاع میدهند. جدولهای ابعاد به کلید اصلی مربوط میشوند که با یک جدول حقیقت پیوند خورده است.
مزیت طرحواره ستارهای این است که در زمان نوشتن کوئریها، پیوندهای کمتری مورد نیاز است، چرا که هیچ وابستگی میان ابعاد وجود ندارد. این مسئله فرایند درخواست ETL را سادهتر میکند و باعث میشود دسترسی و موقعیتیابی برای تحلیلگران آسان شود.
در طرحواره دانه برفی ابعاد به وضوح تعریف نمیشوند. در این روش، ابعاد نرمالسازی میشوند تا بتوان به کاهش افزونگی داده کمک کرد و حفاظت لازم را از تمامیت دادهها به عمل آورد. در این روش، فضای کمتری برای ذخیرهسازی جدولهای ابعاد مصرف میشود، اما ساختار بسیار پیچیدهتری وجود دارد. زیرا چندین جدول برای وارد کردن اطلاعات و همگمسازی مورد نیاز خواهد بود. در نتیجه نگهداری از بازار داده ساخته شده براساس طرحواره دانهبرفی دشوار است.
مزایای Data Mart چیست ؟
مدیریت کلان دادهها و بدست آوردن بینشهای ارزشمند در کسب و کار چالشی است که همه شرکتها با آن مواجه هستند و اکثر این چالشها با استفاده از بازارهای داده راهبردی قابل پاسخدهی هستند. برخی از مزایای Data Mart در ادامه فهرست شدهاند:
- دسترسی کارآمد: Data Mart راهکاری صرفهجویانه به لحاظ زمانی جهت دسترسی به مجموعه خاصی از دادهها برای هوش تجاری (Business Intelligence) است.
- جایگزینی کمهزینهتر نسبت به انبارش دادهها: میتوان Data Mart را به عنوان جایگزینی کمهزینهتر در مقایسه با توسعه یک انبار داده سازمانی به حساب آورد. زیرا مجموعه دادههای مورد نیاز در یک Data Mart به مراتب کوچکتر هستند و یک بازار داده مستقل را میتوان در عرض یک هفته یا در زمان کمتر راهاندازی کرد.
- کمک به بهوبد عملکرد انبار داده: بازارهای داده وابسته و ترکیبی میتوانند عملکرد انبار داده را به این صورت بهبود دهند که بار پردازشها را برای پاسخگویی به نیاز تحلیلگران تحمل کنند. وقتی که بازارهای داده وابسته در یک قالب تشکیلات جایگذاری شوند، به میزان قابل توجهی باعث کاهش هزینههای تجزیه و تحلیل هم خواهند شد.
شروع استفاده از Data Mart
شرکتها و سازمانهای تجاری با حجم پایانناپذیری از اطلاعات مواجه هستند و همواره نیازهایی دائماً در حال تغییر برای تبدیل این اطلاعات به بخشهایی قابل مدیریت جهت انجام تجزیه و تحلیل و استخراج بینش دارند. با پیادهسازی Data Mart در Cloud، راهکاری طولانی مدت و قابل گسترش فراهم میشود.
برای ایجاد بازار داده باید حتماً یک ابزار ETL را پیدا کرد تا امکان اتصال انبار داده فعلی یا سایر منابع داده ضروری مورد نیاز کاربران کسب و کار شما برای بیرون کشیدن بینش از دادهها فراهم شود. علاوهبر آن، باید اطمینان حاصل کرد که ابزار ادغام دادهها میتواند بهطور منظم Data Mart را بروزرسانی کند تا به این وسیله اطمینان حاصل شود که دادهها و تحلیلهای بدست آمده از آنها بهروز و آپدیت شده هستند.
جمعبندی
در این مقاله سعی شد تا حد امکان به بیانی ساده و جامع به این سوال پاسخ داده شود که Data Mart چیست و به سایر مباحث پیرامون Data Mart هم پرداخته شد که به آن بازار داده هم میگویند. امید است این مقاله مفید واقع شود.
اگر این مطلب مفید بوده است، استفاده از دورههای آموزشی و مقالات زیر نیز پیشنهاد میشود:
- مجموعه دورههای آموزش دادهکاوی و یادگیری ماشین
- آموزش مقدماتی هدوپ – تجزیه و تحلیل کلان داده با Hadoop
- مجموعه دورههای آموزش پایگاه داده
- انبار داده چیست و چه تفاوتی با پایگاه داده، دریاچه داده (Data Lake) و دادهگاه (Data Mart) دارد؟
- مدیریت کلان داده (Big Data Management) — به زبان ساده
- انواع پایگاه داده چیست؟ + کاربرد و معرفی منابع یادگیری
- علم داده، تحلیل داده، دادهکاوی و یادگیری ماشین ــ تفاوتها و شباهتها
منبع [+]
مجموعه: دستهبندی نشده برچسب ها: What is a data mart, what is data mart, آموزش دیتا مارت, انبار داده, انبارهای داده, بازار داده, بازارهای داده, بیگ دیتا, داده مارت, داده های کلان, دیتا مارت, کلان داده, کلان داده ها, مارت داده, مارت دیتا
big data و یادگیری ماشین متاسفانه توی ایران به اندازه خارج هنوز بشون توجه نمیشه