داده کاوی (Data Mining) — به بیان ساده
«دادهکاوی» (Data Mining) به عنوان فرایندی تعریف شده که به منظور استخراج دانش قابل استفاده از مجموعهای بزرگ از دادههای خام مورد استفاده قرار میگیرد. این امر به معنای تحلیل الگوهای موجود در دستههای انبوه داده با استفاده از یک یا چند نرمافزار است. برای مطالعه دقیقتر پیرامون این مبحث، مطالعه مطلب «دادهکاوی چیست؟ بخش اول: مبانی» توصیه میشود.
دادهکاوی در زمینههای گوناگون علوم و تحقیقات دارای کاربرد است. به عنوان یکی از کاربردهای دادهکاوی، کسبوکارها میتوانند اطلاعات بیشتری از مشتریان خود کسب کرده و استراتژیهای موثرتر و کارآمدتری را بر اساس کارکردهای گوناگون سازمان به عنوان اهرمی برای داشتن روشهای بهینهتر تدوین کنند.
این کار به کسبوکارها کمک میکند تا به اهداف خود نزدیکتر شده وتصمیمات بهتری اتخاذ کنند. دادهکاوی شامل مجموعه موثری از دادهها، انبارسازی آنها و همچنین پردازشهای کامپیوتری دادهها است. برای بخشبندی دادهها و ارزیابی احتمال وقوع رخدادها در آینده، دادهکاوی از الگوریتمهای پیچیده ریاضی استفاده میکند. دادهکاوی همچنین با عنوان «کشف دانش از میان داده» (Knowledge Discovery in Data | KDD) شناخته شده است.
ویژگیهای کلیدی دادهکاوی در ادامه آمدهاند:
- پیشبینی الگوی خودکار بر اساس تحلیل رفتار و گرایش
- پیشبینی بر اساس خروجیهای محتمل
- ساخت اطلاعات تصمیممحور
- تمرکز بر مجموعه دادههای بزرگ و پایگاه دادهها برای تحلیل
- خوشهبندی بر اساس یافتن و مستندسازی بصری گروهی از حقایقی که پیشتر شناخته نشده بودند
زیرساختهای فنی مورد نیاز برای دادهکاوی عبارتند از:
اندازه پایگاه داده: برای ساخت یک سیستم قدرتمندتر به نگهداری و پردازش دادههای بیشتری نیاز است.
پیچیدگی «کوئری» (Query): برای کوئری زدن یا پردازش کوئریهای پیچیدهتر و تعداد بیشتری کوئری نیاز به سیستمهای قدرتمند است.
دادهکاوی از الگوریتمهای ویژه این حوزه به همراه روشهای مربوط به آمار و احتمال، ریاضیات و جبر خطی، «هوش مصنوعی» (Artificial Intelligence) و «یادگیری ماشین» (Machine Learning) برای انجام تحلیلها استفاده میکند. با بهرهگیری از دادهکاوی خردهفروشان میتوانند از تراکنشهای خرید مشتریان برای ارسال تبلیغات هدفمند بر پایه تاریخچه خرید هر مشتری استفاده کنند. آنها همچنین میتوانند با استفاده از دانش حاصل شده از کاوش نظرات مشتریان و کارتهای وارانتی آنها، محصولات و تبلیغاتی بسازند که صرفا بخش خاصی از مشتریان را هدف قرار میدهد.
اگر مطلب بالا برای شما مفید بوده، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای آمار، احتمالات و دادهکاوی
- مجموعه آموزشهای یادگیری ماشین و بازشناسی الگو
- مجموعه آموزشهای هوش محاسباتی
- مجموعه آموزشهای شبکههای عصبی مصنوعی
- گنجینه آموزشهای برنامه نویسی پایتون (Python)
- آموزش برنامهنویسی R و نرمافزار R Studio
- مجموعه آموزشهای برنامه نویسی متلب (MATLAB)
- دوره آموزش یادگیری ماشین وبلاگ فرادرس با مثالهای کاربردی
مجموعه: داده کاوی برچسب ها: Centroid, Cluster, Cluster Analysis, Clustering, data, data analysis, Data Mining, data science, DBSCAN, Deep Belief Network, Dendrogram, Dimension Reduction, Dimensionality Reduction, EPS, Feature Redundancy, GAN, Generative Adversarial Networks, Hebbian Learning, Hierarchical Clustering, k-means, noisy data, PCA, Principal Component Analysis, Self-Organizing Maps, SOM, t-SNE, Unsupervised Learning, تحلیل داده, تحلیل مولفه اساسی, خودرمزگذارها, خوشه بندی, خوشهبندی, داده, داده کاوی, دادهکاوی, شبکه باور عمیق, علم داده, مرکزوار, یادگیری بدون نظارت, یادگیری غیر نظارتی, یادگیری نظارت شده, یادگیری نظارت نشده, یادگیری نظارتی, یادگیری هبیان