انواع نمودارها و کاربرد آنها — به زبان ساده
در این مطلب، ضمن ارائه توضیحات کلی پیرامون برخی از انواع نمودارهای موجود، یک اینفوگرافیک ارائه شده است که نشان میدهد هر نمودار در چه نوع مسائلی کاربرد دارد.
انواع نمودارها و کاربرد آنها
نمودار، یک ارائه بصری از دادهها به صورت شفاف و ساده است. این نوع از بصریسازی، برای افزایش سطح درک مطلب، به ویژه پیرامون الگوها، گرایشها و ارتباطات داخلی دادهها مورد استفاده قرار میگیرد. ساخت نمودار بخش اساسی از فرایند تحلیل داده محسوب میشود. این کار به تصمیمگیری پیرامون روش تحلیل دادهها، چگونگی توزیع دادهها و بسیاری از دیگر موارد کمک میکند. بنابراین، از دیرباز از نمودارها به منظور بهرهگیری از مزایای آنها در پروژههای عملیاتی، پژوهشهای علمی و دیگر زمینهها استفاده میشده است. در ادامه، مفاهیم کلیدی مورد نیاز برای یادگیری پیرامون نمودارها بیان شده است.
گاهی اوقات، انتخاب نمودار مناسب و کارآمد برای یک مجموعه داده (و یا یک مساله خاص) دشوار است. اینفوگرافیک زیر میتواند به افراد در انتخاب نمودار مناسب برای یک مساله خاص کمک کند. همه آنچه فرد برای انتخاب نمودار مناسب به آن نیاز دارد، داشتن اطلاعات پیرامون متغیرهای مساله است. پس از آن، باید به پرسشهایی که در ادامه بیان شدهاند پاسخ دهد. این پرسشها به عنوان چارچوبی کار میکنند که به فرد در انتخاب نموداری که به تحلیلهای درست منجر شود، کمک شایان توجهی میکند. در نتیجه، در ادامه توصیههایی پیرامون انتخاب نمودار مناسب ارائه شده است.
در این مطلب، نگاهی نزدیکتر به نمودارها انداخته و قواعد کلیدی در راستای انتخاب نمودار مناسب یک مساله خاص، تعریف میشوند. ابتدا، کاربر به این پرسش پاسخ خواهد داد که یک یا تعداد بیشتری متغیر دارد. در صورتی که تنها یک متغیر داشته باشد، باید به سمت چپ اینوگرافیک حرکت کند. سپس، باید تصمیم بگیرد که متغیرهای مساله ترتیب دارند یا خیر. بنابراین، در صورتی که کاربر یک متغیر داشته باشد، میتواند نمودار مناسب خود را از لیست زیر برگزیند.
نمودار خطی
«نمودار خطی» (Line Chart)، دادهها را به عنوان یک سری از نقاط نشان میدهد که به خطوط متصل شدهاند. این نوع نمودار معمولا برای نمایش تغییرات و گرایشها در دادهها مورد استفاده قرار میگیرد.
نمودار ناحیهای
«نمودار ناحیهای» (Area Chart)، بر پایه نمودار خطی است. بنابراین، کارکرد آنها کاملا مشابه است. یک نمودار سطحی، برای نمایش نمایش دادههای کمی به صورت گرافیکی با ترسیم نمودار نقاط داده و اتصال آنها به یکدیگر در بخشهای خطی مورد استفاده قرار میگیرد.
نمودار جعبهای
«نمودار جعبهای» (Box Plot)، معمولا برای تصویر کردن گروهی از دادههای عددی با کمک چارکهای آنها مورد استفاده قرار میگیرد. در نمودار جعبهای، معمولا از برخی شاخصهای پراکندگی برای نمایش تنوع دادههای بیرون از چارکها استفاده میشود.
نمودار بافتنگار
«نمودار بافتنگار» (Histogram) به طور گسترده برای نمایش توزیع دادههای عددی مورد استفاده قرار میگیرد. هر میله در نمودار هیستوگرام یا بافتنگار، نمایشگر دادههای توزیع شده در یک دسته کوچک، یک طیف پیوسته از دادهها و یا تکرار برای نقاط داده خاصی است.
نمودار چگالی
نمودار چگالی (Density Plot) بصریسازی توزیع دادهها در یک دوره پیوسته را انجام میدهد. قلههای نمودار چگالی منعکس کننده تمرکز مقدارها در بازهها است.
علاوه بر آنچه بیان شد، باید متذکر شد که نمودار جعبهای هم در حالتی که متغیرها دارای ترتیب هستند و هم در حالتی که فاقد ترتیب باشند، قابل استفاده است. در ادامه، نگاهی به سمت راست نمودار انداخته میشود. نقطه آغاز مشابه است و این پرسش مطرح میشود که آیا بیش از یک متغیر وجود دارد؟ در صورتی که پاسخ مثبت باشد، به سمت راست نمودار رفته و به پرسشهای دیگر باید پاسخ داد. اگر ویژگیها مشابه نباشند، چه دادهها مرتب شده باشند و چه نباشند، به سمت چپ اینفوگرافیک حرکت میشود. در صورتی که دادهها مرتب نشده باشند، باید از نمودار «نقطهای» (Scatter Plot) استفاده شود. اگر دادهها مرتب شده باشند، باید از نمودار نقطهای یا ناحیهای استفاده شود.
نمودار نقطهای
«نمودار نقطهای» (Scatter Plot یا Scattergram) نوعی از نمودار است که از مختصات دکارتی برای نمایش مقدار دو متغیر متداول برای مجموعه داده استفاده میکند. در این مورد، دادههای ارائه شده به صورت مجموعهای از نقاط ارائه میشوند.
نمودار نقطهای متصل
نمودار نقطهای متصل، بسیار شبیه به نوع قبلی بیان شده در بالا است. تنها تفاوت این دو در آن است که در این نمودار نقاط به یکدیگر متصل شدهاند. در ادامه، نگاهی دقیقتر به مواردی انداخته خواهد شد که در آنها، ویژگیها مشابه هستند. گام بعدی تصمیمگیری پیرامون این است که آیا متغیرها دارای ویژگی سلسله مراتبی هستند؟ اگر پاسخ به این پرسش مثبت است، «نمودار سانکی» (Sankey Diagram) و «نمودار ون» (Venn Diagram) دو گزینه قابل استفاده محسوب میشوند.
نمودار سانکی
نمودار سانکی متعلق به دسته نمودارهای جریان است. این نوع از نمودارها از جهتنماها برای نمایش مقدار جریان به ترتیب، استفاده میکنند.
نمودار وِن
«نمودار ون» (Venn Diagram)، با عناوین دیگری همچون «مجموعه اولیه» (Primary Set) و (نمودار منطقی) (Logical Diagram) نیز نامیده میشود. از این نمودار، برای نمایش همه روابط منطقی موجود بین مجموعه متناهی از چندین مجموعه داده مورد استفاده قرار میگیرد. در این نمودار، عناصر به صورت نقاطی در صفحه و مجموعهها به صورت مناطقی هستند.
اگر هیچ ویژگی سلسله مراتبی در متغیرها وجود نداشته باشد، مسیر روی اینفوگرافیک به سمت چپ رفته و پرسشهایی پیرامون ترتیب دادهها مطرح میشود. اگر متغیرها دارای ترتیب نیستند، گزینههای قابل استفاده «نمودار حرارتی» (Heatmap)، «نمودار درختی» (Treemap)، «نمودار میلهای انباشته» (Stacked Bars) و «نمودار دایرهای» (Pie Chart) خواهند بود. اگر متغیرها دارای ترتیب باشند، «نمودار ناحیه انباشته» (Stacked Area Chart) و «نمودار خطی پشتهای» (Stacked Line Chart) قابل استفاده هستند.
نمودار حرارتی
نمودار حرارتی، یک ارائه گرافیکی از دادهها است که در آن، مقادیر مجزا درون ماتریس با رنگها نمایش داده میشوند. مقادیر بزرگتر، با پیکسلهای تیره و مقادیر کوچکتر با رنگهای روشنتر نمایش داده میشوند.
نمودار درختی
نمودار درختی، دادهها را به شکل مستطیلهایی در سایزهای کوچکتر و بزرگتر نمایش میدهد. اندازه هر مستطیل نشان میدهد که به یک مجموعه تعلق دارد و یا به یک زیر مجموعه.
میلهای انباشته
در صورت استفاده از نمودار میلهای انباشته، بخشی از دادهها تنظیم و یا انباشته میشوند (میلههای افقی، میلههای عمودی یا ستونها) که نشانگر کل میزان دادههای شکسته شده در زیربخشها هستند. بخشهای مساوی در هر نمودار به طور مشابه رنگ میشوند.
نمودار دایرهای
نمودار دایرهای، یک گراف آماری مدور است که بخشها و برشهایی دارد که نشانگر نسبت دادهها هستند. طول کمان در هر بخش، نشانگر مقدار کمی آن بخش است.
نتیجهگیری
در این مطلب، یک اینفوگرافیک ارائه شد که انواع نمودارهای احتمالی که میتوان بسته به نوع دادهها (متغیرهای مساله) استفاده کرد و روش انتخاب نمودار مناسب را نشان میدهد. تنوع نمودارها نباید کاربر را در انتخاب نمودار مناسب سردرگم کند. برای انتخاب نمودار مناسب، تنها کافی است که کاربر به چند پرسش پیرامون متغیرهای مساله پاسخ دهد که در اینفوگرافیک نمایش و در متن شرح داده شدهاند.
اگر نوشته بالا برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای برنامهنویسی پایتون Python
- آموزش گرافیک و ترسیم نمودار در متلب
- مجموعه آموزشهای دادهکاوی و یادگیری ماشین
- نمودارهای متحرک در پایتون — از صفر تا صد
- هیستوگرام (Histogram) و نمودارهای چگالی — راهنمای بصری سازی دادههای تک بُعدی در پایتون
- ۱۰ کتابخانه پایتون علم داده — راهنمای کاربردی
مجموعه: دستهبندی نشده برچسب ها: Area Chart, box plot, Chart, Density Plot, Diagram, Heatmap, Histogram, Line Chart, Logical Diagram, Pie Chart, Primary Set, Sankey Diagram, Scatter Plot, Scattergram, Stacked Area Chart, Stacked Bars, Stacked Line Chart, Treemap, Venn Diagram, مجموعه اولیه, میلهای انباشته, نمودار, نمودار بافتنگار, نمودار جعبهای, نمودار چگالی, نمودار حرارتی, نمودار خطی, نمودار خطی پشتهای, نمودار دایرهای, نمودار درختی, نمودار سانکی, نمودار منطقی, نمودار میلهای انباشته, نمودار ناحیه انباشته, نمودار ناحیهای, نمودار نقطهای, نمودار ون