۲۲ کتاب رایگان برای مسیر یادگیری علم داده — راهنمای کاربردی

برای کمک به افراد برای طی کردن مسیر حرفه‌ای علم داده،‌ در این نوشتار مجموعه‌ای از بهترین کتاب‌های علم داده گردآوری شده است. نسخه الکترونیک کتاب‌های معرفی شده در این مقاله، اکثراً به صورت رایگان در دسترس هستند. همچنین، تاریخ آخرین به‌روزرسانی هر کتاب نیز پس از عنوان آن، داخل پرانتز درج شده است. تنها نسخه الکترونیکی اکثر کتاب‌های معرفی شده در این مقاله رایگان هستند و طبیعتاً برای خرید نسخه فیزیکی باید هزینه پرداخت شود. در طول مدت پاندمی کرونا، انتشارات Springer نیز تعداد زیادی از نسخه‌های الکترونیک کتاب‌های خود را به صورت رایگان ارائه کرده است. علاوه بر کتاب، دوره‌های آموزشی مرتبط با هر گام در مسیر یادگیری علم داده نیز در این مقاله معرفی شده‌اند. 

معرفی کتاب‌های آموزش زبان‌های برنامه‌نویسی پایتون و R

سفر علم داده از جایی (پایتون و R) آغاز می‌شود که منابع بسیاری در دسترس است. کتاب‌های پیشنهادی برای شروع کار با پایتون و علم داده در این بخش فهرست شده‌اند. مخصوصاً، کتاب‌های پایتون معرفی شده، بیش‌تر منابع وب هستند تا اینکه بخواهند کتاب محسوب شوند. در واقع، به نظر می‌رسد این قالب نسبت به یک کتاب الکترونیک سنتی برای یادگیری پایتون موثرتر باشد.

معرفی کتاب‌های مفید برای یادگیری برنامه‌نویسی پایتون

در ادامه، فهرست کتاب‌های مناسب برای یادگیری پایتون ارائه شده است:

  • «پایتون برای همه» (Python for Everybody) (۱۳۹۵) [+]: این کتاب یک معرفی‌نامه آسان پایتون برای تازه‌کارها به حساب می‌آید که بسیار کامل و به همراه آموزش ویدیویی و مواد درسی ارائه شده است.
  • «پایتون ۱۰۱» (Python 101) (۱۳۹۸) [+]: پایتون ۱۰۱ یک کتاب آنلاین است که با مبانی پایتون آغاز می‌شود و در ادامه مباحث پیشرفته‌تری در آن پوشش داده شده است.
  • «جزوه علم داده با پایتون» (Python Data Science Handbook) (۱۳۹۵) [+]: این کتاب در گیت‌هاب به صورت رایگان در دسترس است. جزوه علم داده با پایتون هم شامل محتوای متنی و هم دارای دفترچه‌های Jupyter مربوط به آن است. این جزوه افراد را به صورت گام به کام با عملیات استاندارد علم داده در پایتون آشنا می‌سازد. این گام‌ها شامل استفاده از یک دفترچه Jupyter، کار با داده‌ها، بصری‌سازی داده‌ها و ساخت چند مدل رایج هستند.
  • «کتاب آشپزی پانداز» (Pandas Cookbook) (۱۳۹۹) [+]: این کتاب یک معرفی‌نامه عملی برای کتابخانه Pandas در پایتون است. در این کتاب عملیات رایجی شرح داده‌ شده‌ است که برای کار با داده‌ها، جستجو در میان داده‌ها و پاک‌سازی آن‌ها انجام می‌شود.

آموزش‌های مرتبط با برنامه‌نویسی پایتون در فرادرس

معرفی کتاب‌های مفید برای یادگیری زبان R

کتاب‌های زیر برای شروع یادگیری زبان برنامه‌نویسی R پیشنهاد می‌شوند:

  • «برنامه‌نویسی R برای علم داده» (R Programming for Data Science) (۱۳۹۸) [+]
  • «R برای علم داده» (R for Data Science) (۱۳۹۹) [+]
  • «تجزیه و تحلیل داده‌های اکتشافی با آر» (Exploratory Data Analysis with R) (۱۳۹۹) [+]: در این کتاب به مرور ابزارها و بهترین روش‌ها در R برای دست‌یابی به بهترین گام‌ها در فرآیند تجزیه و تحلیل داد‌ه‌ها پرداخته می‌شود.

اگر لازم باشد بین زبان‌های پایتون و R تنها یکی انتخاب شود، به طور کلی، پایتون بیش‌تر برای محیط‌هایی مناسب است که در نهایت شامل تولید محصول نرم‌افزاری خواهد شد. در حالی که، زبان R بیش‌تر ساده‌سازی شده و دارای بسته‌ها و ابزارهای بهتری برای تجزیه و تحلیل خالص داده‌ها و تحقیق و جست و جو است. مقایسه‌های بسیاری بین این دو در وب‌سایت Quora در دسترس است و پاسخ‌های بسیاری پیرامون این سوال وجود دارد که کدام زبان بهتر است.

آموزش‌های مرتبط با برنامه‌نویسی R در فرادرس

معرفی کتاب‌های آمار و احتمال و روش‌های بیزی

در این بخش از مقاله معرفی ۲۲ کتاب رایگان برای مسیر علم داده ، کتاب‌های مناسب در زمینه آمار و احتمال و روش‌های بیزی فهرست شده‌اند.

  • «مقدمه‌ای بر احتمالات،‌ ویرایش دوم» (Introduction to Probability, 2nd Edition) (۱۳۹۸) [+]: ویرایش دوم این کتاب به صورت رایگان در دسترس است. همچنین استفاده از همراه این کتاب با نام «تقلب‌نامه احتمالات» (Probability Cheatsheet) [+] نیز توصیه می‌شود.
  • «معرفی‌نامه متن‌باز آمار، ویرایش چهارم» (OpenIntro Statistics, 4th Edition) (۱۳۹۸) [+]: این یک کتاب بسیار با کیفیت و کامل است و به صورت پرداخت به میزان دلخواه ارائه شده است. سرفصل‌های آمار از مباحث مبتدی تا پیشرفته (مثل محاسبات توانی) به طور کامل در این کتاب پوشش داده شده‌اند.
  • «تفکر آماری، ویرایش دوم» (Think Stats, 2nd Edition) (۱۳۹۳) [+]: در این اثر، کار با رسم و درک توزیع‌ها آغاز می‌شود و سپس با آموزش آزمون فرض آماری و رگرسیون ادامه پیدا می‌کند. این کتاب شامل کاربرد در پایتون نیز هست.
  • «تفکر بیزی» (Think Bayes) (۱۳۹۱) [+]: در این اثر بازی با احتمال شرطی امکان‌پذیر است. این کتاب نیز شامل کاربردها در پایتون است.
  • «روش‌های بیزی برای هکرها» (Bayesian Methods for Hackers) (۱۳۹۹) [+]: در این کتاب افراد می‌توانند با الگوریتم‌های بیزی پیشرفته‌تری مثل Multi-Armed Bandits و زنجیره مارکف مونت کارلو (MCMC) آشنا شوند. این کتاب هم دارای کاربردها در پایتون است.

آموزش‌های مرتبط با آمار و احتمال و روش‌های بیزی در فرادرس

معرفی کتاب‌های مرتبط با طراحی تجربی

تصویر بخش معرفی کتاب های مربوط به Experimental Design در مقاله معرفی ۲۲ کتاب رایگان برای علم داده

دو فصل ابتدایی کتاب «طراحی و تجزیه-تحلیل آزمایشات» (Design and Analysis of Experiments) (۱۳۸۹) [+] اکثر آنچه برای آموختن «آزمون آ/ب» مورد نیاز است را ارائه می‌دهد و باقی کتاب نیز موضوعات پیشرفته‌تری را شامل می‌شود. جهت مرور و بررسی تفاوت‌های ظریف استفاده عملی از طراحی تجربی (Experimental Design) پیشنهاد می‌شود تا علاقه‌مندان مقاله ۴۲ صفحه‌ای «آزمایش‌های کنترل شده در وب: نظرسنجی و راهنمای عملی» (Controlled experiments on the web: survey and practical guide) (۱۳۸۷) [+] را مطالعه کنند. این مقاله توسط کارشناسانی نوشته شده است که در گذشته یا حال عضو تیم تحلیل و آزمایش مایکروسافت بوده یا هستند. این مقاله ممکن است قدیمی به نظر برسد، اما همچنان یک مرور کلی بسیار مناسب به شمار می‌رود.

آموزش‌های مرتبط با طراحی تجربی در فرادرس

معرفی کتاب‌های استنباط و یادگیری آماری

سه کتاب معرفی شده در این بخش از مقاله معرفی ۲۲ کتاب رایگان برای مسیر علم داده ، در دسته مورد احترام‌ترین کتاب‌های دانشگاهی در حوزه یادگیری آماری جای می‌گیرند:

  • «استنباط آماری در عصر کامپیوتر» (Computer-age Statistical Inference) (۱۳۹۵) [+]: این کتاب توسط اساتید شناخته شده، آقایان بردلی افران (Bradley Efron) و تروور هیستی (Trevor Hastie) به چاپ رسیده است. سرفصل‌هایی پیرامون استنباط آماری (Statistical Inference) که در دوران کنونی کاربرد دارند به همراه روش‌های مقیاس‌پذیر قابل استفاده برای مجموعه داده‌های بزرگ در این اثر پوشش داده شده‌اند.
  • «مقدمه‌ای بر یادگیری آماری» (An Introduction to Statistical Learning) (۱۳۹۶) [+]: این کتاب نسخه ساده‌تر و دسترس‌پذیرتری نسبت به کتاب «عناصر یادگیری آماری» (The Elements of Statistical Learning) به حساب می‌آید. می‌توان با کاربردهای ارائه شده در این کتاب برای زبان R، تجربه کسب کرد. همچنین به همراه این کتاب، اثر «accompanying MOOC» [+] ارائه شده است که ویدیوهای آموزش یادگیری ماشین را در بر دارد.
  • «عناصر یادگیری آماری» (The Elements of Statistical Learning) (۱۳۹۶) [+]: این کتاب اصلی یادگیری آماری به حساب می آید و در جامعه علم آمار و یادگیری ماشین بسیار مورد توجه است. این کتاب یک پیش‌زمینه جامع از یادگیری آماری به مخاطب ارائه می‌دهد. اگرچه نسبت به سایر کتاب‌ها مباحث بسیار پیشرفته‌‌تری را در بر دارد.

تصویر مربوط به معرفی کتاب های حوزه استنباط و یادگیری آماری در مقاله معرفی ۲۲ کتاب رایگان برای علم داده

معرفی کتاب‌های حوزه یادگیری ماشین، یادگیری عمیق و داده‌کاوی

در این بخش از مقاله معرفی ۲۲ کتاب رایگان برای مسیر علم داده نیز سه کتاب معرفی شده است که توسط دانشگاهیان و متخصصین بسیار مورد احترام، پیرامون رایج‌ترین روش‌های امروزی داده کاوی و یادگیری ماشین انتشار یافته‌اند. بخش قبلی یعنی یادگیری آماری، به یادگیری ماشین از رویکرد دانشمندان آمار می‌پردازد. یعنی در یادگیری آماری مدل‌های معتبر آماری از داده‌ها ایجاد می‌شود که می‌توان از آن‌ها برای پیش‌بینی استفاده کرد. در این بخش یعنی بخش مربوط به «یادگیری ماشین و داده‌کاوی کاربردی»، بیش‌تر به نیاز به استخراج اطلاعات و پیش‌بینی با استفاده از مجموعه داده‌های بزرگ پرداخته می‌شود.

  • «داده‌کاوی مجموعه داده‌های عظیم، ویرایش سوم» (Mining of Massive Datasets, 3rd Edition) (۱۳۹۹) [+]: این کتاب بر اساس کلاس شناخته شده و محبوب دانشگاه استنفورد ارائه شده است و مسائلی نظیر سیستم‌های پیشنهاد دهنده، رتبه صفحه (PageRank) و تجزیه-تحلیل شبکه‌های اجتماعی در آن پوشش داده شده است.
  • «اشتیاق یادگیری ماشین» (Machine Learning Yearning) (۱۳۹۷) [+]: این کتاب توسط دانشمند معروف، اندرو ان‌جی (Andrew Ng) تهیه شده است و بر ملاحظات کاربردی و عملی برای افراد توسعه‌دهنده یادگیری ماشین تمرکز دارد. این کتاب چندان وارد جنبه‌های فنی (تکنیکی) نشده اما، برای مطالعه پس از کار با چند پروژه یادگیری ماشین مناسب است.
  • «یادگیری عمیق» (Deep Learning) (۱۳۹۵) [+]: کتاب یادگیری عمیق توسط برخی از پیشگامان این حوزه نوشته شده است، اما به میزان زیادی وارد مباحث ریاضی می‌شود. یک نسخه HTML از این کتاب به رایگان در وب‌سایت مربوطه در دسترس است.

جمع‌بندی

به این ترتیب& ۲۰ کتاب برای طی مسیر تبدیل شدن به یک دانشمند داده تا اینجا معرفی شدند. برای تمرین علم داده استفاده از کتاب «علم داده اجرایی» (Executive Data Science) (۱۳۹۷) [+] پیشنهاد می‌شود. این کتاب،فرآیند استخدام و ایجاد یک تیم علم داده را پوشش می‌دهد. همچنین، در صورتی که نیاز به کتاب علم داده برای کودکان وجود داشته باشد، کتاب «فلورانس دانشمند داده و کتابخانه سیار جادویی او» (Florence the Data Scientist and her Magical Bookmobile) (۱۴۰۰) [+] به شدت توصیه می‌شود؛ یک کتاب کودکان که درباره فلورنس یک دانشمند داده است. استفاده از نسخه الکترونیکی این کتاب هزینه‌ای ندارد. بنابراین، معرفی ۲۲ کتاب رایگان برای مسیر علم داده در اینجا به پایان می‌رسد.

اگر این مطلب مفید بوده است، استفاده از دوره‌های آموزشی و مطالب زیر نیز پیشنهاد می‌شوند:

 

منبع [+]


مجموعه: آمار, داده کاوی, محصولات آموزشی, معرفی کتاب, هوش مصنوعی, یادگیری ماشینی برچسب ها: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *