پوشش کامل نیازهای شما برای یادگیری

دوره تخصصی فراگیری علم داده(Data Science) با پایتون

سرفصل‌های آموزش دوره تخصصی پایتون شامل علم داده ، داده کاوی، یادگیری ماشین

الف.  مقدمه و آشنایی با داده کاوی

  • مقدمات و مفاهیم داده کاوی یادگیری ماشین
  • طراحی مسائل و مجموعه داده‌هایی جهت شناخت داده، علم داده و کاربردهای آن
  • آشنایی عمومی و مقدماتی با کتابخانه‌های موجود در زبان پایتون جهت انجام عملیات داده کاوی مثل Numpy، Pandas، sklearn، Matplotlib، Scikit Learn، Tensorflow، Py Torch و …

ب‌.    نصب و پیاده سازی محیط‌های عملیاتی

  • آشنایی با ورژن‌های مختلف پایتون و نصب پایتون همراه با نصب پکیج آناکوندا و آشنایی با پکیج‌های مهم
  • نصب و ایجاد محیط اولیه در Visual Studio Code و ایجاد یک برنامه پایتون
  • نصب و ایجاد محیط اولیه در Jupyter و ساخت یک دفترچه پایتون
  • آشنایی با رایانش ابری و آموزش کار با محیط کولب گوگل و اجرای برنامه‌ها بر روی سرورهای گوگل

ت‌.   معرفی روش‌های وارد کردن دیتاست ها و مراجع جمع آوری داده‌ها

  • وارد کردن انواع دیتاست (CSV, URL، Excel، Text، SAS، STATA)
  • بررسی چند مثال

ث‌.   مفاهیم پایه داده‌ها و ریاضی و آماری

  • داده و درک مفهوم ویژگی(Feature)، بعد(Dimension)، ماتریس (Matrix) و درک مفهوم تنسور (Tensor) و کاربرد آن در داده کاوی
  • آشنایی و کار با کتابخانه Numpy و Scipy برای انجام عملیات آماری
  • بارگذاری داده‌ها و تعامل با داده‌ها با استفاده از کتابخانه Pandas

ج‌.    پیش پردازش دیتا (data preprocessing)

  • پیش پردازش اولیه داده
  • پر کردن مقادیر(Null) کمی، کیفی اسمی و ترتیبی
  • فیلتر کردن رکورد یا وِیژگی
  • مدیریت دیتای کیفی (اسمی و ترتیبی)
  • تولید ویژگی (feature generation)
  • ساخت Dummy برای ویژگی‌های کیفی
  • (Reclassification) طبقه بندی مجدد مقادیر
  • (Join) اتصال
  • (Append)
  • بخش بندی دیتا (Train_Test_Split)
  • نرمالسازی
  • استاندارد سازی
  • انتخاب ویژگی
  • انتخاب ویژگی‌های مهم برای داده کاوی با جنگل تصادفی
  • انتخاب ویژگی‌های مهم برای داده کاوی با الگوریتم KNN
  • کاهش ابعاد

ح‌.    مصور سازی و نمایش داده‌ها (Data visualization) با پایتون

  • لایبرری MATPLOTLIB
  • لایبرری seaborn
  • لایبرری pandas
  • آشنایی با نمودارهای مختلف(Bar، Line، Pie، Histogram، نقشه حرارتی(Heat map)،Flow و …) وکاربرد هریک از آن‌ها
  • نحوه ایجاد نمودارها

خ‌.      پیاده سازی الگوریتم‌های مختلف یادگیری ماشینی(Machine learning) طبقه بندی

  • آشنایی با نمونه داده‌های طبقه بندی و کاربردهای آن
  • بررسی چند دیتاست به عنوان نمونه‌های ساده و کاربردی
    1. بررسی دیتاست IRIS (تشخیص گل‌های زنبق از روی ویژگی‌ها) و پروژه های آن
    2. MNISTتشخیص تصاویر دست نوشته
    3. قیمت گذاری هوشمند خانه
1.  آشنایی و پیاده سازی طبقه بندی با الگوریتم k نزدیکترین همسایه(KNN) در پایتون
2.  آشنایی و پیاده سازی طبقه بندی با الگوریتم ماشین بردار پشتیبان (SVM)و آشنایی با انواع مختلف پیاده سازی و پارامترهای آن در پایتون
3.  بررسی درخت‌های تصمیم (Decision Trees)و پیاده سازی آن‌ها در حل مسائل طبقه بندی در پایتون
د‌.       پیاده سازی الگوریتم‌های مختلف یادگیری ماشینی(Machine learning) رگرسیون
  • رگرسیون خطی و …
  • پروژه تخمین salary با رگرسیون خطی
  • پروژه پیش بینی آب و هوا

ذ‌.     Ensemble

1.  آشنایی و پیاده سازی طبقه بندی با الگوریتم‌های  RandomForest، AdaBoost و… در پایتون
2.  آشنایی با الگوریتم‌های XGBoost و CatBoost و کتابخانه‌های XGBoost و CatBoost

ر‌.      سری زمانی

ز‌.      لزوم ارزیابی مدل و آشنایی با معیارهای مختلف ارزیابی مدل‌ها

  • طبقه بندی
    1. Accuracy
    2. Precision
    3. Recall
    4. F1
    5. ROI AUC
    6. و …
  • رگرسیون
    1. MAE
    2. MSE
    3. RMSE

س‌. خوشه بندی و الگوریتم‌های مختلف آن

  • آشنایی با نمونه داده‌های خوشه بندی
  • حل مثال کاربردی آن

دسته بندی اصلی

تعداد دانشجو

مدرس آموزش

مدت زمان آموزش

نوع تدریس

پیش نیاز

اشتراک گذاری