پوشش کامل نیازهای شما برای یادگیری

انواع ماشین لرنینگ

به طور کلی سیستم های ماشین لرنینگ بر اساس اینکه چه نوع و مقدار داده ای رو نظارت روش میکنند ، به چهار دسته نظارتی ، غیرنظارتی ، تقویتی و شبه نظارتی تقسیم میشند که من سه تای اولو یه توضیح مختصری میدم🥱

یادگیری نظارتی(supervised learning):

توی یادگیری نظارتی training data set که ما به برنامه میدیم شامل مقادیر خروجی یا به زبون دیگه جوابی که باید برنامه بده میشه که بهشون میگیم لیبل(Label) همون مثال فیلتر اسپمی که اول کار گفتم هم از همین نوع هست.

مثلا یه کاربرد دیگه ای که میتونه داشته باشه تو بحث قیمت خودرو ، ملک یا به طور کلی هر نوع مقدار عددی هست که پارامتر های عددی دیگه رابطه دارند . ما یه سری خصوصیت (feature ) مثل سال تولید ، کیلومتر طی شده ، رنگ ، اتوماتیک بودن یا نبودن و ویژگی های دیگه رو به همراه قیمتش به عنوان training set میدیم و الگوریتم پیشبینی می کنه که مثلا یه ماشینی مدل 82 دنده اتوماتیک با رنگ نقره ای چه قیمت هست و این قیمت رو که مدل ما پیشبینی کرده میایم نسبت میدیم به قیمت واقعیش و میفهمیم که درصد خطاش یا دقتش چقدر بوده.

نکته مهمی هم که باید اضافه بکنم تو حوزه ماشین لرنینگ بین دو کلمه attribute و feature تفاوت وجود داره به این شکل که attribute فقط اشاره به نوع داده داره اما feature نوع و مقدار اون داده رو مشخص می کنه .

یادگیری غیر نظارتی (unsupervised leaning ):

توی این روش برخلاف روش قبل ما درون داده ای که آموزش میدیم لیبل نداریم و در واقع هیچ معیاری برای سنجش درست یا غلط بودن وجود نداره

به عنوان مثال ما حجم زیادی دیتا از بینندگان وبساتیمون داریم و می خوای با استفاده از الگوریتم کلاسترینگ افرادی که سلیقه های مشترکی دارند رو گروه بندی کنیم . اینکارو الگوریتم بدون هیچ کمکی از داده ترین انجام میده و باید خودش شباهت ها و اشتراکات این داده ها رو تشخیص بده مثلا تشخیص بده به عنوان مثال 60 درصد خوانندگان مرد هستند یا مثلا 20 درصد مردم علاقه به فیلمای اکشن دارند.

یه سری دیگه از الگوریتم های غیر نظارتی نمایش بصری (visualization ) هستند که توی بحث بیگ دیتا و داده های حجم بالایی که لیبل ندارند خیلی کاربردیه و میتونه خیلی سریع بینش کلی از اون داده ای که داریم بهمون بده

یک موضوعی که مربوط به یادیگری غیرنظارتی هستش و خیلی مهم هست بحث کاهش ابعادیه (dimensionality reduction ) که درش ما بدون اینکه اطلاعات زیادی رو از دست بدیم میایم داده های ساده تر می کنیم و برای این کار میایم گروه های داده ای رو که با همدیگه مرتبط هستند مرج (merge)می کنیم تا تقسیم بندی ساده تر بشه به عنوان مثال کیلو متر ماشین با عمر ماشین مرتبطه به خاطر همین میایم ما این دو گروه از داده رو مرج می کنیم به این عمل feature extraction گفته میشه .

یادگیری تقویتی ( Reinforcement learning ):

توی یادگیری تقویتی سیستم یادگیری محیط رو مشاهده می کنه یه عملی رو انتخاب و اونو انجام میده و در صورت درست بودنش جایزه میگیره در غیر این صورت هم جریمه میشه جوریه که یادمیگیره که بهترین استراتژی چیه که تو طول زمان بیشترین جایزه یا توکن رو بگیره

مثال های زیادی هم داره از حوزه رباتیک گرفته تا شبیه سازی و مدلینگ تا بحث گیمینگ و پست خودشو میطلبه تا توضیح بدم 😅

مطالب مشابه