یادگیری تحت نظارت، بدون نظارت و تقویتی سه رویکرد متمایز در زمینه یادگیری ماشین هستند. هر رویکرد از تکنیک ها و الگوریتم های مختلفی برای رسیدگی به انواع مختلف مسائل و دستیابی به اهداف خاص استفاده می کند. بیایید تمایز بین این رویکردها را بررسی کنیم و توضیح جامعی از ویژگی ها و کاربردهای آنها ارائه دهیم.
یادگیری نظارت شده نوعی از یادگیری ماشینی است که در آن الگوریتم از داده های برچسب دار یاد می گیرد. دادههای برچسبگذاریشده شامل نمونههای ورودی است که با خروجی صحیح یا مقدار هدف مربوطه جفت شدهاند. هدف از یادگیری تحت نظارت، آموزش مدلی است که بتواند خروجی ورودی های جدید و نادیده را به دقت پیش بینی کند. الگوریتم یادگیری از داده های برچسب گذاری شده برای استنتاج الگوها و روابط بین ویژگی های ورودی و برچسب های خروجی استفاده می کند. سپس این دانش را تعمیم میدهد تا روی دادههای جدید و بدون برچسب پیشبینی کند. یادگیری تحت نظارت معمولاً در کارهایی مانند طبقه بندی و رگرسیون استفاده می شود.
به عنوان مثال، در یک مسئله طبقه بندی، الگوریتم بر روی یک مجموعه داده آموزش داده می شود که در آن هر نقطه داده با یک کلاس خاص برچسب گذاری شده است. الگوریتم یاد می گیرد که بر اساس الگوهایی که از نمونه های برچسب خورده آموخته است، نقاط داده جدید و نادیده را در یکی از کلاس های از پیش تعریف شده طبقه بندی کند. در یک مسئله رگرسیون، الگوریتم یاد می گیرد که یک مقدار عددی پیوسته را بر اساس ویژگی های ورودی پیش بینی کند.
از سوی دیگر، یادگیری بدون نظارت، با داده های بدون برچسب سروکار دارد. هدف از یادگیری بدون نظارت، کشف الگوها، ساختارها یا روابط پنهان در داده ها بدون هیچ گونه دانش قبلی از برچسب های خروجی است. برخلاف یادگیری تحت نظارت، الگوریتم های یادگیری بدون نظارت مقادیر هدف مشخصی برای هدایت فرآیند یادگیری ندارند. در عوض، آنها بر یافتن بازنمایی ها یا خوشه های معنی دار در داده ها تمرکز می کنند. یادگیری بدون نظارت معمولاً در کارهایی مانند خوشه بندی، کاهش ابعاد و تشخیص ناهنجاری استفاده می شود.
خوشه بندی یک کاربرد محبوب یادگیری بدون نظارت است که در آن الگوریتم نقاط داده مشابه را بر اساس ویژگی های ذاتی آنها با هم گروه بندی می کند. به عنوان مثال، در تقسیم بندی مشتری، یک الگوریتم یادگیری بدون نظارت می تواند برای شناسایی گروه های متمایز از مشتریان بر اساس رفتار خرید یا اطلاعات جمعیت شناختی استفاده شود.
یادگیری تقویتی پارادایم متفاوتی است که در آن یک عامل یاد می گیرد که با یک محیط تعامل داشته باشد تا سیگنال پاداش تجمعی را به حداکثر برساند. در یادگیری تقویتی، الگوریتم از طریق فرآیند آزمون و خطا با انجام اقدامات، مشاهده وضعیت محیط و دریافت بازخورد در قالب پاداش یا جریمه، یاد می گیرد. هدف یافتن یک خط مشی بهینه یا مجموعه ای از اقدامات است که پاداش بلندمدت را به حداکثر می رساند. یادگیری تقویتی معمولاً در کارهایی مانند بازی، روباتیک و سیستم های مستقل استفاده می شود.
به عنوان مثال، در بازی شطرنج، یک عامل یادگیری تقویتی می تواند با کاوش در حرکات مختلف، دریافت پاداش یا پنالتی بر اساس نتیجه هر حرکت، و تنظیم استراتژی خود برای به حداکثر رساندن شانس برنده شدن، بازی را یاد بگیرد.
یادگیری نظارت شده از داده های برچسب گذاری شده برای آموزش مدلی برای وظایف پیش بینی استفاده می کند، یادگیری بدون نظارت الگوها و ساختارها را در داده های بدون برچسب کشف می کند، و یادگیری تقویتی از طریق تعامل با یک محیط برای به حداکثر رساندن سیگنال پاداش می آموزد. هر رویکرد دارای نقاط قوت و ضعف خاص خود است و برای انواع مختلف مشکلات و کاربردها مناسب است.
سایر پرسش ها و پاسخ های اخیر در مورد EITC/AI/GCML Google Cloud Machine Learning:
- متن به گفتار (TTS) چیست و چگونه با هوش مصنوعی کار می کند؟
- محدودیت های کار با مجموعه داده های بزرگ در یادگیری ماشین چیست؟
- آیا یادگیری ماشینی می تواند کمک محاوره ای انجام دهد؟
- زمین بازی تنسورفلو چیست؟
- در واقع یک مجموعه داده بزرگتر به چه معناست؟
- چند نمونه از فراپارامترهای الگوریتم چیست؟
- یادگیری گروهی چیست؟
- اگر الگوریتم یادگیری ماشینی انتخاب شده مناسب نباشد چه میشود و چگونه میتوان از انتخاب درست آن مطمئن شد؟
- آیا یک مدل یادگیری ماشینی در طول آموزش نیاز به نظارت دارد؟
- پارامترهای کلیدی مورد استفاده در الگوریتم های مبتنی بر شبکه عصبی کدامند؟
سوالات و پاسخهای بیشتر را در EITC/AI/GCML Google Cloud Machine Learning مشاهده کنید