دادههای برچسبگذاریشده، در زمینه هوش مصنوعی (AI) و بهویژه در حوزه یادگیری ماشین Google Cloud، به مجموعه دادهای اشاره دارد که با برچسبها یا دستههای خاصی حاشیهنویسی یا علامتگذاری شده است. این برچسب ها به عنوان حقیقت اصلی یا مرجع برای آموزش الگوریتم های یادگیری ماشین عمل می کنند. با مرتبط کردن نقاط داده با برچسبهای مربوطه، مدل یادگیری ماشینی میتواند یاد بگیرد که الگوها را تشخیص دهد و بر اساس دادههای جدید و دیده نشده پیشبینی کند.
داده های برچسب گذاری شده نقش مهمی در یادگیری نظارت شده ایفا می کنند، که یک رویکرد رایج در یادگیری ماشین است. در یادگیری نظارت شده، مدل بر روی یک مجموعه داده برچسبگذاری شده آموزش داده میشود تا رابطه بین ویژگیهای ورودی و برچسبهای خروجی مربوطه را بیاموزد. این فرآیند آموزشی به مدل اجازه می دهد تا دانش خود را تعمیم دهد و پیش بینی های دقیقی را بر روی داده های جدید و دیده نشده انجام دهد.
برای نشان دادن این مفهوم، اجازه دهید مثالی از یک کار یادگیری ماشین در زمینه تشخیص تصویر را در نظر بگیریم. فرض کنید میخواهیم مدلی بسازیم که بتواند تصاویر حیوانات را در دستههای مختلف مانند گربهها، سگها و پرندگان طبقهبندی کند. ما به یک مجموعه داده برچسبدار نیاز داریم که در آن هر تصویر با برچسب صحیح خود مرتبط باشد. به عنوان مثال، یک تصویر از یک گربه با عنوان "گربه"، یک تصویر از یک سگ به عنوان "سگ" و غیره برچسب گذاری می شود.
مجموعه داده برچسبگذاریشده شامل مجموعهای از تصاویر و برچسبهای مربوط به آنها خواهد بود. هر تصویر با مجموعه ای از ویژگی ها، مانند مقادیر پیکسل یا نمایش های سطح بالاتر استخراج شده از تصویر، نشان داده می شود. برچسب ها دسته یا کلاس درستی را که هر تصویر به آن تعلق دارد را نشان می دهد.
در طول مرحله آموزش، مدل یادگیری ماشین با مجموعه داده برچسبگذاری شده ارائه میشود. این میتواند الگوها و روابط بین ویژگیهای ورودی و برچسبهای مربوطه را شناسایی کند. این مدل پارامترهای داخلی خود را بهروزرسانی میکند تا تفاوت بین پیشبینیهای آن و برچسبهای واقعی در دادههای آموزشی به حداقل برسد.
پس از آموزش مدل، می توان از آن برای پیش بینی تصاویر جدید و دیده نشده استفاده کرد. با توجه به یک تصویر بدون برچسب، مدل ویژگیهای آن را تجزیه و تحلیل میکند و محتملترین برچسب را بر اساس دانش آموختهشده از مجموعه داده برچسبگذاری شده پیشبینی میکند. به عنوان مثال، اگر مدل پیشبینی میکند که یک تصویر حاوی یک گربه است، به این معنی است که الگوهایی را در تصویر شناسایی کرده است که نشاندهنده گربه هستند.
داده های برچسب دار یک جزء اساسی در آموزش مدل های یادگیری ماشین هستند. این اطلاعات لازم را برای مدل فراهم می کند تا از آن یاد بگیرد و پیش بینی های دقیق انجام دهد. با مرتبط کردن نقاط داده با برچسب های مربوطه، مدل می تواند یاد بگیرد که الگوها را تشخیص دهد و دانش خود را به داده های نادیده تعمیم دهد.
سایر پرسش ها و پاسخ های اخیر در مورد EITC/AI/GCML Google Cloud Machine Learning:
- متن به گفتار (TTS) چیست و چگونه با هوش مصنوعی کار می کند؟
- محدودیت های کار با مجموعه داده های بزرگ در یادگیری ماشین چیست؟
- آیا یادگیری ماشینی می تواند کمک محاوره ای انجام دهد؟
- زمین بازی تنسورفلو چیست؟
- در واقع یک مجموعه داده بزرگتر به چه معناست؟
- چند نمونه از فراپارامترهای الگوریتم چیست؟
- یادگیری گروهی چیست؟
- اگر الگوریتم یادگیری ماشینی انتخاب شده مناسب نباشد چه میشود و چگونه میتوان از انتخاب درست آن مطمئن شد؟
- آیا یک مدل یادگیری ماشینی در طول آموزش نیاز به نظارت دارد؟
- پارامترهای کلیدی مورد استفاده در الگوریتم های مبتنی بر شبکه عصبی کدامند؟
سوالات و پاسخهای بیشتر را در EITC/AI/GCML Google Cloud Machine Learning مشاهده کنید