اجزای کلیدی یک شبکه عصبی کانولوشن (CNN) و نقش های مربوطه آن ها در وظایف تشخیص تصویر چیست؟

by آکادمی EITCA / سه شنبه، 08 اوت 2023 / منتشر شده در هوش مصنوعی, یادگیری عمیق EITC/AI/DLTF با TensorFlow, شبکه های عصبی کانولوشن در TensorFlow, شبکه های عصبی کانولوشن با TensorFlow, بررسی امتحان

شبکه عصبی کانولوشنال (CNN) نوعی مدل یادگیری عمیق است که به طور گسترده در وظایف تشخیص تصویر استفاده شده است. این به طور خاص برای پردازش و تجزیه و تحلیل موثر داده های بصری طراحی شده است و آن را به ابزاری قدرتمند در برنامه های بینایی رایانه تبدیل می کند. در این پاسخ، ما اجزای کلیدی یک CNN و نقش های مربوط به آنها در وظایف تشخیص تصویر را مورد بحث قرار خواهیم داد.

1. لایه های کانولوشنال: لایه های کانولوشن بلوک های سازنده یک CNN هستند. آنها از مجموعه‌ای از فیلترها یا هسته‌های قابل یادگیری تشکیل شده‌اند که با تصویر ورودی برای تولید نقشه‌های ویژگی ترکیب می‌شوند. هر فیلتر یک الگو یا ویژگی خاص در تصویر مانند لبه ها، گوشه ها یا بافت ها را تشخیص می دهد. عملیات پیچیدگی شامل لغزش فیلتر روی تصویر و محاسبه محصول نقطه ای بین وزن فیلتر و پچ تصویر مربوطه است. این فرآیند برای هر مکان در تصویر تکرار می شود و یک نقشه ویژگی ایجاد می کند که حضور ویژگی های مختلف را برجسته می کند.

مثال: اجازه دهید یک فیلتر 3×3 را در نظر بگیریم که لبه های افقی را تشخیص می دهد. هنگامی که با یک تصویر ورودی پیچیده می شود، یک نقشه ویژگی ایجاد می کند که بر لبه های افقی در تصویر تأکید می کند.

2. لایه های ادغام: لایه های ادغام برای نمونه برداری از نقشه های ویژگی تولید شده توسط لایه های کانولوشن استفاده می شود. آنها با حفظ مهم ترین اطلاعات، ابعاد فضایی نقشه های ویژگی را کاهش می دهند. متداول ترین عملیات ادغام استفاده حداکثری است که حداکثر مقدار را در یک پنجره ادغام انتخاب می کند. این به کاهش پیچیدگی محاسباتی شبکه کمک می کند و آن را نسبت به تغییرات فضایی کوچک در تصویر ورودی قوی تر می کند.

مثال: اعمال حداکثر ادغام با یک پنجره ادغام 2×2 بر روی نقشه ویژگی، حداکثر مقدار را در هر منطقه 2×2 غیر همپوشانی انتخاب می‌کند و به طور موثر ابعاد فضایی را به نصف کاهش می‌دهد.

3. توابع فعال سازی: توابع فعال سازی غیرخطی بودن را به CNN وارد می کند و به آن امکان می دهد الگوهای پیچیده را یاد بگیرد و پیش بینی کند. متداول ترین تابع فعال سازی در CNN ها واحد خطی اصلاح شده (ReLU) است که خروجی را به صورت حداکثر صفر و ورودی محاسبه می کند. ReLU به دلیل سادگی و توانایی آن برای کاهش مشکل گرادیان ناپدید شدن ترجیح داده می شود.

مثال: اگر خروجی یک نورون منفی باشد، ReLU آن را صفر می کند و در واقع نورون را خاموش می کند. اگر خروجی مثبت باشد، ReLU آن را بدون تغییر نگه می دارد.

4. لایه های کاملاً متصل: لایه های کاملاً متصل وظیفه پیش بینی نهایی را بر اساس ویژگی های استخراج شده بر عهده دارند. آنها نقشه های ویژگی مسطح شده را از لایه های قبلی می گیرند و آنها را از طریق یک سری نورون های کاملا متصل عبور می دهند. هر نورون در لایه کاملاً متصل به هر نورون در لایه قبلی متصل است و به آن اجازه می‌دهد تا روابط پیچیده بین ویژگی‌ها را بیاموزد و پیش‌بینی‌های دقیق انجام دهد.

مثال: در یک کار تشخیص تصویر، لایه کاملا متصل ممکن است دارای نورون های مربوط به کلاس های مختلف باشد، مانند "گربه"، "سگ" و "ماشین". خروجی لایه کاملا متصل را می توان به عنوان احتمالات تصویر ورودی متعلق به هر کلاس تفسیر کرد.

5. تابع ضرر: تابع ضرر اختلاف بین خروجی های پیش بینی شده و برچسب های حقیقت زمین را اندازه گیری می کند. این کمیت می کند که CNN تا چه حد بر روی کار در حال انجام است و سیگنالی برای به روز رسانی پارامترهای مدل در طول آموزش ارائه می دهد. انتخاب تابع از دست دادن به وظیفه تشخیص تصویر خاص بستگی دارد، مانند آنتروپی متقاطع باینری برای طبقه‌بندی باینری یا آنتروپی متقابل طبقه‌بندی برای طبقه‌بندی چند کلاسه.

مثال: در یک کار طبقه‌بندی باینری، از دست دادن آنتروپی متقاطع باینری، احتمال پیش‌بینی شده کلاس مثبت را با برچسب واقعی (0 یا 1) مقایسه می‌کند و اختلافات بزرگ بین آنها را جریمه می‌کند.

یک شبکه عصبی کانولوشن (CNN) از لایه‌های کانولوشن، لایه‌های ادغام، توابع فعال‌سازی، لایه‌های کاملاً متصل و یک تابع از دست دادن تشکیل شده است. لایه‌های کانولوشن ویژگی‌های معنی‌داری را از تصویر ورودی استخراج می‌کنند، در حالی که لایه‌های ادغام نقشه‌های ویژگی را پایین می‌آورند. توابع فعال سازی غیر خطی بودن را معرفی می کنند و لایه های کاملاً متصل پیش بینی های نهایی را انجام می دهند. تابع ضرر اختلاف بین خروجی های پیش بینی شده و برچسب های حقیقت زمین را اندازه گیری می کند و روند آموزش را هدایت می کند.

سایر پرسش ها و پاسخ های اخیر در مورد شبکه های عصبی کانولوشن در TensorFlow:

پرسش و پاسخ بیشتر:

برچسب ها: هوش مصنوعی, CNN, چشم انداز کامپیوتر, شبکه عصبی کانولوشنال, یادگیری عمیق, شناسایی تصویر

آکادمی EITCA

اجزای کلیدی یک شبکه عصبی کانولوشن (CNN) و نقش های مربوطه آن ها در وظایف تشخیص تصویر چیست؟

سایر پرسش ها و پاسخ های اخیر در مورد شبکه های عصبی کانولوشن در TensorFlow:

پرسش و پاسخ بیشتر:

آکادمی EITCA بخشی از چارچوب گواهینامه IT اروپا است

واجد شرایط بودن برای EITCA Academy 80٪ EITCI DSJC پشتیبانی یارانه

آکادمی EITCA

ورود به حساب خود را با هر نام کاربری یا آدرس ایمیل خود وارد کنید

جزئیات خود را فراموش کرده اید؟

ایجاد یک حساب کاربری

اجزای کلیدی یک شبکه عصبی کانولوشن (CNN) و نقش های مربوطه آن ها در وظایف تشخیص تصویر چیست؟

سایر پرسش ها و پاسخ های اخیر در مورد شبکه های عصبی کانولوشن در TensorFlow:

پرسش و پاسخ بیشتر:

واجد شرایط بودن برای EITCA Academy 80٪ EITCI DSJC پشتیبانی یارانه