برای یافتن مجموعه داده Iris استفاده شده در مثال، می توان از طریق مخزن یادگیری ماشین UCI به آن دسترسی داشت. مجموعه داده Iris یک مجموعه داده متداول در زمینه یادگیری ماشینی برای کارهای طبقه بندی است، به ویژه در زمینه های آموزشی به دلیل سادگی و اثربخشی آن در نشان دادن الگوریتم های مختلف یادگیری ماشین.
مخزن یادگیری ماشین UCI یک منبع پرکاربرد در جامعه یادگیری ماشینی است که مجموعه داده های مختلفی را برای اهداف تحقیقاتی و آموزشی میزبانی می کند. مجموعه داده Iris یکی از مجموعه داده های موجود در مخزن UCI است و می توان به راحتی برای استفاده در پروژه های یادگیری ماشینی به آن دسترسی داشت.
برای بازیابی مجموعه داده Iris از مخزن یادگیری ماشین UCI میتوان این مراحل را دنبال کرد:
1. از وب سایت UCI Machine Learning Repository به آدرس https://archive.ics.uci.edu/ml/index.php دیدن کنید.
2. به بخش «مجموعه داده ها» در وب سایت بروید.
3. با مرور مجموعه داده های موجود یا با استفاده از قابلیت جستجو در وب سایت، مجموعه داده Iris را جستجو کنید.
4. آن را در قالبی دانلود کنید که با محیط یادگیری ماشین استفاده شده سازگار باشد. مجموعه داده معمولاً در قالب CSV (مقادیر جدا شده با کاما) موجود است که میتواند به راحتی به ابزارهایی مانند کتابخانه pandas پایتون برای دستکاری و تجزیه و تحلیل داده وارد شود.
همچنین، میتوان مستقیماً از طریق کتابخانههای معروف یادگیری ماشینی مانند scikit-learn در پایتون به مجموعه دادههای Iris دسترسی پیدا کرد. Scikit-learn توابع داخلی را برای بارگیری مجموعه داده Iris فراهم می کند و دسترسی کاربران به مجموعه داده را بدون نیاز به دانلود جداگانه آن آسان می کند.
در زیر یک نمونه کد کد در پایتون با استفاده از scikit-learn برای بارگذاری مجموعه داده Iris آورده شده است:
python from sklearn.datasets import load_iris # Load the Iris dataset iris = load_iris() # Access the features and target labels X = iris.data y = iris.target # Print the shape of the dataset print("Shape of the Iris dataset:", X.shape)
با اجرای قطعه کد بالا، میتوان مجموعه داده Iris را مستقیماً با استفاده از scikit-learn در محیط Python بارگیری کرد و شروع به کار با مجموعه داده برای برخی از کارهای یادگیری ماشین کرد.
سایر پرسش ها و پاسخ های اخیر در مورد EITC/AI/GCML Google Cloud Machine Learning:
- متن به گفتار (TTS) چیست و چگونه با هوش مصنوعی کار می کند؟
- محدودیت های کار با مجموعه داده های بزرگ در یادگیری ماشین چیست؟
- آیا یادگیری ماشینی می تواند کمک محاوره ای انجام دهد؟
- زمین بازی تنسورفلو چیست؟
- در واقع یک مجموعه داده بزرگتر به چه معناست؟
- چند نمونه از فراپارامترهای الگوریتم چیست؟
- یادگیری گروهی چیست؟
- اگر الگوریتم یادگیری ماشینی انتخاب شده مناسب نباشد چه میشود و چگونه میتوان از انتخاب درست آن مطمئن شد؟
- آیا یک مدل یادگیری ماشینی در طول آموزش نیاز به نظارت دارد؟
- پارامترهای کلیدی مورد استفاده در الگوریتم های مبتنی بر شبکه عصبی کدامند؟
سوالات و پاسخهای بیشتر را در EITC/AI/GCML Google Cloud Machine Learning مشاهده کنید