برای استخراج برنامهنویسی برچسبها از تصاویر با استفاده از Python و Vision API، میتوانید از قابلیتهای قدرتمند Google Cloud Vision API استفاده کنید. Vision API مجموعه ای جامع از ویژگی های تجزیه و تحلیل تصویر، از جمله تشخیص برچسب را ارائه می دهد که به شما امکان می دهد به طور خودکار برچسب ها را از تصاویر شناسایی و استخراج کنید.
برای شروع، باید یک پروژه Google Cloud راه اندازی کنید و Vision API را فعال کنید. پس از انجام این کار، می توانید کتابخانه های مورد نیاز پایتون را با اجرای دستور زیر نصب کنید:
python pip install google-cloud-vision
در مرحله بعد، برای دسترسی به Vision API باید برنامه خود را احراز هویت کنید. می توانید این کار را با ایجاد یک کلید حساب سرویس و تنظیم متغیر محیطی «GOOGLE_APPLICATION_CREDENTIALS» انجام دهید تا به مسیر فایل کلید اشاره کند. این کار را می توان با استفاده از کد زیر انجام داد:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
اکنون میتوانید از Vision API برای استخراج برچسبها از تصاویر به صورت برنامهنویسی استفاده کنید. قطعه کد زیر نحوه انجام این کار را نشان می دهد:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
در این کد، ابتدا نمونهای از کلاس «ImageAnnotatorClient» از کتابخانه «google.cloud.vision» ایجاد میکنیم. سپس فایل تصویر را می خوانیم، یک شی «Image» از محتوای فایل ایجاد می کنیم و آن را برای شناسایی برچسب به Vision API ارسال می کنیم. پاسخ API حاوی لیستی از حاشیه نویسی برچسب است که ما توضیحات برچسب ها را از آن استخراج می کنیم.
اکنون میتوانید تابع «extract_labels» را با ارسال مسیر به فایل تصویری که میخواهید تجزیه و تحلیل کنید، فراخوانی کنید. لیستی از برچسب های استخراج شده از تصویر را برمی گرداند.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
با این کار برچسب های استخراج شده از تصویر خروجی می شود.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API از مدل های پیشرفته یادگیری ماشین برای تجزیه و تحلیل تصاویر و شناسایی اشیا، صحنه ها و سایر ویژگی های بصری استفاده می کند. میتواند طیف وسیعی از برچسبها را با دقت تشخیص دهد، و آن را به ابزاری ارزشمند برای کاربردهای مختلف مانند طبقهبندی تصویر، تعدیل محتوا و جستجوی بصری تبدیل میکند.
برای استخراج برنامهنویسی برچسبها از تصاویر با استفاده از Python و Vision API، باید یک پروژه Google Cloud راهاندازی کنید، Vision API را فعال کنید، کتابخانههای Python مورد نیاز را نصب کنید، برنامه خود را احراز هویت کنید، و سپس از Vision API برای انجام شناسایی برچسب در تصاویر. برچسب های استخراج شده را می توان برای تجزیه و تحلیل بیشتر یا افزایش درک محتوای تصویر استفاده کرد.
سایر پرسش ها و پاسخ های اخیر در مورد EITC/AI/GVAPI Google Vision API:
- چند دسته از پیش تعریف شده برای تشخیص شی در Google Vision API چیست؟
- آیا Google Vision API تشخیص چهره را فعال می کند؟
- چگونه می توان متن نمایشگر را هنگام ترسیم مرزهای شی با استفاده از تابع "draw_vertices" به تصویر اضافه کرد؟
- پارامترهای متد "draw.line" در کد ارائه شده چیست و چگونه از آنها برای کشیدن خطوط بین مقادیر رئوس استفاده می شود؟
- چگونه می توان از کتابخانه بالش برای ترسیم مرزهای اشیا در پایتون استفاده کرد؟
- هدف از تابع "draw_vertices" در کد ارائه شده چیست؟
- چگونه Google Vision API می تواند به درک اشکال و اشیاء در یک تصویر کمک کند؟
- چگونه کاربران می توانند تصاویر مشابه بصری توصیه شده توسط API را کاوش کنند؟
- عناصر مختلف ارائه شده در شی پاسخ ویژگی تشخیص وب Google Vision API چیست؟
- چگونه ویژگی Web Detection به تولید برچسب برای تصاویر آپلود شده کمک می کند؟
سوالات و پاسخهای بیشتر را در EITC/AI/GVAPI Google Vision API مشاهده کنید