هوش مصنوعی گوگل حالا می‌فهمه «کدوم ماشین ته خیابون ایستاده»

هوش مصنوعی گوگل حالا می‌فهمه «کدوم ماشین ته خیابون ایستاده»

1 مرداد 1404
Gemini حالا تصویر رو از روی حرفات می‌فهمه.

در نسخه جدید Gemini 2.5، یه قابلیت جدید اضافه شده که می‌تونه تصویر رو دقیقاً بر اساس توصیف شما بشناسه و تکه‌تکه کنه. دیگه نیازی نیست فقط بگی “کتاب” یا “آدم”، حالا می‌تونی بگی “کتاب سوم از سمت چپ” یا “کسی که چتر دستشه” و Gemini دقیق همونو برات جدا می‌کنه. این قابلیت با درک رابطه بین اشیاء، منطق شرطی، مفاهیم انتزاعی مثل “خرابی” یا “بی‌نظمی”، متن داخل عکس و حتی زبان‌های مختلف کار می‌کنه. یعنی مثلاً توی عکس یه میز ناهار می‌تونی بگی “غذای گیاهی” یا “پاستا سبز” و فقط همونا برات هایلایت می‌شن.

این ویژگی‌های جدید باعث شده کار طراح‌ها، ناظرهای ایمنی، و حتی کارشناسان بیمه راحت‌تر و دقیق‌تر بشه. به جای ابزارهای پیچیده، فقط با یه جمله می‌تونی به Gemini بگی دنبال چی بگرده. مثلاً یه کارشناس بیمه می‌تونه بگه “خونه‌هایی که آسیب دیدن” و مدل به‌صورت هوشمند بخش‌هایی که نشون‌دهنده خسارتن رو جدا می‌کنه. این قابلیت، با یه API ساده در اختیار برنامه‌نویس‌ها قرار گرفته و ساخت اپلیکیشن‌های تصویری هوشمند رو خیلی راحت‌تر کرده. خلاصه اینکه تصویر رو مثل یه مکالمه می‌فهمه؛ دقیق و هوشمند.

دیدگاهتان را بنویسید