هوش مصنوعی گوگل حالا میفهمه «کدوم ماشین ته خیابون ایستاده»


در نسخه جدید Gemini 2.5، یه قابلیت جدید اضافه شده که میتونه تصویر رو دقیقاً بر اساس توصیف شما بشناسه و تکهتکه کنه. دیگه نیازی نیست فقط بگی “کتاب” یا “آدم”، حالا میتونی بگی “کتاب سوم از سمت چپ” یا “کسی که چتر دستشه” و Gemini دقیق همونو برات جدا میکنه. این قابلیت با درک رابطه بین اشیاء، منطق شرطی، مفاهیم انتزاعی مثل “خرابی” یا “بینظمی”، متن داخل عکس و حتی زبانهای مختلف کار میکنه. یعنی مثلاً توی عکس یه میز ناهار میتونی بگی “غذای گیاهی” یا “پاستا سبز” و فقط همونا برات هایلایت میشن.
این ویژگیهای جدید باعث شده کار طراحها، ناظرهای ایمنی، و حتی کارشناسان بیمه راحتتر و دقیقتر بشه. به جای ابزارهای پیچیده، فقط با یه جمله میتونی به Gemini بگی دنبال چی بگرده. مثلاً یه کارشناس بیمه میتونه بگه “خونههایی که آسیب دیدن” و مدل بهصورت هوشمند بخشهایی که نشوندهنده خسارتن رو جدا میکنه. این قابلیت، با یه API ساده در اختیار برنامهنویسها قرار گرفته و ساخت اپلیکیشنهای تصویری هوشمند رو خیلی راحتتر کرده. خلاصه اینکه تصویر رو مثل یه مکالمه میفهمه؛ دقیق و هوشمند.
-
Telegram
-
Twitter
-
Whatsapp
-
Linkedin
-
Facebook