جهش هوش مصنوعی Deep Cogito در دنیای مدل‌های زبان متن‌باز

جهش هوش مصنوعی Deep Cogito در دنیای مدل‌های زبان متن‌باز

20 فروردین 1404
مدل زبان متن‌باز Deep Cogito، پرچم‌دار نسل جدید هوش مصنوعی

یه استارتاپ نوپای آمریکایی به اسم Deep Cogito بالاخره بعد از کلی سکوت رسانه‌ای، اولین مدل‌های متن‌باز خودش رو منتشر کرده و از همون روز اول، کلی از مدلای معروف دیگه رو توی بنچمارک‌ها پشت سر گذاشته. مدل‌هاش از روی LLaMA 3.2 متا ساخته شدن، ولی با یه قابلیت جدید به اسم “تفکر بازتابی” که قبلاً فقط توی سری o اوپن‌AI یا مدل‌های DeepSeek R1 دیده بودیم. این یعنی هم می‌تونه سریع جواب بده، هم خودش فکر کنه و نتیجه‌گیریش رو بهتر کنه. جالب‌تر اینه که کل مدل‌هاش رو متن‌باز کرده و هر کسی می‌تونه ازش استفاده کنه.

مدل‌ها توی سایزهای مختلف از ۳ تا ۷۰ میلیارد پارامتر منتشر شدن و فعلاً روی پلتفرم‌هایی مثل Hugging Face، Ollama و APIهایی مثل Fireworks و Together AI قابل استفاده‌ن. طبق تست‌ها، مدل Cogito 8B توی اکثر زمینه‌ها از DeepSeek و LLaMA بهتر عمل کرده، مخصوصاً توی کارای استدلالی مثل MMLU و ARC. حتی قابلیت تماس با ابزارها (Tool Calling) هم به‌صورت داخلی پشتیبانی میشه، یه چیزی که هنوز تو LLaMA نیست! مدل‌های بعدی تا ۶۷۱ میلیارد پارامتر هم تو راهه، اونم با ساختاری متفاوت به اسم IDA که یه جور تمرین خودآموزیه. Deep Cogito داره به سمتی می‌ره که هوش مصنوعی مستقل‌تر و قوی‌تر از آدم‌ها بسازه — ولی با شعار: «همه چی باید آزاد باشه.»

دیدگاهتان را بنویسید