جهش هوش مصنوعی Deep Cogito در دنیای مدلهای زبان متنباز


یه استارتاپ نوپای آمریکایی به اسم Deep Cogito بالاخره بعد از کلی سکوت رسانهای، اولین مدلهای متنباز خودش رو منتشر کرده و از همون روز اول، کلی از مدلای معروف دیگه رو توی بنچمارکها پشت سر گذاشته. مدلهاش از روی LLaMA 3.2 متا ساخته شدن، ولی با یه قابلیت جدید به اسم “تفکر بازتابی” که قبلاً فقط توی سری o اوپنAI یا مدلهای DeepSeek R1 دیده بودیم. این یعنی هم میتونه سریع جواب بده، هم خودش فکر کنه و نتیجهگیریش رو بهتر کنه. جالبتر اینه که کل مدلهاش رو متنباز کرده و هر کسی میتونه ازش استفاده کنه.
مدلها توی سایزهای مختلف از ۳ تا ۷۰ میلیارد پارامتر منتشر شدن و فعلاً روی پلتفرمهایی مثل Hugging Face، Ollama و APIهایی مثل Fireworks و Together AI قابل استفادهن. طبق تستها، مدل Cogito 8B توی اکثر زمینهها از DeepSeek و LLaMA بهتر عمل کرده، مخصوصاً توی کارای استدلالی مثل MMLU و ARC. حتی قابلیت تماس با ابزارها (Tool Calling) هم بهصورت داخلی پشتیبانی میشه، یه چیزی که هنوز تو LLaMA نیست! مدلهای بعدی تا ۶۷۱ میلیارد پارامتر هم تو راهه، اونم با ساختاری متفاوت به اسم IDA که یه جور تمرین خودآموزیه. Deep Cogito داره به سمتی میره که هوش مصنوعی مستقلتر و قویتر از آدمها بسازه — ولی با شعار: «همه چی باید آزاد باشه.»
-
Telegram
-
Twitter
-
Whatsapp
-
Linkedin
-
Facebook