Octave؛ وقتی هوش مصنوعی دقیقاً میفهمه چی میگه!


Hume یه مدل جدید به اسم Octave معرفی کرده که از تمام سیستمهای تبدیل متن به گفتار (TTS) قبلی یه سر و گردن بالاتره! این مدل فقط متن رو نمیخونه، بلکه واقعاً درک میکنه چی داره میگه. یعنی میتونه با توجه به لحن، احساسات و حتی شخصیت متن، صدا رو تنظیم کنه. اگه یه دیالوگ کنایهآمیز باشه، با لحن طعنهآمیز میخونه، یا اگه یه متن هیجانانگیز باشه، حس و حالش رو توی صدا منتقل میکنه. توی تستهای مقایسهای، ۱۸۰ نفر به صدای Octave رأی دادن و اون رو از ElevenLabs توی کیفیت صدا (۷۱.۶٪)، طبیعی بودن (۵۱.۷٪) و هماهنگی با لحن متن (۵۷.۷٪) بهتر دونستن.
Octave یه مدل تبدیل متن به گفتار پیشرفتهست که میتونه لحن، احساسات و حتی شخصیتهای مختلف رو توی صدا بازسازی کنه. برعکس مدلهای سنتی که فقط متن رو میخونن، این مدل واقعا معنی جملات رو درک میکنه و با توجه به متن، تن صدا، ریتم و حتی احساسات مناسب رو انتخاب میکنه. مثلا اگه یه دیالوگ طنزآمیز یا کنایهآمیز داشته باشی، Octave میتونه اون رو دقیقا با همون حس و حال اجرا کنه، مثل یه بازیگر حرفهای که از روی فیلمنامه بازی میکنه.
-
Telegram
-
Twitter
-
Whatsapp
-
Linkedin
-
Facebook