Octave؛ وقتی هوش مصنوعی دقیقاً می‌فهمه چی می‌گه!

Octave؛ وقتی هوش مصنوعی دقیقاً می‌فهمه چی می‌گه!

9 اسفند 1403
Octave؛ نسل جدید تبدیل متن به گفتار هوشمند!

Hume یه مدل جدید به اسم Octave معرفی کرده که از تمام سیستم‌های تبدیل متن به گفتار (TTS) قبلی یه سر و گردن بالاتره! این مدل فقط متن رو نمی‌خونه، بلکه واقعاً درک می‌کنه چی داره می‌گه. یعنی می‌تونه با توجه به لحن، احساسات و حتی شخصیت متن، صدا رو تنظیم کنه. اگه یه دیالوگ کنایه‌آمیز باشه، با لحن طعنه‌آمیز می‌خونه، یا اگه یه متن هیجان‌انگیز باشه، حس و حالش رو توی صدا منتقل می‌کنه. توی تست‌های مقایسه‌ای، ۱۸۰ نفر به صدای Octave رأی دادن و اون رو از ElevenLabs توی کیفیت صدا (۷۱.۶٪)، طبیعی بودن (۵۱.۷٪) و هماهنگی با لحن متن (۵۷.۷٪) بهتر دونستن.

 Octave یه مدل تبدیل متن به گفتار پیشرفته‌ست که می‌تونه لحن، احساسات و حتی شخصیت‌های مختلف رو توی صدا بازسازی کنه. برعکس مدل‌های سنتی که فقط متن رو می‌خونن، این مدل واقعا معنی جملات رو درک می‌کنه و با توجه به متن، تن صدا، ریتم و حتی احساسات مناسب رو انتخاب می‌کنه. مثلا اگه یه دیالوگ طنزآمیز یا کنایه‌آمیز داشته باشی، Octave می‌تونه اون رو دقیقا با همون حس و حال اجرا کنه، مثل یه بازیگر حرفه‌ای که از روی فیلم‌نامه بازی می‌کنه.

دیدگاهتان را بنویسید