Octave؛ وقتی هوش مصنوعی دقیقاً می‌فهمه چی می‌گه!

سینا جاویدان

9 اسفند 1403

Hume یه مدل جدید به اسم Octave معرفی کرده که از تمام سیستم‌های تبدیل متن به گفتار (TTS) قبلی یه سر و گردن بالاتره! این مدل فقط متن رو نمی‌خونه، بلکه واقعاً درک می‌کنه چی داره می‌گه. یعنی می‌تونه با توجه به لحن، احساسات و حتی شخصیت متن، صدا رو تنظیم کنه. اگه یه دیالوگ کنایه‌آمیز باشه، با لحن طعنه‌آمیز می‌خونه، یا اگه یه متن هیجان‌انگیز باشه، حس و حالش رو توی صدا منتقل می‌کنه. توی تست‌های مقایسه‌ای، ۱۸۰ نفر به صدای Octave رأی دادن و اون رو از ElevenLabs توی کیفیت صدا (۷۱.۶٪)، طبیعی بودن (۵۱.۷٪) و هماهنگی با لحن متن (۵۷.۷٪) بهتر دونستن.

مقالات مرتبط

هوش مصنوعی آهنگساز؟ Soundraw دنیای موسیقی رو تغییر میده!

اپلیکیشن های هوش مصنوعی ضروری برای اندروید و ios

Octave یه مدل تبدیل متن به گفتار پیشرفته‌ست که می‌تونه لحن، احساسات و حتی شخصیت‌های مختلف رو توی صدا بازسازی کنه. برعکس مدل‌های سنتی که فقط متن رو می‌خونن، این مدل واقعا معنی جملات رو درک می‌کنه و با توجه به متن، تن صدا، ریتم و حتی احساسات مناسب رو انتخاب می‌کنه. مثلا اگه یه دیالوگ طنزآمیز یا کنایه‌آمیز داشته باشی، Octave می‌تونه اون رو دقیقا با همون حس و حال اجرا کنه، مثل یه بازیگر حرفه‌ای که از روی فیلم‌نامه بازی می‌کنه.

مشاهده منبع خبر hume

Octave؛ وقتی هوش مصنوعی دقیقاً می‌فهمه چی می‌گه!

دیدگاهتان را بنویسید لغو پاسخ