Octave؛ وقتی هوش مصنوعی دقیقاً میفهمه چی میگه!
 
				 
															Hume یه مدل جدید به اسم Octave معرفی کرده که از تمام سیستمهای تبدیل متن به گفتار (TTS) قبلی یه سر و گردن بالاتره! این مدل فقط متن رو نمیخونه، بلکه واقعاً درک میکنه چی داره میگه. یعنی میتونه با توجه به لحن، احساسات و حتی شخصیت متن، صدا رو تنظیم کنه. اگه یه دیالوگ کنایهآمیز باشه، با لحن طعنهآمیز میخونه، یا اگه یه متن هیجانانگیز باشه، حس و حالش رو توی صدا منتقل میکنه. توی تستهای مقایسهای، ۱۸۰ نفر به صدای Octave رأی دادن و اون رو از ElevenLabs توی کیفیت صدا (۷۱.۶٪)، طبیعی بودن (۵۱.۷٪) و هماهنگی با لحن متن (۵۷.۷٪) بهتر دونستن.
Octave یه مدل تبدیل متن به گفتار پیشرفتهست که میتونه لحن، احساسات و حتی شخصیتهای مختلف رو توی صدا بازسازی کنه. برعکس مدلهای سنتی که فقط متن رو میخونن، این مدل واقعا معنی جملات رو درک میکنه و با توجه به متن، تن صدا، ریتم و حتی احساسات مناسب رو انتخاب میکنه. مثلا اگه یه دیالوگ طنزآمیز یا کنایهآمیز داشته باشی، Octave میتونه اون رو دقیقا با همون حس و حال اجرا کنه، مثل یه بازیگر حرفهای که از روی فیلمنامه بازی میکنه.
- 
                    Telegram
- 
                    Twitter
- 
                    Whatsapp
- 
                    Linkedin
- 
                    Facebook
