Son Konu

NVIDIA’dan Yapay Zeka Destekli Konuşma Algoritması: RAD-TTS

elektronikci

Yeni Üye
Katılım
9 Ocak 2022
Mesajlar
153,387
Tepkime
0
Puanları
36
Yaş
35
Credits
0
Geri Bildirim : 0 / 0 / 0
Nvidia-Yapay-Zeka-Konusma-ve-Ses.jpg

Sentezlenmiş sesler yıllar içinde çok yol katetti. Alexa ve Siri üzere çağdaş yapay zeka asistanları ise çok gerçekçi insan sesleri çıkarabiliyor, birebir vakitte epeyce akıcı konuşuyorlar. NVIDIA ise RAD-TTS isimli bir yapay zeka modeli geliştirdi.

Böylece geliştiriciler, modeli kendi sesleriyle eğitebiliyor ve öğrenilen tonlamalar kullanılarak metinler doğal konuşmaya dönüştürülebiliyor. Ayrıyeten bir konuşmacının ve hatta müziklerin sesi, bir öbür insanın sesine dönüştürülebiliyor. NVIDIA yeni tahlilini şöyle tanımlıyor:

Bir müzik enstrümanı olarak insan sesinden ilham alan RAD-TTS arayüzü, kullanıcılara sentezlenen sesin perdesi, müddeti ve gücü üzerinde ince denetimler sağlıyor.

NVIDIA ayrıyeten “I AM AI” görüntü serisinde kullanılan teknolojinin örneklerini sergiliyor. Aşağıdaki görüntüde ise yapay zeka dayanaklı modelin kimi maharetlerinden bahsedilmiş.



Bu teknoloji, otomatik müşteri hizmetleri, lisan çevirisi, engelliler için takviye ve hatta oyunlar dahil olmak üzere birçok alanda kullanılabilir. Özetleyecek olursak, doğal insan sesi gerektiren çabucak hemen her uygulamada RAD-TTS’den yararlanmak mümkün olabilir.

Blog yazısında yapay zeka takviyeli teknolojiyle ilgili ayrıyeten şu bilgiler veriliyor:

Modellerin birçoğu NVIDIA DGX sistemlerinde on binlerce saatlik ses bilgileriyle eğitiliyor. Geliştiriciler, kullanım durumuna nazaran rastgele bir modele ince ayar yapabilir ve NVIDIA Tensor Core GPU’larda karma hassas bilgi süreç kullanarak eğitimi hızlandırabilir.

Araçlar NVIDIA ekran kartlarına sahip bilgisayarlarda kullanım için optimize edildi. Lakin çalışmalar açık kaynak kodlu ve ilgilenen tüm geliştiriciler için fiyatsız olarak sunuluyor.
 
Üst Alt