1. Ana Sayfa
  2. Yapay Zeka
  3. Google’ın Yeni Yapay Zekası, Sadece 30 Dakikalık Veriyle Ses Hızını, Duygu ve Hızı Ayarlayabiliyor

Google’ın Yeni Yapay Zekası, Sadece 30 Dakikalık Veriyle Ses Hızını, Duygu ve Hızı Ayarlayabiliyor

Google ai_668x445

Google ve University College London’daki AI araştırmacıları, yalnızca 30 dakikalık verilerle ses perdesi, duygu ve konuşma hızı gibi konuşma özelliklerini kontrol edebilen bir AI modeline sahip. Uluslararası Öğrenme Temsilleri Konferansı (ICLR) tarafından yayınlanan makaleleri, araştırmacıların AI sistemini Google’ın özel tasarlanmış tensör işlem birimlerinin (TPU) 32’sinde 300.000 adım boyunca nasıl eğittiklerini detaylandırıyor.

Araştırmaya göre, sadece 30 dakikalık etiketlenmiş verilerin kullanılması AI algoritmasının konuşma hızı, değerlik ve uyarılma üzerinde ‘önemli derecede kontrol sahibi olmasını sağladı. Araştırmacılar ayrıca yeni sistemin, ses verilerini analiz eden ve sentezleyen bir ses codec’i olan bir vocoder olarak hareket eden DeepMind’s WaveNet gibi ikinci bir modeli eğiterek spektrogram adı verilen frekansların görsel temsillerini üretebileceğini söyledi.

Gerçekten ilginç olan, yeni AI modelinin, konuşma duygularını kontrol etmek için farklı duygu kategorilerini temsil eden ‘stil belirteçleri’ kullanımını araştıran önceki bir çalışmanın kritik bir sınırlamasını ele aldığı görülüyor. Bu model, etiketli verilerin sadece yüzde 5’i ile iyi sonuçlar elde ederken, aynı duyguyu taşırken farklı tonlar, stres, tonlama ve ritimler kullanan konuşma örneklerini tatmin edici bir sonuç elde edemedi.

İLGİNİZİ ÇEKEBİLİR  Yapay Zeka,Tek Bir Kalp Atışından % 100 Doğruluk ile Kalp Yetmezliğini Algılıyor

Etiketli veri seti, her biri 40 İngilizce konuşmacıdan 5 saniyelik 72.405 kayıt olmak üzere toplam yaklaşık 45 saatlik ses içeriyordu. Konuşmacıların tümü, çeşitli değerlik düzeylerinde (üzüntü veya mutluluk gibi duygular) ve uyarılma (heyecan veya enerji) ile önceden yazılmış metinleri okuyan eğitimli ses aktörleridir. Araştırmacılar daha sonra bu kayıtları, daha sonra yapay zeka algoritmasının eğitilmesi için modellenen ve etiketlenen altı ‘duygusal durum’ elde etmek için kullandılar.

Araştırmacılar, yeni AI modelinin vicdansız tarafların yanlış bilgi yaymasını veya sahtekarlık yapmasını kolaylaştırabileceğini kabul etseler de, bu durumda faydaların olası risklerden çok daha ağır bastığını iddia ediyorlar çünkü çalışma sonunda insan-bilgisayar arayüzlerini önemli ölçüde iyileştirebilecek.

Yorum Yap