"Microsoft" istənilən şəxsin səsini saxtalaşdırmaq üçün neyron şəbəkə yaradıb
Microsoft cəmi üç saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən VALL-E mətndən nitqə neyron şəbəkəsini yaratmışdır.
Qazet.az xəbər verir ki, bu barədə Gazeta.ru məlumat yayıb.
Qəbul edilmiş nümunə VALL-E ən kiçik fraqmentlərə bölünür və onları mövcud verilənlər bazası ilə müqayisə edir. Digər insanların səslərinin müxtəlif situasiyalarda necə səsləndiyini bilən neyroşəbəkə eyni situasiyalarda “donorun” necə səslənəcəyini “farz edir”.
Beləliklə, VALL-E təbii intonasiyalarla nümunə daşıyıcısının səsini çox real şəkildə təqlid edə bilir.
VALL-E-ni yaratarkən, EnCodec audio sıxılma texnologiyası və ümumi vaxtı təxminən 60 min saat Libri-light ilə 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilmişdir. Hər iki məhsul Meta korporasiyasına məxsusdur.
“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq.
Xüsusilə, VALL-E tamamilə orijinal məzmun yaratmaq üçün GPT-3 mətn generatoru ilə birlikdə istifadə edilə bilər.