Alcuni servizi di Amazon integrano già il nuovo stile vocale Newcaster, che permette al computer di parlare in maniera fluida. Sfrutta reti neurali, apprende in fretta e produce un segnale audio continuo. È indicato per i podcast e per leggere i sommari delle notizie.
Amazon affina la capacità dei computer di parlare in maniera più fluida e naturale, avvicinandosi a quella di un essere umano. Google e Microsoft si stanno occupando da tempo di questo aspetto, e tutti rientrano nel settore della sintesi vocale, o text-to-speech. La visione di Amazon è sintetizzata nel nuovo stile vocale, battezzato Newcaster.
È disponibile tramite il servizio cloud Polly, un prodotto professionale che trasforma il testo in un discorso realistico, consentendo ai clienti di creare applicazioni “che parlano” e di costruire categorie completamente nuove di prodotti abilitati al parlato. Julien Simon di Amazon spiega sul blog ufficiale che si tratta di un sostanziale miglioramento che consente ai servizi di podcast o agli assistenti vocali per l’accessibilità di offrire un servizio migliore e convincente.
Da un punto di vista tecnologico, questa soluzione fa uso di una rete neurale che richiede poche ore di addestramento, invece dei tempi lunghissimi delle tecnologie precedenti. Si compone di due elementi: il primo è una rete neurale di tipo generativo, che converte i fonemi (le unità di suono percettivamente distinte che aiutano a distinguere una parola dall’altra) in una sequenza di spettrogrammi, o di rappresentazioni visive dello spettro delle frequenze del suono. Il secondo elemento invece è un vocoder, che converte gli spettrogrammi prodotti al passaggio precedente in un segnale audio continuo.
Il servizio è usato da gennaio anche sui dispositivi che supportano Amazon Alexa per alcune funzioni specifiche, come la lettura delle sintesi di Wikipedia, e stando alle note ufficiali sta incontrando grande successo. Fra i clienti che l’hanno adottato sono già in elenco The Globe and Mail, Encyclopedia Britannica e molti altri, tra cui in Italia TIM Media.