Thesis: Miglioramento di interfacce vocale tramite l’utilizzo di tecniche di machine learning

Le voice user interface (VUI) stanno avendo una rapida crescita di utilizzo. Gli assistenti vocali presenti su smartphone, smart speaker e display in car. Nei prossimi anni è previsto un uso pervasivo di interfacce vocali in ambito domotico (smart speaker e smart TV), nell’infotainment automotive e su dispositivi mobili.
In tale contesto si propone una tesi per la realizzazione di un’interfaccia vocale che possa permettere ad un utente che vuole ascoltare specifici contenuti audio richiedendoli con una frase che deve essere analizzata e ricondotta al contenuto preciso richiesto.
Rispetto alle interfacce grafiche dove un comando viene attivato tramite click o touch, nelle interfacce vocali non è così diretta l’associazione tra comando e risposta: l’utente deve sapere cosa chiedere e come chiederlo con dei “suggerimenti” molto limitati rispetto ad un’interfaccia visuale.

Lo scopo della Tesi è quindi volto a:

  • Introdurre un layer software intelligente in grado di interpretare correttamente i comandi vocali dell’utente forniti tramite interfacce Alexa o Google Assistant
  • Creazione di un dataset delle interazioni tra utente e interfaccia vocale per richiedere contenuti di ascolto, registrando il percorso e i contenuti delle richieste che servono per raggiungere (o non raggiungere) il contenuto richiesto.
  • Creazione di una rete neurale basata su alcuni di questi dati. Nel caso specifico l’algoritmo di machine learning dovrà permettere all’utente di accedere ad un contenuto presente in un repository con molti titoli (come ad esempio titolo e puntata di una serie specifica di podcast) senza un matching esatto della stringa.

Lo svolgimento dell’attività sarà presso Radiosa srl ( www.radiosa.biz ), azienda che opera nel settore media con soluzioni. Se interessato, puoi inviare il tuo CV e manifestazione di interesse a: antonio.servetti@polito.it.

Tags: multimedia, voice interface, neural network, machine learning

Thesis type: applied research, software development