Il machine listening – conosciuto anche come computer audition – consiste nell’elaborazione dei suoni attraverso un computer.
Il sistema è in grado di ‘comprendere’ un suono trasformando le relative onde sonore in audio (rappresentazione elettronica del suono) e, quindi, in spettrogrammi, ossia rappresentazioni visive delle frequenze nel tempo. Per l’analisi degli spettrogrammi, la macchina si avvale della computer vision, la stessa funzionalità utilizzata per la classificazione delle immagini.