6 september 2017

Spraakherkenner presteert beter dan mens

Het spraakherkenningsalgoritme van Microsoft, dat het softwarebedrijf onder andere gebruikt in digitale assistent Cortana, heeft een nieuwe ontwikkelslag doorgemaakt. Microsoft heeft de algoritmes met 12 procent weten te verbeteren ten opzichte van een eerdere versie. Het algoritme mist nu nog in 5,1 procent van de gevallen een woord. Daarmee presteert het algoritme even goed als een groep menselijke notulisten die nauwkeurig luisteren naar een opname van spraak. Microsoft kwam zo ver door twee delen van de technologie te verbeteren: het luisterdeel en het begripsdeel. Wat het luisteren betreft: de computer kan nu beter ‘horen’ en zal dus ook gemompel opvangen. Ook kan het woorden die veel op elkaar lijken beter onderscheiden. Het begripsdeel heeft een grote upgrade gekregen: het vocabulaire van de taalrobot ging van 30.000 naar 165.000 woorden. Daarnaast heeft Microsoft een systeem toegevoegd dat voorspelt welke woorden er volgen op bepaalde zinsdelen. Daardoor weet het algoritme in welke hoek het woorden moet zoeken. Dat maakt het algoritme sneller én nauwkeuriger.

De drie belangrijkste leveranciers van virtuele assistenten (Apple met Siri, Microsoft met Cortana en Google met Google Home) delen niet veel mee over hun vooruitgang. In 2015 zei Google dat het bedrijf op 8 procent fout herkende woorden zat. Begin 2017 gaf Google aan de prestaties met 30 procent te hebben verbeterd waardoor het herkenningsalgoritme op een foutenpercentage van 5,6 uitkwam. Bron: De Ingenieur