Web Audio API w chrome i rozpoznawanie mowy

Ostatnio w wersji developerskiej chrome canary udostępniono Web Audio API co daje nam dostęp do mikrofona na danym urządzeniu. Co nam to daje zapytacie, ogromne mozliwości jeśli powiążemy to z innnych serwisami jak np. google speech recognition.

Dzieki temu możemy np. sterować aplikacją za pomocą prostych komend np. Zapisz, Zamknij itd. w połączeniu z kinect daje to bardzo szybki sposób interakcji z aplikacją.  Innym pomysłem może być np. w ten sposób dodawanie newsów, artykułów, czy komentarzy, gdzie występuje głownie tekst.

Co więcej, można odpalać searcha, chyba google już ma podobną aplikacyjkę. Najbardziej chyba będzie to przydatne przy różnego rodzaju słownikach, czy translatorach.

Napenwo niedługo doczekamy się aplikacji na TV, gdzie będzie można w prosty sposób sterować pracą urządzenia, hmm. chyba już gdzieś widziałem reklamę, chyba Samsunga :). No nic ale to będzie w przeglądarce jako standard html5.

Oczywiście rozpoznawanie mowy ma swoje wady, nie jest w 100% dopracowane, obecne algorytmy przekręcają słowa, głównie zależy do od poprawnej mowy użytkownika.

http://www.smartjava.org/content/record-audio-using-webrtc-chrome-and-speech-recognition-websockets