Mikä on puheentunnistus?

Äänen käyttäminen syöttötapana

Puheentunnistus on tekniikka, joka mahdollistaa puhetunteen syöttämisen järjestelmään. Puhu tietokoneellasi, puhelimellasi tai laitteellasi, ja se käyttää mitä olet sanonut syötteeksi jonkin toiminnan käynnistämiseksi. Tekniikkaa käytetään korvaamaan muita syöttötapoja kuten kirjoittaminen, napsauttaminen tai valinta muilla tavoilla. Se on keino tehdä laitteista ja ohjelmista käyttäjäystävällisempi ja lisätä tuottavuutta.

Käytössä on runsaasti sovelluksia ja alueita, joissa käytetään puheentunnistusta, mukaan luettuna sotilaallinen, apuna heikossa asemassa oleville henkilöille (kuvitella henkilö, jolla on väsyneet tai ei kädet tai sormet), lääketieteen alalla, robotiikassa jne. lähes kaikki altistuvat puheentunnistukselle, koska se on levinnyt yhteisten laitteiden, kuten tietokoneiden ja matkapuhelimien, välille.

Tietyt älypuhelimet tekevät mielenkiintoista puheentunnistusta. IPhone ja Android-laitteet ovat esimerkkejä siitä. Niiden kautta voit aloittaa puhelun yhteyshenkilölle vain saada puheohjeita, kuten "Puhelutoimisto". Myös muita komentoja voi viihdyttää, kuten "Bluetooth päälle kytkeminen".

Ongelmia puheentunnistuksella

Puheentunnistus, sen version, joka tunnetaan nimellä Speech to Text (STT), on myös käytetty pitkään käännetyn sanan kääntämiseksi tekstiksi. "Puhut, se tyypit", kuten ViaVoice sanoisi sen ruutuun. Mutta STT: llä on yksi ongelma, kun tiedämme sen. Yli 10 vuotta sitten, yritin ViaVoicesta, ja se ei kesti viikossa tietokoneellani. Miksi? Se oli melko epätarkka ja päädyin viemään enemmän aikaa ja energiaa puhumaan ja korjaamaan kuin kirjoittamalla kaikkea. ViaVoice on yksi alan parhaista, joten kuvittele loput. Tekniikka on kypsynyt ja parannettu, mutta puhetta tekstiin tekee yhä ihmisistä kysymyksiä. Yksi sen tärkeimmistä vaikeuksista on ihmisten voimakas vaihtelu sanoissa.

Kaikki kielet eivät ole puheentunnistuksessa, ja niitä, joita ei useinkaan tueta, ovat englanti. Tämän seurauksena useimmat puheentunnistusta käyttävät laitteet toimivat kohtuullisesti vain englannin kielellä.

Laitteistovaatimusten joukko vaikeuttaa puheentunnistusta tietyissä tapauksissa. Tarvitset mikrofonin, joka on niin älykäs, että se suodattaa taustamelun, mutta samalla riittävän voimakas kaapata ääni luonnollisesti.

Kun puhutaan taustameluista, se voi aiheuttaa koko järjestelmän epäonnistumisen. Tämän seurauksena puheentunnistus epäonnistuu monissa tapauksissa käyttäjän hallinnan ulkopuolisista ääniä.

Puheentunnistus on osoittautumassa paremmaksi kuin uusien puhelimien ja viestintätekniikoiden, kuten VoIPin, syöttötapa, kuin massatyökalun tuottavuustyökaluna.

Puheentunnistuksen sovellukset

Teknologia on yleistynyt monilla aloilla ja on onnistunut seuraavissa:

- Laitteen ohjaus. Vain sanoen "OK Google" Android-puhelimelle käynnistää järjestelmän, joka on kaikkien korvien äänikomentoja.

- Auton Bluetooth-järjestelmät. Monet autot on varustettu järjestelmällä, joka yhdistää radiomekanismin älypuhelimeen Bluetoothin kautta. Voit soittaa ja vastaanottaa puheluita koskematta älypuhelinta ja jopa soittaa numeroita vain sanomalla niitä.

- Äänikirjoitus. Alueilla, joilla ihmisten on kirjoitettava paljon, jotkut älykkäät ohjelmistot tallentavat puhuttuja sanojaan ja kirjoittavat ne tekstiksi. Tämä on nykyistä tietyissä tekstinkäsittelyohjelmissa. Voice transkriptio toimii myös visuaalisella ääniviestillä .