Cât de fluentă rămâne rapidă, precisă și privată recunoașterea vocală

Cuprins:

Cât de fluentă rămâne rapidă, precisă și privată recunoașterea vocală
Cât de fluentă rămâne rapidă, precisă și privată recunoașterea vocală
Anonim

Recomandări cheie

  • Fluent este un motor de recunoaștere a vocii super-rapid, care respectă confidențialitatea, care nu are nevoie de conexiune la internet.
  • Poate fi încorporat în aproape orice dispozitiv.
  • Funcționează în orice limbă.
Image
Image

Fluent.ai este un motor virtual de recunoaștere a vocii care nu trimite comenzile dvs. pe internet, acționează aproape instantaneu, poate funcționa în orice limbă și este atât de mic încât poate fi încorporat chiar și în format ieftin, mic. -dispozitive cu putere, cum ar fi un ceas de fitness, de exemplu.

Spre deosebire de Siri și Alexa, Fluent este un asistent autonom care te înțelege instantaneu și învață de la tine, astfel încât să devină mai bun cu cât îl folosești mai mult. Nu are profunzimea asistenților virtuali obișnuiți, dar nu este menit să aibă. În schimb, este mai rapid, mai precis și mai privat decât eforturile Apple, Amazon și Google.

„Speech to text folosește procesarea limbajului natural și apoi derivă intenția”, a declarat CEO-ul Fluent Probal Lala pentru Lifewire în timpul unui interviu Zoom. „Necesită multe date și multă putere de procesare. Fluent trece direct de la vorbire la intenție, luându-ți vocea și transformând-o direct într-o acțiune.”

Linia de bază

Fluent este un software de control vocal. Funcționează ascultând comanda dvs. și eliminând toate cuvintele de care nu are nevoie, lăsând doar substantive și verbe esențiale. „Stinge luminile”, devine doar stins și lumini. Elementele esențiale sunt desprinse dintr-o propoziție umană dezordonată și transformate în trepte. Este aproape ca și cum ai programa un computer, transformând o idee complexă în cel mai simplu set de instrucțiuni.

La ce poate fi folosit?

Fluent poate fi folosit pentru orice. Cheia este că este antrenat pentru o situație specifică. Cu un ceas inteligent, de exemplu, acesta poate fi antrenat în comenzi pentru fitness sau pentru automatizarea casei, crearea de calendare și cronometru și așa mai departe. Limitarea bazei de date face totul mai concentrat și menține rapiditatea.

„Adevărul este că, în ceea ce privește purtabilele, nu vrei să ai o conversație”, a spus Lala, „Vreau să înceapă poate rutina mea de exerciții preferată și o vreau foarte repede.”

Viteza și precizia sunt esențialul. Aprinderea și stingerea luminilor durează milisecunde, în loc să așteptați ca Siri să vă trimită vocea în cloud, așteptați ca aceasta să fie procesată, apoi, câteva secunde mai târziu, luminile se sting.

Acest antrenament restrâns menține, de asemenea, dimensiunea aplicației. Anul trecut, Google a oferit o versiune descărcabilă, offline, a asistentului său. Era, spune Lala, 85 de megaocteți, funcționa doar în engleză și a fost nevoie de șase luni pentru a-l antrena.

„Avem un model care funcționează cu 13.000 de comenzi și funcționează în 500 de kiloocteți”, a spus el.

Linia de bază

Celăl alt avantaj al unui motor de recunoaștere a vocii offline este confidențialitatea. În ceasul inteligent al unui copil, de exemplu, „nu vrei ca vocea unui copil să ajungă în nor”, spune Lala. De fapt, Fluent poate funcționa în interiorul dispozitivelor care nu se conectează niciodată la internet. Acest lucru este bun nu numai pentru confidențialitate, ci și pentru securitate. Puteți folosi un motor offline de recunoaștere a vocii în laboratoarele de cercetare, instalațiile militare și alte locuri care interzic telefoanele mobile și camerele.

Limite

Desigur, acest model are câteva dezavantaje. Una este că comenzile nu pot fi adăugate mai târziu. Odată ce pregătirea inițială este completă, asta este tot. Nici asistentul dvs. bazat pe Fluent nu poate căuta lucruri pe internet pentru scorurile dvs. sportive, actorul pe care îl recunoașteți în acel film, dar pur și simplu nu îl puteți plasa și așa mai departe.

Image
Image

În schimb, sistemul este suficient de inteligent pentru a recunoaște când nu poate ajuta și va transmite cererea către ceva care poate. Dacă vă întrebați ceasul pentru prognoza meteo, Fluent își va da seama că nu înțelege. „Apoi va apela un serviciu care este preprogramat în ceas, fie că este vorba de Alexa de la Amazon sau Google, și apoi va efectua un apel către cloud”, transmiteți comanda vocală brută pentru a obține răspunsul.

Această abordare hibridă păstrează viteza unui asistent local, offline, cu puterea Alexa sau a Asistentului Google ca rezervă.

Puteți cumpăra orice dispozitiv fluent?

Nu încă. Compania își acordă licențe tehnologice și face instruire pentru alte companii. Datorită COVID, două lansări majore au fost amânate pentru anul viitor. Dar vă puteți aștepta să îl vedeți apărând în ceasuri și alte dispozitive de fitness, difuzoare, hub-uri de automatizare a locuinței și așa mai departe.

Ar fi grozav dacă acest lucru ar fi încorporat direct în smartphone-uri precum iPhone, făcând sarcinile de zi cu zi mai rapide și recurgând la Siri numai atunci când este necesar. Aceasta ar fi adevărata aplicație ucigașă.

Actualizare: 22 octombrie, ora 10:12. S-au făcut modificări pentru a se referi la Fluent ca un motor de recunoaștere a vocii și nu ca asistent vocal.

Recomandat: