Recomandări cheie
- Noile tehnologii ar putea duce la computere care înțeleg mai bine vorbirea umană.
- Microsoft și NVIDIA au anunțat recent o nouă metodă bazată pe inteligență artificială pentru interpretarea limbajului.
- Calcul cuantic ar putea fi o altă modalitate de a avansa în domeniul procesării limbajului.
Există o mulțime de gadgeturi inteligente pentru a da comenzi în zilele noastre, dar suntem încă departe de computerele care înțeleg vorbirea conversațională.
Microsoft și NVIDIA au anunțat recent o nouă metodă bazată pe inteligență artificială pentru a interpreta vorbirea, care ar putea transforma modul în care conversam cu electronicele noastre. Face parte dintr-o mișcare în creștere care schimbă modul în care computerele înțeleg vorbirea, numită și Procesarea limbajului natural (NLP).
„Modelele care alimentează NLP devin din ce în ce mai mari și mai avansate și se apropie tot mai mult de înțelegerea umană”, a declarat expertul în inteligență artificială Hamish Ogilvy pentru Lifewire într-un interviu prin e-mail.
"Unul dintre marile progrese este că NLP merge dincolo de simplele cuvinte cheie. S-ar putea să fii obișnuit astăzi să tastezi sau să rostești unul sau două cuvinte cheie pentru a obține rezultate de căutare, dar modelele mai noi de procesare a limbajului natural folosesc contextul pentru a oferi rezultate mai bogate.."
Chat Bots
NVIDIA și Microsoft s-au unit pentru a crea modelul Megatron-Turing Natural Language Generation (MTNLG), despre care duo-ul susține că este „cel mai puternic model de limbaj de transformator monolitic antrenat până în prezent”. Modelul AI rulează pe supercomputere.
Dar cercetătorii au descoperit că modelul MTNLG a detectat prejudecățile umane pe măsură ce trecea prin munți de mostre de vorbire umană.
„În timp ce modelele de limbaj gigantice avansează stadiul tehnicii în ceea ce privește generarea limbajului, ele suferă și de probleme precum părtinirea și toxicitatea”, au scris cercetătorii într-o postare pe blog. „Observațiile noastre cu MT-NLG sunt că modelul preia stereotipuri și părtiniri din datele pe care este antrenat.”
Computerele care înțeleg mai bine vorbirea nu vor îmbunătăți doar difuzoarele inteligente precum Alexa, susține Ogilvy. Site-urile web de căutare bazate pe text, cum ar fi Amazon, vor înțelege mai bine interogările care sunt introduse.
„Google a avut liderul evident aici, dar tehnologia NLP va fi peste tot”, a spus Ogilvy. „Pentru căutările bazate pe text și voce, utilizatorii pot fi mai descriptivi, deoarece NLP înțelege mai mult decât textul; înțelege contextul a ceea ce cauți pentru a returna rezultate mai bune.„
Chaturi cuantice?
Calcul cuantic ar putea fi o modalitate de a avansa în domeniul NLP. Miercuri, compania Cambridge Quantum a anunțat lambeq, despre care susține că este primul set de instrumente cuantice pentru NLP.
…NLP înțelege mai mult decât textul; înțelege contextul a ceea ce cauți pentru a obține rezultate mai bune.
Compania spune că instrumentul permite traducerea propozițiilor în limbi naturale folosind circuite cuantice rulate pe computere cuantice. Calculul cuantic este un tip de calcul care utilizează proprietățile neobișnuite ale stărilor cuantice, cum ar fi suprapunerea, interferența și încurcarea, pentru a efectua calcule.
„Modul în care computerele cuantice gestionează NLP este foarte diferit de mașinile clasice. De fapt, NLP este „nativ cuantic”,” a declarat Bob Coecke, om de știință la Cambridge Quantum, pentru Lifewire într-un interviu prin e-mail. „Acest lucru se datorează unei descoperiri pe care am făcut-o acum câțiva ani, că gramatica care guvernează propozițiile și sensul are o structură foarte asemănătoare cu matematica folosită pentru programarea calculatoarelor cuantice.„
Coecke a spus că NLP cuantic ar putea duce la asistenți vocali și instrumente de traducere mai bune.
O altă abordare promițătoare pentru îmbunătățirea recunoașterii vorbirii, numită Zac Liu, un cercetător de date la compania Hypergiant, a declarat pentru Lifewire într-un interviu prin e-mail. „Pe scurt, atunci când cercetătorii de date îmbunătățesc datele NLP, aproape că garantează că vor avea un model NLP mai bun și o capacitate NLP mai bună.”
Următorul pas este integrarea modelelor de viziune computerizată cu NLP, cum ar fi antrenarea unui model AI pentru a viziona videoclipuri și a produce un rezumat text al acelui videoclip, a spus Liu.
„Aplicarea acestui progres ar putea fi nelimitată, de la îngrijirea sănătății, citirea filmelor radiologice și furnizarea de diagnosticare preliminară, până la proiectarea de case, haine, bijuterii sau articole similare”, a adăugat el. „Clientul ar putea explica cerințele verbal sau în scris, iar această descriere poate fi convertită automat în imagini sau videoclipuri pentru o mai bună vizualizare.„