Prelucrarea limbajului natural

De la Wikipedia, enciclopedia liberă

Prelucrarea limbajului natural, sau lingvistica computațională este un sector interdisciplinar, component al inteligenței artificiale, ce întrebuințează calculatorul la cercetarea limbajelor umane scrise și vorbite. O realizare deosebită în acest sector este ChatGPT.

Modele bazate pe teoria grafurilor sunt utilizate în acest sector de lingvistică computațională[1].

Aplicații[modificare | modificare sursă]

Abordări[modificare | modificare sursă]

Abordările de învățare automată, care includ atât rețele statistice, cât și rețele neuronale, au multe avantaje față de abordarea simbolică[2][3][4]:

  • Atât metodele statistice, cât și cele bazate pe rețele neuronale se pot concentra mai mult pe cazurile cele mai comune extrase dintr-un corpus de texte, în timp ce o abordare bazată pe reguli ar trebui să ofere reguli atât pentru cazurile rare, cât și pentru cele comune.
  • Modelele lingvistice create prin metode statistice sau prin rețele neuronale sunt mai rezistente atât la intrările necunoscute, cât și la cele eronate, în comparație cu sistemele bazate pe reguli, care sunt, de asemenea, mai costisitoare de creat. Cu cât un astfel de model lingvistic (probabilistic) este mai mare, cu atât devine mai precis, spre deosebire de sistemele bazate pe reguli, care nu pot obține precizie decât prin creșterea numărului și complexității regulilor, ceea ce duce la probleme greu de rezolvat.

Tendințe generale și (posibile) direcții viitoare[modificare | modificare sursă]

Legăturile cu lingvistica cognitivă fac parte din moștenirea istorică a NLP, dar au fost abordate mai puțin frecvent de la începutul anilor '90, când a avut loc un viraj statistic[5][6]. Cu toate acestea, abordările de dezvoltare a modelelor cognitive pentru a crea cadre operaționalizabile din punct de vedere tehnic au fost aplicate în contextul diferitelor cadre, cum ar fi gramatica cognitivă[7], gramatica funcțională[8], gramatica construcției, psiholingvistica computațională și neuroștiința cognitivă (de ex, ACT-R). În mod similar, ideile PNL-ului cognitiv sunt inerente în modelele neuronale ale PNL-ului multimodal (deși rareori sunt explicite)[9] și în dezvoltările din domeniul inteligenței artificiale, în special în ceea ce privește instrumentele și tehnologiile care utilizează abordări bazate pe modele mari de limbaj[10][11]. Ele sunt, de asemenea, inerente noilor direcții în inteligența generală artificială, bazate pe principiul energiei libere[12] al neuroștiutorului și teoreticianului britanic Carl J. Friston de la University College London.

Note[modificare | modificare sursă]

  1. ^ Textgraphs, www.textgraphs.org 
  2. ^ „A scoping methodological review of simulation studies comparing statistical and machine learning approaches to risk prediction for time-to-event data”. diagnprognres.biomedcentral.com. Accesat în . 
  3. ^ „Symbolic vs Connectionist Machine Learning”. vaclavkosar.com. Accesat în . 
  4. ^ „The Complete Beginner's Guide To Machine Learning”. www.akkio.com. Accesat în . 
  5. ^ „The Evolution Of Natural Language Processing And Its Impact On AI”. www.forbes.com. Accesat în . 
  6. ^ „The Evolution of NLP: Past, Present, and Future”. www.peppercontent.io. Accesat în . 
  7. ^ „US patent 9269353”. worldwide.espacenet.com. Accesat în . 
  8. ^ „Universal Conceptual Cognitive Annotation (UCCA)”. universalconceptualcognitiveannotation.github.io. Accesat în . 
  9. ^ „Introduction to Chunks and Rules”. www.w3.org. Accesat în . 
  10. ^ „Grounded Compositional Semantics for Finding and Describing Images with Sentences”. direct.mit.edu. Accesat în . 
  11. ^ „Understanding the Anatomies of LLM Prompts: How To Structure Your Prompts To Get Better LLM Responses”. www.codesmith.io. Accesat în . 
  12. ^ „Language models show human-like content effects on reasoning tasks”. arxiv.org. Accesat în . 

Vezi și[modificare | modificare sursă]