Posted by: danlupu | October 29, 2008

Românul şi algoritmul ce miroase plagiatul

Matematicianul Conferenţiar al Universităţii din Bucureşti,

Algoritmul distanţei rank, ce poate fi aplicat în domeniul lingvisticii, biologiei sau informaticii, a dat rezultate spectaculoase

Profesorul de 38 de ani a demonstrat, prin analiza silabelor, că portugheza este cea mai apropiată limbă străină, pentru români

Liviu P. Dinu, conferenţiar al Facultăţii de Matematică şi Informatică din Bucureşti, a descoperit o formulă ce ar putea revoluţiona modul în care sunt comparate diferite limbi, texte sau chiar lanţuri ADN. Cu ajutorul algoritmului distanţei rank, Liviu P. Dinu a ajuns la concluzia că, deşi limbile derivate din latină sunt foarte apropiate de limba română, paradoxal, limba noastră este, în acelaşi timp, şi cea mai depărtată de acestea. Cu alte cuvinte, profesorul, în vârstă de 38 de ani, a demonstrat ştiinţific că pentru români este foarte uşor să înveţe italiana sau spaniola, iar pentru italieni sau spanioli, româna înseamnă multă bătaie de cap. „Am comparat primele 500 de silabe, cele mai folosite de cei care vorbesc româna, franceza, spaniola, portugheza, italiana, catalana şi latina. Întâi, am comparat româna cu celelalte 6 limbi romanice şi, după primele 200 de silabe, cea mai apropiată limbă părea a fi italiana, ce se diferenţia net de celelalte limbi.

Apoi, până la finalul clasamentului, italiana pierde teren, mai ales în favoarea portughezei, ce pare să fie, până la urmă, cea mai apropiată de română. Asta înseamnă că un român prinde foarte repede lexicul de bază al italienei, dar cu cât aprofundează mai mult limba italiană, cu atât îi va fi mai greu. În schimb, dacă învaţă portugheza, îi va fi ceva mai greu la început dar, ulterior, nu va mai avea dificultăţi serioase.“ Partea spectaculoasă a descoperirii lui Dinu este, însă, demonstrarea faptului că, în timp ce limbile romanice sunt foarte asemănătoare limbii române, aceasta din urmă este cea mai depărtată de limbile neolatine: „Dacă fac aceeaşi comparaţie, dar de data aceasta din perspectiva limbii italiene, concluzia e că româna e cea mai îndepărtată limbă de italiană şi rămâne cea mai îndepărtată şi faţă de spaniolă, portugheză şi restul limbilor romanice. Aşa se explică de ce românii învaţă uşor, spre exemplu, limba spaniolă, dar spaniolii învaţă, cu greu, româna“.

Algoritmul ce depistează plagiatul

Datorită faptului că algoritmul distanţei rank contorizează diferenţele de poziţie ale literelor din două cuvinte, algoritmul distanţei rank poate fi aplicat cu succes şi în compararea a două lucrări scrise, pentru a identifica autorul unui text cu paternitate controversată. Astfel, respectiva teorie poate verifica dacă un text este sau nu plagiat. „Împreună cu colegul meu, Marius Popescu, am experimentat pe sute de texte scrise în limba engleză şi am avut cele mai bune rezultate raportate din lume. După cât se pare, fiecare autor are o amprentă literară unică, dată de modul în care îşi gestionează cuvintele de legătură. Aplic formula, după ce văd cum apar cuvintele funcţionale şi ce clasament are fiecare scriitor, iar textele se grupează automat pe autori“, ne-a explicat profesorul Dinu, care a verificat, printre altele, dacă cele peste 100 de lucrări cu paternitate controversată, atribuite lui Eminescu, au fost sau nu scrise de către poet.

Un rezultat spectaculos a venit însă atunci când matematicianul a comparat  “Sub pecetea tainei”, nuvela rămasă neterminată a lui Mateiu Caragiale şi “În deal pe militari” nuvela scrisă de Radu Albala: “Dacă o citeşti cap-coadă nu ai nici un moment senzaţia că ar fi scrise de doi autori diferiţi. Intriga e legată, iar stilul e acelaşi. Albala a făcut  pariul vieţii sale: că va continua nuvela lui Mateiu fără ca cineva să-şi dea seama. A recunoscut până la urmă că el scrisese continuarea dar aplicând formula am dovedit ştiinţific că aşa s-a întâmplat. În prima jumătate a nuvelei s-a apropiat.

Dacă eşti suficient de abil şi de inteligent, poţi să imiţi foarte bine pe cineva, în schimb nu ai cum să controlezi cuvintele de legătură şi semnele de punctuaţie şi mai ales prepoziţiile şi adverbele. Fiecare dintre noi avem un anumit stil care mai devreme sau mai târziu te dă de gol. Poţi să păcăleşti o vreme dar nu poţi imita întru totul. Dacă renunţam la semnele de punctuaţie, puteam spune la fel de bine că textul îi aparţine lui Mateiu. Ei bine, virgulele l-au trădat pe Albala.

În copilărie, spunea că vrea să devină tractorist

Născut în comuna Cârlogani, judeţul Olt, Liviu Dinu a fost de mic atras de matematică, deşi spune el, înainte de a merge la şcoală îşi dorea să ajungă “tractorist  şi ginere”: “Nu  ştiu de ce spuneam asta, nu mi-a plăcut niciodată munca la câmp. Părinţii mei se amuzau teribil când răspundeam că vreau să mă fac ginere. La şcoală, rezolvam foarte multe exerciţii şi mi s-a părut normal să dau la facultate la Bucureşti. Apoi, fiind un mare amator de romane scrise de Umberto Eco, am ajuns şi la partea de studiu al cuvintelor. În “Insula din ziua de ieri”, personajul principal face un mecanism din roţi dinţate şi fiecare vârf avea un cuvânt, astfel încât, dacă trăgeai de manetă, rezultau metafore. Mi-am zis: ce-ar fi dacă înlocuiesc cuvintele cu silabe, şi am pornit în cercetarea elementelor primare folosind mijloacele matematice”. Cât priveşte ideea de a compara limbile, aceasta i-a venit lui Dinu în urmă cu 7 ani, pe când era la un stagiu la Helsinki.

“Chiulisem şi mă plimbam cu un coleg într-un fel de muzeu al satului. Şi, deodată, un neamţ care era în spatele nostru ne-a oprit şi ne-a întrebat ce limbă vorbiţi, că eu cunosc italiana şi franceza, dar din limba dumneavoastră nu înţeleg nimic. Şi pentru mine a fost un declic: nu a înţeles, dar şi-a dat seama că vorbeam o limbă latină, deci ceva l-a făcut să creadă asta. M-a tot urmărit problema asta până mi-am dat seama că nu avea ce să fi cuantificat altceva în afară de silabe. De aici a început căutarea şi idea de a compara limbile din perspectiva silabelor”. Pentru cele patru articole ce au fost scrise în anul 2005, dintre care trei sunt cotate ISI, reunite sub numele de „Rank Distance in Computational Linguistics”, Liviu P. Dinu a fost premiat, anul trecut, de Academia Română cu distincţia „Grigore Moisil“.

La şcoală, rezolvam foarte multe exerciţii şi mi s-a părut normal să dau la facultate la Bucureşti. Apoi, fiind un mare amator de romane scrise de Umberto Eco, am ajuns şi la partea de studiu al cuvintelor.  –  Liviu P. Dinu , matematician

 ( Gandul http://www.gandul.info/viata/romanul-si-algoritmul-ce-miroase-plagiatul.html?3931;3377732)


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

Categories

%d bloggers like this: