КРАЋЕ РЕЧИ ЧЕШЋЕ

Zašto je kontekst bitan kod dužine reči? Neuronaučnici iz Masačusetskog instituta za tehnologiju unapređuju osamdesetak godina staru jezičku teoriju harvardskog lingviste Džordža Kingzlija Zipfa. Šta su ustanovili?

Upitate li se ponekad od čega se sastoje reči? Šta reč čini rečju, kako se tvori, kakvo joj je poreklo ili zašto je dugačka ili kratka? Naučnici iz Odseku za neuro- i kognitivne nauke Masačusetskog instituta za tehnologiju (MIT) se pitaju. Stiven Pjantadozi, Hari Tajli i Edvard Gibson proučavaju reči ne bi li razumeli kako ljudi razmišljaju i komuniciraju.

Na probu su stavili dobro etabliranu, osamdesetak godina staru jezičku teoriju i otkrili da ima prostora za poboljšanja. U pitanju je tzv. Zipfov zakon, empirijsko naučno načelo koje kaže je dužina reči prevashodno određena učestalošću njene upotrebe.

Primera radi, bilo bi nepraktično
zamoliti nekoga za večerom za čašu vode
ako bi reč „voda” imala 15 glasova (slova).

Džordž Kingzli Zipf, lingvista s Univeziteta Harvard, ustvrdio je 1935. da „dužina reči, u celini, teži da stoji u obrnutom, mada ne obavezno proporcionalnom, odnosu s brojem pojavljivanja”. Drugim rečima, kraće se reči koriste više nego dugačke. „Naširoko poznato i očito univerzalno obeležje ljudskog jezika jeste da su frekventne reči obično kraće”, saopštavaju istraživači u svome izveštaju. Primećuju da se kraće reči koriste da bi komunikacija bila efikasnija nego što bi to bio slučaj s čestom upotrebom dužih reči.

Pomenuti Zipf pretpostavio je da je to usled pritiska koji nameće komunikativna učinkovitost. Primera radi, bilo bi nepraktično zamoliti nekoga za večerom za čašu vode ako bi reč „voda” imala 15 glasova (slova).

Predvidljivost važnija

U „Standardnom korpusu savremenog američkog enleskog” Univerziteta Braun, koji se sastoji od dva miliona reči teksta, reč of je četvrta po učestalosti upotrebe. Član the se u pisanju koristi više nego ijedna druga reč engleskog jezika. Naime, spisak od 100 najčešće korišćenih reči sadrži reči poput be, on, have, with, who i some, što su sve vrlo kratke reči.

Pretpostavka je bila da bi prosečna
informacija sadržana u nizovima od
dve, tri i četiri reči delimično
trebalo da odredi dužinu reči.

Ipak, kognitivni naučnici s MIT-ija predstavili su suštinsko poboljšanje Zipfovog zakona. Pokazali su, oslanjajuči se na deset jezika, da je predvidljivost onoga što kažemo važnija za dužinu reči nego to koliko je često izgovoramo. Cilj istraživanja bio je da se uporedi Zipfova teorija o učestalosti reči s teorijom o predvidljivosti reči Pjantadozija i saradnika – ideja da prosečna količina informacija koju reč u kontekstu prenosi – njena predvidljivost, određuje dužinu reči.

Koristeći bazu podataka na Internetu, istraživači su proučavali koliko se često svi mogući nizovi od dve, tri ili četiri kombinacije reči javljaju zajedno kako bi procenili koliko je neka reč predvidljiva kad je napisana na uobičajen način. Zahvaljujući ovom saznanju, mogli su utvrditi jesu li kontekst i predvidljivost bolji predodređivači (determinante) dužine reči od učestalosti upotrebe.

Na primer, u kontekstu tipa „Vesti u ” reč „podne” vrlo je predvidljiva i stoga prenosi veoma malo informacija. „Ali u kontekstu kao „Jeo sam ”, reč koja nedostaje veoma je nepredvidljiva, ali prenosi mnogo informacija”, objašnjava Pjantadozi. Pretpostavka je bila da bi prosečna informacija sadržana u nizovima od dve, tri i četiri reči delimično trebalo da odredi dužinu reči, bilo u slovima ili slogovima, budući da bi se optimalni kod tako ponašao.

U prethodnom primeru, „podne” i reči koje joj prethode pokazuju taj učinak. „Jedini način da ovi efekti mogu ući u leksikon jeste ako su naši jezički sistemi i mehanizmi jezičke promene osetljivi na komunikativne pritiske”, nastavlja Pjantadozi.

Nizovi reči koje ljudi koriste kôdirani su – njihova slova, slogovi, glasovi i tako dalje – za efikasnu komunikaciju i bolji su za predviđanje dužine reči nego sama frekvencija, ističe on. „To znači da nizovi reči obezbeđuju efikasne kôdove za značenja koja prenose, u odnosu na statističke pravilnosti u jeziku”, podseća Pjantadozi. „To je naša tvrdnja”.

Nemački izuzetak

Love, amour, Liebe, amor i kärlek označavaju isto u različitim jezicima, a približno su iste dužine, što se po Zipfu može očekivati ukoliko su slično predvidljive ili informativne. Ali istraživači s MIT-ija naglašavaju da zapravo reči koje prethode određenoj reči i slede je, a ne njena dužina, određuju koliko će se često ta reč koristiti.

Zašto su najčešće korišćene reči kratke?
Zato što teže da budu predvidljive.

Istina, reč kojom označavamo najjaču vrstu naklonosti jeste veoma kratka, ali koliko je često ljudi izgovaraju, u kojim okolnostima i koliko je predvidljiva prenesena informacija kada je izgovorimo? I love you vrlo se razlikuje od I love chicken. Za reči poput love kontekst je bitan.

Rezultati istraživanja vredeli su za sve proučavane jezike (češki, holandski, engleski, francuski, italijanski, portugalski, rumunski, španski i švedski), osim jednog – nemačkog. „Iznenadilo me je da smo pronašli efekte u toliko mnogo jezika”, naglašava Pjantadozi. „Mislio sam da bi razlike u morfologiji, ili strukturi reči, mogle zatomiti naše efekte u mnogim jezicima, ali izgleda da to nije slučaj.”

Zbog čega su reči koje se najčešće koriste kratke? Nalazi istraživanja pružaju i poboljšano objašnjenje zašto su najčešće korišćene reči kratke – zato što teže da budu predvidljive, što znači da mnoge kratke reči, u proseku, prenose relativno malo informacija. Od 100 najfrekventnijih, mnoge su „funkcionalne reči” (na primer, s(a), od, preko), čija je glavna svrha da povezuju reči. Same po sebi, ove reči čitatelju ili slušatelju daju veoma malu količinu podataka.

Istraživači su, takođe, pronašli da se kratke reči moraju naći u parovima s drugim poznatim rečima da bi obrazovale kontekst i prenele informaciju. To je zbog toga što su često reči koje se pojavljuju posle dobro poznatih nizova drugih reči, najprevidljivije i prenose najmanje informacija; na primer, „pune ruke posla” predstavlja dobro poznatu sekvencu reči i prenosi malo informacija. Ali reči koje imaju malo veze s rečima koje im prethode sadrže više informacija, na primer, „pune ruke blata”.

Istraživanje je otkrilo da ljudi opšte pomoću, bar, približno optimalnog kôda za značenje, zaključuje Pjantadozi. „Leksikoni nisu proizvoljni u smislu da su potpuno nasumični. Naprotiv, dobro su strukturirani za komunikaciju, s obzirom na obrasce nizova reči koje ljudi tipično koriste.”

Problem tradicionalnog metoda isključivog posmatranja učestalosti reči u tome je što obuhvata jedino brojanje reči u izolaciji ne razmatrajući redovnu zavisnost među rečima.

Stefan Vukašin

2 komentara

NEŠKO kaže:

26/02/2021 u 1:15 PM

Šta mislite o ovoj pojavi: U srpskom jeziku postoje, osim deminutiva i augmentativi. Nijedan jezik koji ja poznajem (Engleski, Nemački,Mađarski) oni ne postoje, barem ne u obliku da reč koja označava augmentativ vuče koren kao što je slučaj sa ima srpskim: Kuća – kućica – kućerina, ili, cipela – cipelica – cipeletina; da ne nabrajam dalje… Da li možete objasniti taj fenomen? Da li je reč o bogatstvu našeg jezika, ili je u pitanju nešto drugo?

Odgovor
NEŠKO kaže:

26/02/2021 u 1:23 PM

Šta mislite o ovoj pojavi: U srpskom jeziku postoje, osim deminutiva i augmentativi. Nijedan jezik koji ja poznajem (Engleski, Nemački,Mađarski) oni ne postoje, barem ne u obliku da reč koja označava augmentativ vuče koren kao što je to slučaj sa srpskim: Kuća – kućica – kućerina, ili, cipela – cipelica – cipeletina; da ne nabrajam dalje… Da li možete objasniti taj fenomen? Da li je reč o bogatstvu našeg jezika, ili je u pitanju nešto drugo?

Odgovor