Foto: Sorashi Mazaki / pexels.com
Foto: Sorashi Mazaki / pexels.com
Мэри Мелконян |

Kako znati da li će knjiga postati bestseler? Nova veštačka neuronska mreža može pružiti pomoć

Naučnici o programu koji razume kako tekstovi kontrolišu naše emocije

Naučnici sa Univerziteta u Arhusu (Danska) Mads Tomsen i Kristofer Nilbo razvijaju Fabula-NET neuronsku mrežu koja može da proceni budući uspeh književnih dela. Ispričali su nam zašto je toliko važno da umemo da upravljamo emocijama čitalaca, kako njihov program funkcioniše i kome je potreban.

O čemu se radi u ovom projektu

Projekat Fabula-Net je počeo tek nedavno, u januaru 2021. To je neuronska mreža za automatsko ocenjivanje literature. Kompjuterski algoritam uči da prepoznaje formate uspešnih tekstova i na osnovu njih predviđa mogući uspeh neobjavljenog teksta.

Ovaj algoritam se može koristiti u komercijalne i lične svrhe. Na primer, urednik može da pronađe način da poveća pozitivnu stopu recenzije, veća je mogućnost da će ljudi zaista kupiti knjigu ako su ocene visoke. Ova veza svakako nije direktna, ali ipak može da funkcioniše. Takođe možete koristiti ovaj sistem da procenite svoje pisanje. Kompjuter će vam reci koliko je vaš narativ konzistentan ili predvidljiv i koliko je vaš tekst po strukturi blizak, na primer, onom Džejn Ostin, ako želite da pišete kao ona.

Slična istraživanja su već́ sprovedena: obično naučnici gledaju na rečnik teksta, na njegove stilske karakteristike. Ovi podaci se zatim upoređuju sa recenzijama čitalaca ili, u najboljem slučaju, sa podacima o prodaji. Istina, ove poslednje je teško dobiti, pa se umesto njih koristi statistika biblioteka. U ovoj statistici rezultati nisu mnogo iznenađujući, bestseleri kao što su ”Hari Poter” ili “Pedeset nijansi sive” uvek imaju status uspešnih. Ali ako ste dublje zainteresovani za književnost, onda verovatno često pomislite: „Pa, znate, mora biti još nešto, jer je očigledno da ono što se smatra klasikom nije nužno i bestseler“.

Na Fabula-NET projektu rade dve osobe: profesor komparativnih studija na Univerzitetu Arhus (Danska) Mads Tomsen i direktor Centra za istraživanje digitalnih humanističkih nauka na istom univerzitetu Kristofer Nilbo. Fotografije iz lične arhive
Na Fabula-NET projektu rade dve osobe: profesor komparativnih studija na Univerzitetu Arhus (Danska) Mads Tomsen i direktor Centra za istraživanje digitalnih humanističkih nauka na istom univerzitetu Kristofer Nilbo. Fotografije iz lične arhive

Znakovi dobrog teksta

U izradi algoritma koriste se podaci o tiražu knjiga, polu i starosti čitalaca, recenzije i ocene. Ipak, najvažnija je analiza samog teksta. Upravo u tome i jeste novina studije: sagledavanje sadržaja knjige iz ugla čitaoca. Ali kako to učiniti? Koji faktori teksta utiču na percepciju knjige?

Ovde je najvažnija dinamika razvoja fabule i stoga program izračunava sledeće kriterijume: emocionalni tonalitet luka priče (luk priče; u književnoj kritici tok razvoja cele priče naziva se lukom), dinamiku razvoja emocija u tekstu (dynamic evolution of sentiment), kao i nivo koherentnosti narativa (narrative coherence).

U smislu emotivnog tonaliteta, na primer, u tragediji, luk priče će imati negativan trend, dok će u komediji imati pozitivan trend. Ako je delo predstavljeno u obliku grafikona, u slučaju tragedije, on će pasti ispod neutralnog tonaliteta, a u slučaju komedije će težiti na gore. Proučavajući opšti grafikon zapleta, može se pratiti i detaljnija dinamika razvoja emocija u tekstu: kako se smenjuju napete i mirne scene, koliko često i koliko tačno pozitivan trend ustupa mesto negativnom, u kojim se delovima teksta pojavljuje novo emocionalno stanje. Način na koji su te „emocionalne ljuljačke” raspoređene u delu takođe govori o tome koliko su različiti delovi teksta usklađenim a to, s druge strane, nesvesno formira određeno raspoloženje kod čitaoca, motiviše ga (ili ne) da čita tekst dalje.

Postoji još jedan faktor koji je relevantan za nivo usklađenosti. Priča u kojoj se radnje i likovi ponavljaju iz scene u scenu je previše predvidljiva i, shodno tome, dosadna za čitaoca. S druge strane, veoma komplikovan tekst, u kojem je teško pratiti razvoj zapleta, može se nazvati neusklađenim ili nedoslednim, zbog čega čitalac delo čak može da percipira kao zbirku različitih, nepovezanih priče. U prvom slučaju biće vam nezanimljivo, jer ste se već mnogo puta susreli sa istim obrascem; u drugom slučaju, tekst će vam biti potpuno nejasan, i izgubićete motivaciju da čitate dalje. Dakle, govorimo o čitanju literature donekle sa stanovišta psihologije.

Smatramo da postoji optimalan pokazatelj usklađenosti, po kojem se delo neće smatrati ni previše predvidljivim ni previše komplikovanim, a ovaj pokazatelj zavisi od toga kako su emocionalno nabijene scene u tekstu raspoređene i kako se razvijaju, kakva je njihova struktura. Delo sa optimalnim nivoom usklađenosti ćete verovatno pročitati do kraja.

Kako to izračunati na računaru

U lingvistici postoji analiza sentimenta, u kojoj kompjuter identifikuje emocionalni naboj teksta. Na primer uzmemo neko delo i tražimo emocionalno nabijene reči koristeći unapred sastavljene emocionalno-ekspresivne rečnike. U takvim rečnicima svaka reč ima svoje emocionalno-ekspresivno značenje, što je reč negativnija, to je niži tonalitet. Na primer, reč „tragedija” u jednom od rečnika ima tonalitet -3,4, a reč „oduševljen” ima tonalitet 2.

Prevod: Reč Tragedija Obradovan Lud Katastrofa Fantastičan / Nekoliko primera iz emotivnog rečnika, gde svaka reč ima svoje značenje emocionalnog tona. Izvor: David Oti / Medium
Prevod: Reč Tragedija Obradovan Lud Katastrofa Fantastičan / Nekoliko primera iz emotivnog rečnika, gde svaka reč ima svoje značenje emocionalnog tona. Izvor: David Oti / Medium

Kada kombinujemo sve dobijene indikatore, dobijamo krivu koja pokazuje kako se emocionalni tonalitet menja tokom teksta. Ovo će biti vizuelno prikazani luk određenog dela. Na primer, ovako luk izgleda u romanu Kazua Išigura „Ne puštaj me”. Na grafikonu vrednosti od –1 do 1 su tonaliteti, a od 0 do 5.000 su segmenti na koje je tekst podeljen. Obe krive pokazuju istu stvar, samo je kod crvene krive tekst je podeljen na više manjih delova.

Grafikon pokazuje kako se emocionalni usponi i padovi dešavaju u romanu Kazua Išigura „Ne puštaj me”. Izvor: researchgate.net
Grafikon pokazuje kako se emocionalni usponi i padovi dešavaju u romanu Kazua Išigura „Ne puštaj me”. Izvor: researchgate.net

Uz pomoć dodatne analize dobijene krive, moguće je izračunati dinamiku razvoja emocija (u kojim se fragmentima menja emocionalni naboj), kao i nivo usklađenosti fragmenata u celini. Oba proračuna se mogu predstaviti kao grafikon u dvodimenzionalnom prostoru, a evo i primera jednog od njih. U istom romanu Išigura ovako izgleda kriva na kojoj se mogu pratiti ključne tačke promene emocionalnog naboja.

Detaljnija analiza romana „Ne puštaj me”: tačke preloma pokazuju mesta na kojima se menja emocionalni naboj teksta. Izvor: researchgate.net
Detaljnija analiza romana „Ne puštaj me”: tačke preloma pokazuju mesta na kojima se menja emocionalni naboj teksta. Izvor: researchgate.net

Najmanje označene tačke a, b, c i tako dalje - pokazuju gde se u tekstu menja raspoloženje priče. Na primer, tačka a odgovara Kejtinim razmišljanjima o događajima u Hejlšamu, nakon čega se razvija novo emocionalno stanje, koje kulminira tačkom b – najintrigantnijim delom priče: ovde gospođica Lusi govori studentima o njihovoj pravoj svrsi: oni su klonovi, njihova sudbina je da daju organe drugima. Usklađenost teksta se izražava numeričkim indikatorom, uzima se u obzir koliko dugo se ova ili ona emocija razvija u tekstu, koliko je naglo prekinuta ili, obrnuto, polako zamenjena drugom.

Dakle, ovi podaci o strukturi dela (emocionalni tonalitet luka zapleta; dinamika razvoja emocija u tekstu; nivo usklađenosti) se kombinuju i porede sa podacima o tiražu, demografskim podacima i recenzijama u medijima. Ovako program uči iz uspešnih tekstova, a kada u njega učitate svoj tekst, možete saznati kako se vaš rad slaže sa njima i da li može postati tako uspešan.

Primeri nekih uspešnih tekstova

Do sada smo uglavnom radili na danskim tekstovima. Na primer, proučavali su dela Hansa Kristijana Andersena. Često ga hvale zato što je veoma snalažljiv i što je smislio izuzetne priče i likove. Ali najzanimljivije je to što smo otkrili da on uspeva da pronađe neku vrstu nastanjive zone (u astronomiji, ovo je naziv zone oko zvezde u kojoj je temperatura pogodna za postojanje vode na njoj. – prim. red.), i čitalac ne može da kaže da li je tekst previše predvidljiv ili ne.

Takođe smo generisali model uspeha po nekim drugim tekstovima koji su uključeni u opštepriznati kanon i koji postoje u digitalnom obliku, na primer, prema Hariju Poteru i delima Džejn Ostin. 2020. godine, čak i pre pokretanja celog projekta, objavili smo članak koji objašnjava uspeh već pomenutog romana Kazua Išigura „Ne puštaj me“. Glavna radnja ove knjige u celini nije komplikovana, ali je to roman „velike emocionalne snage“, kako je Švedska akademija prokomentarisala prilikom dodele Nobelovoj nagradi, „emocionalni zamah“ u ovom tekstu je prilično moćan, pri tome je tekst prilično usklađen. To je, na primer, lakoća sa kojom Kejti H., glavni lik, opisuje upotrebu klonova kao rezervnih delova, u potpunoj je suprotnosti sa načinom na koji čitaoci doživljavaju ovaj sistem (čitaoci će biti ljuti, činiće im se nepravednim), a to će biti izvor snažne emocionalne uključenosti u tekst.

Etička pitanja

Međutim, ovaj pristup ima jednu poteškoću. Računar može da izračuna koliko se određeni tekst uklapa u model uspešnih radova, ali to radi u celini, kumulativno. Odnosno, za sada neuronska mreža daje ukupnu uspešnost određenog teksta, ne može da kaže koji faktor je odigrao veliku ulogu u njegovoj proceni – stilske karakteristike, nivo predvidljivosti, demografija ili nešto drugo.

Program funkcioniše ovako: daje vam ukupnu verovatnoću uspeha teksta, recimo da će biti 75%. Dalje, korisnik može uključiti ili isključiti različite opcije i dobiti očekivani nivo uspeha u pogledu upravo onih faktora koji ga zanimaju, na primer, da li će tekst biti uspešan u kritikama književnih kritičara ili isključivo u kritikama čitalaca na internetu. Sprovođenje ovakvih podeksperimenata je jedini siguran način da saznate uticaj kriterijuma koji vas zanima. Na primer, možete saznati koliko bi uspeh teksta mogao da zavisi ili zavisi od činjenice da je njegov autor belac.

Ovo istraživanje prirodno ide rame uz rame sa etičkim pitanjima, jer takav sistem zaista može uticati na naše odluke, na primer možete prepraviti roman. Primene ove tehnologije su ogromne: može se koristiti za predviđanje uspeha teksta, a istraživači je mogu koristiti za tumačenje velikih količina podataka. Svesni smo ovih etičkih poteškoća, ali bar se trudimo da budemo otvoreni, a rešenja koja predstavlja računar da budu što jasnija korisniku.

Koristimo kolačiće da bismo poboljšali iskustvo na web stranici Bookmate Žurnal. Saznajte više ili