Вазов срещу Шекспир - кой знае повече думи

Когато се говори за литература, понякога се повдига темата за това колко богат е речникът на даден автор. За англоговорящия свят например е много разпространено твърдението, че Шекспир е авторът, използвал най-много различни думи в творчеството си. В България е популярна подобна теза за Иван Вазов.

При по-подробен анализ на произведенията на Шекспир и още няколко автори обаче се оказва, че макар и обширен, речникът на английския драматург далеч не е най-обширният. Тук ще разгледаме няколко български творци и ще сравним колко различни думи е използвал всеки един от тях, за да проверим дали българското твърдение е по-вярно от английското.

Съпоставянето е базирано на първите 200 000 думи от анализираните произведения на някои от най-известните български автори (а на графиката са показани данни за първите 200 000 до 600 000).

Разглеждането на един и същ брой думи дава реалистична база за сравнение, а конкретната граница е избрана така, че да могат да се включат достатъчно много автори и все пак да се представи реалистично работата на всеки един от тях.

Разбира се, редът на произведенията определя какво се включва в анализа и промяната му може да повлияе до някаква степен на уникалните думи. За уникални думи не се броят само корените или основните форми на дадена дума, а всички, които се срещат в текстовете. Така например маса, масата и масите се броят за три различни думи.

Анализираните данни затвърждават мнението, че Вазов е използвал най-много уникални думи. Със своите 31 500 уникални думи от 200 000 разгледани, той е с около 1 000 думи пред авторите на следващите две места, и с близо 50% повече от последното девето място, заемано от Димитър Талев. Челната тройка се допълва от двете авторки, включени в сравнението - Вера Мутафчиева и Блага Димитрова. И двете са с по около 30 500 думи, което е преднина от близо 3 000 думи спрямо четвъртото място, заето от Емилиян Станев.

Това не е единствената метрика, по която Вазов е на първо място. Следващата графика показва колко думи е използвал даден автор, които не са използвани от нито един от останалите.

От тук се вижда, че Иван Вазов е използвал около 17 500 уникални за него думи - над 6 000 повече от Вера Мутафчиева, заемаща второто място, и близо 4 пъти повече от Емилиян Станев, който е на последно място по този критерий. Това се дължи отчасти на обема на творчеството му - анализираните текстове съдържат около половин милион думи. Макар и важен, този довод не е определящ - Димитър Талев, с разгледано творчество от близо 700 хиляди думи, е използвал само 8 600 думи, които другите автори не са. (За да сме напълно коректни, трябва да се отбележи, че всичките 700 000 думи са от тетралогията за Илинденско-преображенското въстание, което най-вероятно ограничава широтата на използвания речник.)

Ако разгледаме някои от думите, които само Вазов е използвал, бързо ще забележим голямо количество архаични и диалектни думи, както и други необичайни форми. Такива са например пусталите, махтареха, пивопийци, ухищрения и множество други. Лесно бихме могли да игнорираме това, обяснявайки го например с факта, че Вазов е писал преди много време и това е бил актуалният речник, който се е използвал тогава. Оказва се обаче, че за тези необичайни думи, а и за голямата му лексика изобщо, има по-сериозна причина.

А именно - че Иван Вазов изрично се е стараел да обогатява книжовния език, вмъквайки множество думи от народния речник - "Винаги се съветвам с Герова - казва той, - особено когато се съмнявам за народното ударение на някоя дума." (става въпрос за "Речникъ на блъгарскый языкъ" на Найден Геров, в който е записвал думи "из устата на народа"). Ролята на Вазов в оформянето на съвременния ни език е разгледана в повече детайли от Любомир Андрейчин в книгата "Из историята на нашето езиково строителство", глава Иван Вазов - строител на българския книжовен език.

След като установихме, че Вазов води класацията сред българските автори, би било интересно да проверим каква е ситуацията спрямо чуждестранните - например с Шекспир. Бърза проверка показва, че Шекспир е използвал общо 29 000 уникални думи в цялото си творчество. Но ние вече видяхме, че само в първите 200 000 анализирани думи, Вазов е ползвал над 31 000 уникални! Изглежда, че Вазов е имал много по-богат речник от този на Шекспир. За съжаление обаче такова сравнение е малко по-сложно и не трябва да се прибързва с изводите.

В следващата графика са показани някои популярни автори, творили на английски език. Анализирани са едни и същи техни произведения в оригинал и в превод на български. Броят уникални думи в оригиналите на съответния романист е показан в червената колона над името му, а в преводите - в синята. (Т.е. червената колона над Марк Твен показва броя уникални думи в оригиналите на "Приключенията на Том Сойер", "Приключенията на Хъкълбери Фин" и "Принцът и просякът", а синята - уникалните думи в преводите на същите произведения.)

Ясно се открояват разликите в различно оцветените колони - по-конкретно, в преводите на всички автори има много повече уникални думи, отколкото в оригиналите. Основната причина за това е граматическата разлика в езиците - родният ни език е много по-флексионен от английския - което означава, че от една дума могат да се получат много повече различни словоформи в българския, отколкото в английския.

Думите имат най-различни форми според лице и число (ходя - ходи, ходиш, ходим, ходите, ходят), време (ходя - ходих, ходех, ходеше, ходил, ходел и още много) и род (красив - красива, красиво, красиви). В английския вариантите са много по-малко: -ed за минало време, -ing за продължителна форма и още 2-3 основни. Главно затова в българските преводи на разгледаните книги има близо 2 пъти (между 1.75 и 2) повече уникални думи, отколкото в оригиналите.

И така, въпреки че речниковото богатство определено не е най-важното нещо в творчеството на даден автор, установихме, че Вазов е боравил най-умело с българската лексика (макар и с не много голяма преднина). Също така разбрахме, че сравненията между хора, творили на различни езици, не са обективни. Затова и не е коректно да твърдим, че Вазов е използвал повече уникални думи от Шекспир, дори и да ни се иска. :)

 

* Shakespeare's Vocabulary Considered Unexceptional - цитираното сравнение на английски автори.

** The Largest Vocabulary in Hip Hop - подобна статия, сравняваща рапъри вместо писатели. Шекспир отново не е на върха.

*** Списък с анализирани произведения - тук може да видите кои са разгледаните произведения на всеки автор.

Текстът е взет от блога на Иван Вергилиев с изричното съгласие на автора.

#35 Дракон с кисело зеле 07.02.2015 в 15:51:48

Последният пост на Гергана е твърде близък до моя, все едно аз съм го писал. Напълно права е. Двамата автори пишат на различен език, в различна епоха и в различна... ъъъ.. форма. Съответно подобно сравнение е безсмислено.

#36 boris 07.02.2015 в 17:02:11

Вазов е "имал достъп" до названия на хиляди предмети дейности и идеи които все още не са съществували по времето на Шекспир. Същевременно, същите неща изчезнали заедно с названието си до 19-20 век са малко. Нещо подобно на сравнението на музиканти от различни поколения по "брой продадени албуми"

#38 Галфонсо 07.02.2015 в 19:12:10

Не е важно колко думи използваш, а начина по които ги подреждаш

#39 Кoкoшият трън на delight 07.02.2015 в 19:15:57

Какъв Вазов, какъв Шекспир бра, аз чета само гей романи да са ева в перверзника .

#40 dedogo6 07.02.2015 в 19:58:28

Гергана, не се занимавай с този човек.Викаме му Потника.Той има поне триста никнейма, и единствената му работа е да троли.И рядко го трият. Ама ако аз го напсувам на майка, на секундата ще ме тръкнат.Подминавай го , където и да го срещнеш.Стила му се познава от първия път, въпреки различните имена, които ползва.

#41 янаки 07.02.2015 в 20:30:04

Авторът на статията изрично заявява още в началото на статията си, че вече е правен анализ на произведенията на Шекспир и още няколко автори, които пишат на английски, за да се провери едно общоприето мнение, че „ Шекспир е авторът, използвал най-много различни думи в творчеството си”. Заявява също, че „в България съществува подобна теза за Иван Вазов”. Затова и г-н Вергилиев провежда подобно изследване, за да провери тази общоприета теза, като използва, предполагам, същата изследователска методика. И в двата случая става дума за сравнителни изследвания вътре в списъка на избраните автори, съответно англоезични, а при г-н Вергилиев – българоезични. Като казвам сравнителни изследвания, то от това следва, че данните от двете изследвания са несъпоставими, а и авторът на статията не прави това, или, по-простичко казано, Щекспир се сравнява с англоезични автори, а Вазов – с българоезични. Дали са достоверни резултатите? Това е съвсем друга тема. Може и да не са, а може и да са. А това,че според някои те са недостоверни и празна работа – за всеки влак си има пътници. На мене това изследване ми се видя интересно. И, предполагам, не само на мене.

#43 deowin 09.02.2015 в 21:33:42

Абсолютно безумно "изследване". Как е възможно да искаш да броиш отделни думи, но да не изчистиш данните от различните форми на една и съща дума, при все, че в българския, за разлика от английския, времеобразуването, спрягането в род и число, членуването и прочие дават различна "дума", тоест, поредица букви? Как изобщо сравняваш език, в който с представки и наставки получаваш друга "дума", с език, в който представките са отделни от корена? Естествено, че ако броиш "думи", сиреч, поредици букви, отделени с не-буква, то ще имаш съществен bias, когато словообразуването е коренно различно. Например, просто сравнение на представка+корен в български срещу phrasal verbs на английски: Български: {о, за, пре, над, из, при, въз}качвам, {о, за, пре, над, из, раз, под}ливам = 14 значения, 14 "думи" Ангийски: {get, go} {up, away, back, in, off, out, through} = 14 значения, 9 "думи"

Новините

Най-четените