Вазов срещу Шекспир - кой знае повече думи

Когато се говори за литература, понякога се повдига темата за това колко богат е речникът на даден автор. За англоговорящия свят например е много разпространено твърдението, че Шекспир е авторът, използвал най-много различни думи в творчеството си. В България е популярна подобна теза за Иван Вазов.

При по-подробен анализ на произведенията на Шекспир и още няколко автори обаче се оказва, че макар и обширен, речникът на английския драматург далеч не е най-обширният. Тук ще разгледаме няколко български творци и ще сравним колко различни думи е използвал всеки един от тях, за да проверим дали българското твърдение е по-вярно от английското.

Съпоставянето е базирано на първите 200 000 думи от анализираните произведения на някои от най-известните български автори (а на графиката са показани данни за първите 200 000 до 600 000).

Разглеждането на един и същ брой думи дава реалистична база за сравнение, а конкретната граница е избрана така, че да могат да се включат достатъчно много автори и все пак да се представи реалистично работата на всеки един от тях.

Разбира се, редът на произведенията определя какво се включва в анализа и промяната му може да повлияе до някаква степен на уникалните думи. За уникални думи не се броят само корените или основните форми на дадена дума, а всички, които се срещат в текстовете. Така например маса, масата и масите се броят за три различни думи.

Анализираните данни затвърждават мнението, че Вазов е използвал най-много уникални думи. Със своите 31 500 уникални думи от 200 000 разгледани, той е с около 1 000 думи пред авторите на следващите две места, и с близо 50% повече от последното девето място, заемано от Димитър Талев. Челната тройка се допълва от двете авторки, включени в сравнението - Вера Мутафчиева и Блага Димитрова. И двете са с по около 30 500 думи, което е преднина от близо 3 000 думи спрямо четвъртото място, заето от Емилиян Станев.

Това не е единствената метрика, по която Вазов е на първо място. Следващата графика показва колко думи е използвал даден автор, които не са използвани от нито един от останалите.

От тук се вижда, че Иван Вазов е използвал около 17 500 уникални за него думи - над 6 000 повече от Вера Мутафчиева, заемаща второто място, и близо 4 пъти повече от Емилиян Станев, който е на последно място по този критерий. Това се дължи отчасти на обема на творчеството му - анализираните текстове съдържат около половин милион думи. Макар и важен, този довод не е определящ - Димитър Талев, с разгледано творчество от близо 700 хиляди думи, е използвал само 8 600 думи, които другите автори не са. (За да сме напълно коректни, трябва да се отбележи, че всичките 700 000 думи са от тетралогията за Илинденско-преображенското въстание, което най-вероятно ограничава широтата на използвания речник.)

Ако разгледаме някои от думите, които само Вазов е използвал, бързо ще забележим голямо количество архаични и диалектни думи, както и други необичайни форми. Такива са например пусталите, махтареха, пивопийци, ухищрения и множество други. Лесно бихме могли да игнорираме това, обяснявайки го например с факта, че Вазов е писал преди много време и това е бил актуалният речник, който се е използвал тогава. Оказва се обаче, че за тези необичайни думи, а и за голямата му лексика изобщо, има по-сериозна причина.

А именно - че Иван Вазов изрично се е стараел да обогатява книжовния език, вмъквайки множество думи от народния речник - "Винаги се съветвам с Герова - казва той, - особено когато се съмнявам за народното ударение на някоя дума." (става въпрос за "Речникъ на блъгарскый языкъ" на Найден Геров, в който е записвал думи "из устата на народа"). Ролята на Вазов в оформянето на съвременния ни език е разгледана в повече детайли от Любомир Андрейчин в книгата "Из историята на нашето езиково строителство", глава Иван Вазов - строител на българския книжовен език.

След като установихме, че Вазов води класацията сред българските автори, би било интересно да проверим каква е ситуацията спрямо чуждестранните - например с Шекспир. Бърза проверка показва, че Шекспир е използвал общо 29 000 уникални думи в цялото си творчество. Но ние вече видяхме, че само в първите 200 000 анализирани думи, Вазов е ползвал над 31 000 уникални! Изглежда, че Вазов е имал много по-богат речник от този на Шекспир. За съжаление обаче такова сравнение е малко по-сложно и не трябва да се прибързва с изводите.

В следващата графика са показани някои популярни автори, творили на английски език. Анализирани са едни и същи техни произведения в оригинал и в превод на български. Броят уникални думи в оригиналите на съответния романист е показан в червената колона над името му, а в преводите - в синята. (Т.е. червената колона над Марк Твен показва броя уникални думи в оригиналите на "Приключенията на Том Сойер", "Приключенията на Хъкълбери Фин" и "Принцът и просякът", а синята - уникалните думи в преводите на същите произведения.)

Ясно се открояват разликите в различно оцветените колони - по-конкретно, в преводите на всички автори има много повече уникални думи, отколкото в оригиналите. Основната причина за това е граматическата разлика в езиците - родният ни език е много по-флексионен от английския - което означава, че от една дума могат да се получат много повече различни словоформи в българския, отколкото в английския.

Думите имат най-различни форми според лице и число (ходя - ходи, ходиш, ходим, ходите, ходят), време (ходя - ходих, ходех, ходеше, ходил, ходел и още много) и род (красив - красива, красиво, красиви). В английския вариантите са много по-малко: -ed за минало време, -ing за продължителна форма и още 2-3 основни. Главно затова в българските преводи на разгледаните книги има близо 2 пъти (между 1.75 и 2) повече уникални думи, отколкото в оригиналите.

И така, въпреки че речниковото богатство определено не е най-важното нещо в творчеството на даден автор, установихме, че Вазов е боравил най-умело с българската лексика (макар и с не много голяма преднина). Също така разбрахме, че сравненията между хора, творили на различни езици, не са обективни. Затова и не е коректно да твърдим, че Вазов е използвал повече уникални думи от Шекспир, дори и да ни се иска. :)

 

* Shakespeare's Vocabulary Considered Unexceptional - цитираното сравнение на английски автори.

** The Largest Vocabulary in Hip Hop - подобна статия, сравняваща рапъри вместо писатели. Шекспир отново не е на върха.

*** Списък с анализирани произведения - тук може да видите кои са разгледаните произведения на всеки автор.

Текстът е взет от блога на Иван Вергилиев с изричното съгласие на автора.

#1 янаки 06.02.2015 в 10:23:00

С голям интерес прочетох статията на г-н Вергилиев за българските думи използвани от големите български писатели в техните произведения. Темата е интересна, защото всички ние, българите, чрез техните книги сме овладявали и продължаваме да овладяваме книжовния български език. Иска ми се да кажа няколко думи за Вазов, и защо аз си мисля, че той употребява повече „негови”, неупотребявани от другите големи писатели думи. Това са думите от турската лексика, както и персийски и арабски думи, станали част от турския език. И още нещо, при интензивното изчистване на българския език от турцизмите след Освобождението, Вазов е е от малкото големи познавачи на българския език, който не е одобрявал този процес, който по-скоро отразява емоционална нагласа, а не е разумно действие. Каквото и да се говори, през тези пет века не е било възможно българският език да не бъде повлиян от езика на народа, който е завладял земите на българите. И тези „заемки” са станали част от нашия език, някой от тях са станали единствени за обозначаване на неща и явления: маса, шапка, палто, шише, перде, капак, лале........ Други са се употребявали, за да предадат по-голяма експресивност на речта: Например едно е да кажеш: „Политиците ни са хитри, нахални и алчни”, но много по-изразително е: „Политиците ни са ачигьоз, тепигьоз и боазлии (с голямо гърло)”. Същото се отнася и за думата „рахат”. Когато се каже „Бъди рахат!”, това не е пожелание да бъдеш спокоен. С повече български думи това би могло да се изрази така: „Разположи се (седни) удобно, отпусни се напълно!”. Отпускане и физическо и емоционално. Мога да ви дам оше много такива примери.

#2 янаки 06.02.2015 в 10:56:47

Колко напред е отишъл българският език, най-вече със завършена граматика и правопис благодарение на нашите предци – учители преди и след Освобождението, може да се види от един „репортаж” по повод първия полет с балон в Цариград през 1844 година. И, като се убедим, какво са направили те за нашия език, може да се убедим също така, какви жалки и недостойни потомци сме ние, които не можем две думи „на кръст” да кажем правилно и кълцаме родния си език като кисела зелка. Корабл и страствование на воздух Онова, дето слушахме, че у Европа някои хора возвишават се на воздух и ходат в някоя доволна висота под небето сос разновидни като кораблски направи, с това се сподобиха в Цариград да видат, които се случиха там. На 26-й Юния един европеанин Комасх с дозволением на отоманското началство и В. Е. султан Абдул Меджид возвиси се пред очите на толкова цариградски народ според следователния пример. Воздушния корабл беше приуготовлен в една ливада близу при един султански кьошк щтото е у едно широко поле на Хайдар-Паша, гдето от двете страни на полето секи зрител (сеирджия) можеше да гледа возвишуването му. Цариградскио народ без число беше се стърчал още сутрина за да гледат това первовидно в Цариград на воздух странствование, което стана после по пладнина почти по един часа и половина. В. Е. дойде в кьошкът около пладнина. Дипломатите чужди (елчиите) беха дошли мало нещо по напреш, за които бяха приустановени способни и собствени шадъре, гдето наблизу беха и други цариградски големци…………… Списание „Любословие” – август 1844 г. Издател Константин Фотинов Пълният текст на репортажа - http://iztoknazapad.com/?page_id=6225

#3 John Smith 06.02.2015 в 11:25:30

Най- много думи използва Толкин. Освен това има уникален словоред. У нашия Форум най- много думи използва Г-н Иван Вълков (Потника).

#4 Rowan 06.02.2015 в 12:01:17

Далеч по-забавна би била статистиката, колко англичани са чели цялостно Шекспир и колко българи – Вазов. Щото богатството на езика заключено в книги, които никой не чете си е като закопано гърне със злато: я някой го открие, я – не. Пък и да го открие някой – ако си го къта в килера, от него файда никаква. Като парите е – носят обществена полза само когато са в обръщение. Има и още един забавен факт – войната за опростяването на езиците се води предимно от университетски професори (когато не можеш да създадеш нещо ново, най-лесно е да си приришеш научен принос, като рушиш старото, защото разрушеното старо, е все пак нещо ново) и винаги намира широка обществена подкрепа. Просто защото широките народни маси в неспособността си да достигнат великите, всячески се стремят да омаловажат постиженията им. За да се почувстват те велики. За щастие на человеческия род, във всяко поколение има по няколко бележити личности, които вместо да рушат – надграждат. Или поне съхраняват досега построеното.

#5 Xaoc 06.02.2015 в 13:36:13

Най-много думи използва Гугъл

#6 Кокошият трън на delight 06.02.2015 в 14:03:25

Много интересен поглед от неспециалист. Заслужава похвала и за труда, и за изказа. Но, повярвай ми, адаш, бъркаш в следното си твърдение: "Основната причина за това е граматическата разлика в езиците - родният ни език е много по-флексионен от английския - което означава, че от една дума могат да се получат много повече различни словоформи в българския, отколкото в английския." И ще ти посоча защо. Основната причина, първо, не е основна; второ - словоформите в българския са винаги повече, но поради друга причина; и трето, не е необходимо да използваш нови чуждици, след като си има много добри стари такива, а още по-малко, когато си има и оригинална българска дума. Такава е сътворената от теб дума п о - ф л е к с и о н е н, която е без никаква етимологична логика в контекста и е лишена от значение сама по себе си в желаната от теб връзка за издържано обяснение на лингвистичен факт. А фактът е, че всеки един език има речников фонд и речников състав. Някъде, в началото на 80-те, бе изчислено, че нашият език е с речников фонд от около 8 хиляди думи, с чисто български произход, докато речниковият му състав се изчисляваше на 20 000 думи. По това време английският, немският и френският бяха към 200 000 думи речников състав, всеки един от тях. Тоест, българският език е по-експресивен от английския, както и от немския, и от френския, и от... от..., независимо че е, грубо казано, по-беден от всеки един от тях минимум 10 пъти, и то, без да броим развитието на езиците, благодарение на науката и техниката в следващите 30 години. Или, на български казано - нашият език е п о - н а с и т е н. Виж, обаче, руският е не само по-наситен от българският, но и по-богат от него, по-емоционално обагрен. В тази връзка, става ясно, когато при професионален превод, предимно на проза, от български на немски или на английски крайният резултат е винаги, примерно, от 200 страници оригинал - 250 преводен текст. Иначе, още един път похвала за хвърления от теб труд. Макар и това твое, както и други подобни изследвания да няма нищо общо с въздействието и значението на един наистина разкошен, разтърсващ, мъдър, майсторски, художенствен, върховен, вечен художествен текст. Затова и се получава така, че последните в твоята "класация" за мен са първи и единствени досега, докато за Блага Димитрова, Вера Мутафчиева и Йордан Радичков нямам и помен от спомен. Колкото до Вазов, необходимо е да се знае, че е изплагиатствал конструкцията, части от сюжета и изграждането на образите си в П о д и г о т о от Виктор Юго, факт, известен на всеки, занимаващ се професионално с българска литература и език. Няма по-бутафорна проза, бих казал, в цялата ни л-рна история. А за стиховете му... просто ги е вадел, като от куфар. Ала няма значение - такива са били изискванията на времето тогава.

#7 Дракон с кисело зеле 06.02.2015 в 15:36:52

Да, хубаво, сравнявайте езика на български романист с езика на английски драматург. Що за глупости, по дяволите? Да, осъзнавам, че говоря опростенчески, обаче, първо, езиците са много различни, второ, докато Шекспир е писал само поезия, което е доста ограничаващо, Вазов е изписал и купища проза, трето, двамата са действали в напълно различни епохи. С други думи, по същия начин някой може да сравни Ханс Цимер с Чайковски и да направи съответния грешен извод.

#8 белоризецплах 06.02.2015 в 18:08:36

Вазов не е плагиатствал,взаимствал е с широка ръка от автобиографичната книга на Христо Филипов Попов "САМУИЛ".Това е било тайното име на революционния комитет в гр.Клисура.За справка - Димо Кьорчев. От езиковедска гледна точка сравненията са доста механични...

#10 Сърце Червено 06.02.2015 в 18:55:47

Rowan | 06.02.201512:01 Прав си за опростяването на езика, но не си прав в някои аспекти. Защото пък усложняването на езика води до разлика между говора на обикновения човечец и този който е от елита. Така с незнанието си на езика той бива по-лесно управляван.

#11 Сърце Червено 06.02.2015 в 19:00:08

Иначе съм съгласен с мненията на Lina Lecheva.1510350927 и Кокошият трън на delight, че българският език е по-богат от английския, че пет български думи на английски могат да бъдат преведени по един и същи начин.

#12 Harry 06.02.2015 в 19:42:21

Как е думата за тъща в английския, или кръстник?

#13 Harry 06.02.2015 в 19:51:55

И стига сте се подценявали, чуждопоклонничеството и омаловажане на своето е признак за емоционална незрялост и комплексираност. Не случайно от такива среди излизат националните нихилисти и предатели. Вижте какво мисли за нашия език един руснак, акад. Лихачов: "Българският език е като Бах сред композиторите." "Българският литературен език е първият сред славянските езици не само по време на възникване, но и по необикновената си красота и тържественост. Няма друг такъв славянски език. Има езици богати, разнообразни, но такъв тържествен, красив, бих казал баховски, няма! Ако можеше да се сравнява езикът с композиторите, то българският е като Бах сред композиторите."

#14 Кокошият трън на delight 06.02.2015 в 20:46:13

Хаджи Димитър Жив е той, жив е! Там на Балкана, потънал в кърви, лежи и пъшка юнак с дълбока на гърди рана, юнак във младост и в сила мъжка. На една страна захвърлил пушка, на друга сабя на две строшена; очи тъмнеят, глава се люшка, уста проклинат цяла вселена! Лежи юнакът, а на небето слънцето спряно сърдито пече; жетварка пее нейде в полето, и кръвта още по силно тече! Жетва е сега... Пейте, робини, тез тъжни песни! Грей и ти, слънце, в таз робска земя! Ще да загине и тоя юнак... Но млъкни, сърце! Тоз, който падне в бой за свобода, той не умира: него жалеят земя и небо, звяр и природа, и певци песни за него пеят... Денем му сянка пази орлица и вълк му кротко раната ближе; над него сокол, юнашка птица, и тя се за брат, за юнак грижи! Настане вечер - месец изгрее, звезди обсипят сводът небесен; гора зашуми, вятър повее, - Балканът пее хайдушка песен! И самодиви в бяла премена, чудни, прекрасни, песен поемнат, - тихо нагазят в трева зелена и при юнакът дойдат та седнат. Една му с билки раната върже, друга го пръсне с вода студена, трета го в уста целуне бърже - и той я гледа - мила, засмена! "Кажи ми, сестро, де - Караджата? Де е и мойта вярна дружина? Кажи ми, пък ми вземи душата, аз искам, сестро, тук да загина!" И плеснат с ръце, па се прегърнат, и с песни хвръкнат те в небесата, - летят и пеят, дорде осъмнат, и търсят духът на Караджата... Но съмна вече! И на Балкана юнакът лежи, кръвта му тече, - вълкът му ближе лютата рана, и слънцето пак пече ли - пече! ––––––––––––––––––––––––––––––––– Опитай се да преведеш горното стихотворение на английски, Хари, или поне куплета Настане вечер - месец изгрее, звезди обсипят сводът небесен; гора зашуми, вятър повее, - Балканът пее хайдушка песен!, за да разбереш защо моят любим поет Ботев е гениален само на български, в България, а иначе никъде го няма и на нито един език никой нищо не знае за него.

#15 Кокошият трън на delight 06.02.2015 в 20:48:30

Ето ти помощ: http://www.slovo.bg/old/lit-mis/199901/kmihaylov.htm

#16 Кокошият трън на delight 06.02.2015 в 20:50:51

Now falls the twilight and the moon clambers Into that arch where the happy stars dance, Now the wood rustles, now the wind hisses, Now chants the Balkan a robber’s romance.

Новините

Най-четените