fregimus: (Default)
[personal profile] fregimus
Говорят, в английском языке слов втрое больше, чем в русском: 300 тыс. против 100 тыс. То же говорят и о сравнении английского и романских языков. Как сосчитать?

Можно сравнивать словари — но какие с какими? Самый большой Оксфордский английский словарь содержит около 260 тыс. статей. Но и самый большой итальянский словарь Батальи такого же размера, в то время как говорят, что английских слов вдвое больше, чем и итальянских… Вполне вероятно, русская традиция того, что включается в словари, а что нет, отличается от английской. В 20 первых строках Клавдиана в пер. Р. Л. Шмаракова 8 слов, не входящих ни в один словарь на грамоте-ру, не считая «пламеннозарного». В то же время, слова, употребляемые только в поэзии, в OED есть. Несравнимость очевидна. Хорошо известно также, что английская словарная традиция намного терпимее к диалектизмам, чем русская. Но это только качественное рассуждение, которое, к тому же, гигантскую постулируемую разницу не объяснит.

Можно попытаться считать иначе. Положим, что мы говорим обо всем том же, что и англичане. Тогда можно сравнить полисемию слов в русском и английском: если в английском в средней статье толкового словаря 3 толкования, а в русском слов втрое меньше, ожидается, что в русском мы их встретим в среднем 9. Чушь, в общем, получается.

Тогда, может быть, объяснение такое: в английском очень много синонимов. Например, мы найдем синонимы motherhood и maternity — оба означающие «материнство», broterhood и fraternity — «братство», и так далее. Тем не менее, для объяснения якобы втрое большего числа слов это не годится. Синонимов не так уж много, и в среднем их не по 3 на слово. Даже если понимать под синонимами концепты, неразличимые для русскоязычных (как watch и clock — часы, только разные, или hand и arm для разных аспектов руки), все равно не сходится. Даже если мы предположим 5-кратную (безумно завышенную) синонимию для 20 тыс. наиболее употребительных концептов, мы объясним лишь половину утверждаемого различия.

Тогда, может быть, и правда в английском много слов, которых нет в русском? Есть слово sibling, объединяющее понятия брата и сестры, и grandparent, объединяющее деда и бабку. Но и здесь мы не найдем ответа. В английском зато нет однословных обозначений для понятий «сутки» и «крановщик», и много чего еще нет. Опять же, среди утверждаемых 260 тыс. слов скорее расхождения найдутся среди самых употребительных; редкие слова скорее окажутся однозначными и имеющими однозначные соответствия во многих языках.

Но, возможно, я ошибаюсь в этом, и именно маргинальные слова в английском образуют обширные синонимические группы, т. е., скажем, 240 тыс. английских слов (за вычетом 20 тыс. самых ходовых) соответствуют 80 тыс. русских? Не знаю; мне слабо в это верится, а проверить не так легко, как кажется на первый взгляд.

В общем, я не могу найти никакого разумного способа сравнить лексиконы двух языков. Притом утверждаемая разница огромна — втрое, или на 200 тысяч активных слов! Кто-нибудь считал, и как, если да? Лингвисты в целом словарями меряться не любят, но, может, кто-то приходил к приемлемой методологии?

(no subject)

2011-09-19 04:50 (UTC)
Posted by [identity profile] watertank.livejournal.com
я не могу найти никакого разумного способа сравнить лексиконы двух языков.

лексикон английского в Америке вполне разумно определяется требованиями SAT. в Китае есть свои тесты лексикона, например, требования для поступления в университет. если в России есть аналогичный тест, то их можно легко сравнить. и даже посмотреть распределение, кто сколько знает.

(no subject)

2011-09-19 05:38 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Нет, совершенно не годится. Сравнивать же надо естественно сложившиеся лексиконы, они куда больше, чем минимальный словарный запас, требуемый императорскими экзаменами. Там несколько тысяч слов всего будет, ну, и примерно одинаково в любой культуре. Я ж говорю о сравнении этих самых якобы сотен тысяч слов.

(no subject)

2011-09-19 05:44 (UTC)
Posted by [identity profile] l-i-d-y-a.livejournal.com
Отсечение по частоте надо брать. Взять многмиллионный двуязычный корпус, лучше, конечно, параллельный. Построить частотные словари. Все, что ниже, скажем 3 употреблений на миллион - выбрасываем, остальное считаем.

(no subject)

2011-09-19 05:52 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Это очень теоретически все. Где ж взять тот корпус, чтобы в него входили ­сто тысяч разных слов? Хотя бы большинство из тех, что в OED. Да еще параллельный. Мне кажется, что такого корпуса, если только предаться безудержному оптимизму, то можно сказать, еще долго не будет. А скорее всего, не будет вовсе.

(no subject)

2011-09-19 06:54 (UTC)
Posted by [identity profile] l-i-d-y-a.livejournal.com
Оптимизм, ага. Ну можно приближаться к этому идеалу как-то. В любом случае, это должно быть корпусное исследование, потому что мало ли кто и как составляет словари.

(no subject)

2011-09-19 17:52 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Если можно, как специалисту, вопрос не в тему: существуют ли на сегодня изрядно полные корпуса Пушкина и Шекспира? Вопрос вот тут возник: http://ivanov-petrov.livejournal.com/1738506.html?thread=87229706#t87229706. Но это просто из любопытства, специально не ищите!

(no subject)

2011-09-19 17:59 (UTC)
Posted by [identity profile] l-i-d-y-a.livejournal.com
Точно не знаю. Насчет Пушкина уверена, что есть. А с Шекспиром непонятно, что считать полным корпусом - про его биографию точно же ничего не известно.

(no subject)

2011-09-19 18:22 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Спасибо!

(no subject)

2011-09-19 07:12 (UTC)
Posted by [identity profile] kcmamu.livejournal.com
И насчитается примерно 20000 слов...

(no subject)

2011-09-19 10:06 (UTC)
Posted by [identity profile] l-i-d-y-a.livejournal.com
Может насчитаться разное количество в разных языках. Небольшое, да, но разное.

(no subject)

2011-09-19 10:19 (UTC)
Posted by [identity profile] kcmamu.livejournal.com
Хм, да. В английском так выходит почти вдвое меньше, чем в русском.

(no subject)

2011-09-19 13:31 (UTC)
Posted by [identity profile] l-i-d-y-a.livejournal.com
Смотря в каком английском. В формально-деловом стиле используется меньше фразовых глаголов и больше латинских слов. С другой стороны, те же фразовые глаголы я бы считала за отдельные слова - по той причине, что их надо заучивать, смысл из частей не выводится.

(no subject)

2011-09-19 06:32 (UTC)
Posted by [identity profile] watertank.livejournal.com
Я не имел в виду императорский экзамен.

Если не секрет, что такое естественно сложившийся лексикон? В какой среде(ах) он сложился?

(no subject)

2011-09-19 06:40 (UTC)
Posted by [identity profile] fregimus.livejournal.com
Императорский — обобщение. САТ, ЕГЭ, все, что угодно.

А вот что такое лексикон, который мы тут считаем — в этом-то весь вопрос и состоит.

(no subject)

2011-09-19 06:51 (UTC)
Posted by [identity profile] watertank.livejournal.com
Допустим, вы его нашли и сосчитали. А дальше что?

(no subject)

2011-09-19 06:54 (UTC)
Posted by [identity profile] fregimus.livejournal.com
А дальше сравнили, какой из двух сосчитанных больше!

(no subject)

2011-09-19 19:21 (UTC)
Posted by [identity profile] watertank.livejournal.com
Второй. А дальше?

Profile

fregimus: (Default)
fregimus

March 2014

S M T W T F S
       1
2 3456 78
910 1112 131415
16171819202122
23242526272829
3031     

Most Popular Tags

Page generated 2026-01-14 06:40

Expand Cut Tags

No cut tags