ЧТО ВНУТРИ ЭЛЕКТРОННОГО СЛОВАРЯ?

А. САВИНА, Т. ТИПИКИНА.

Сегодня никому не надо объяснять, почему так важно знать иностранные языки. На работе и в быту мы постоянно сталкиваемся с иностранными словами и выражениями, причем потребность понимать их возникает все чаще. Это особенно актуально для тех, кто занимается бизнесом, имеет дело с компьютерными технологиями, регулярно пользуется Интернетом. Стремительное развитие современной жизни напрямую отражается в языке — возникают новые слова, термины и выражения, меняется смысл старых слов. Традиционные “бумажные” словари все хуже поспевают за этими темпами. На смену им приходят словари электронные — компьютерные программы на компакт-дисках, позволяющие справиться с иностранным текстом или перевести на чужой язык необходимую информацию. Что такое электронный словарь? Просто современная удобная оболочка “бумажного” словаря или же начало нового этапа в развитии лексикографии? Об этом рассуждают А. Савина и Т. Типикина — сотрудники фирмы ABBYY, занимающейся разработкой электронных словарей серии Lingvo.

Две статьи из разных словарей.

Краткий экскурс в историю лексикографии

Составление языковых словарей — дело не- простое. Задача не только в том, чтобы собрать как можно больше слов и разместить их в алфавитном порядке. Важно снабдить каждое слово словарной статьей, дающей его перевод или толкование с учетом всех возможных значений и способов употребления. Практикой и теорией составления словарей занимается лексикография (от греческого lexikos — относящийся к слову, grapho — пишу).

В России период бурного развития лексикографии пришелся на XIX век. Тогда были созданы словари разных типов - исторические, иностранных слов, двуязычные, толковые. Позже, в СССР, лексикография превратилась в ведущую отрасль прикладного языкознания. Это объяснялось необходимостью фиксировать современное состояние русского и других языков страны, закрепить языковые нормы для многих дотоле бесписьменных народов. Так были созданы двуязычные словари для народов СССР — русско-национальные и национально-русские. Расширение переводческой деятельности и преподавания иностранных языков в учебных заведениях потребовало и новых русско-иностранных и иностранно-русских словарей. С 1918 по 1962 год в Советском Союзе было издано около 9000 разных словарей, в том числе и словари нового типа: словарь сочетаемости, словообразовательный, морфемный, фразеологический и другие.

Развитие любой науки происходит в тесном взаимодействии теории и практики. Теоретические достижения лексикографии приводят к рождению нового словаря, дальнейшая жизнь которого позволяет, в свою очередь, проверить и уточнить теорию. Пожалуй, наиболее ярко и эффективно подобное взаимодействие отражено в работах отечественных лингвистов Игоря Александровича Мельчука и Юрия Дерениковича Апресяна - создателей “Толково-комбинаторного словаря русского языка”.

В основу словаря была положена теория моделей “Смысл-Текст” И. А. Мельчука, идея которой - перечислить весь спектр возможных “смыслов”, выражаемых в языке тем или иным словом, а потом для каждого смысла указать способы его лексического выражения. Такой подход поможет объяснить любому иностранцу, почему по-русски “сильный дождь” — это проливной дождь, а “сильный сон” — это вовсе не проливной, а глубокий сон, а “сильные аплодисменты” — они и не проливные, и не глубокие, а бурные.

Академик Ю. Д. Апресян известен своими работами в области лексической семантики, изучающей способы толкования значений слова. Ему принадлежит идея создания “развернутых портретов” разных слов. Условно их можно назвать “все про глагол “знать” или “все про предлог “по”. Под руководством Апресяна в 1993 году вышел в свет “Новый большой англо-русский словарь” в трех томах (НБАРС). Это значительно обновленная, расширенная приблизительно в полтора раза и методически усовершенствованная версия известного двухтомного “Большого англо-русского” словаря под редакцией проф. И. Р. Гальперина, изданного в 1972 году. НБАРС — наиболее полный англо-русский словарь в мире (250 000 словарных статей), самый современный и методологически обоснованный из словарей подобного класса.

Новое вино — в новые мехи

С развитием компьютерных технологий в лексикографии появилась новая отрасль — электронная лексикография, занимающаяся созданием электронных словарей. Пользоваться таким словарем можно с помощью компьютера, загружая его с диска как обычное программное приложение.

Часто считают, что словарь на компьютере — это просто электронный образ некоторого “бумажного” словаря, снабженный удобным пользовательским интерфейсом и машинными средствами поиска. При описании электронных словарей уделяют много внимания их удобной “компьютер ной” форме, а содержание словаря: лексика, структура словарной статьи, актуальность значений, — как правило, не анализируется. Получается, что создатели электронных словарей просто “переливают старое лексикографическое вино в новые электронные мехи”. Задача электронной лексикографии сводится тем самым лишь к точной передаче и тщательному сохранению канонических словарных текстов в новой “электронной” оболочке.

Однако такая точка зрения недооценивает всех возможностей компьютерных технологий. Новая форма словаря позволяет устранить многие неизбежные недостатки “бумажной” лексикографии и тем самым поднять ее на качественно новый уровень.

Словарь для всех и для каждого

Главная особенность электронного словаря — это возможность обойти роковое противоречие “бумажной” лексикографии, состоящее в следующем: чем больше информации предлагает словарь, чем более развит его научный аппарат, тем сложнее им пользоваться.

По этой причине большинство “бумажных” словарей разделяется на две категории. Первая — популярные словари, относительно удобные, но довольно примитивные. Как часто в карманном словарике вы не могли найти нужного слова или же его перевод не устраивал вас своей бедностью? Вторая — объемистые профессиональные издания, непригодные для быстрого получения информации. Требуется определенное мужество, чтобы снять с полки двухкилограммовый талмуд и начать его листать в поисках необходимого слова.

Электронные словари сочетают большой объем с удобством пользования. Достигается это, в первую очередь, благодаря машинному механизму поиска. Чтобы найти слово в электронном словаре, обычно достаточно просто напечатать его в командной строке словаря, нажать “Ввод” — и в отдельном окошке выскочит перевод. Некоторые словари позволяют переводить слова, не выходя из текстового редактора или другого офисного приложения, с которым вы работаете в данный момент. Для этого надо выделить нужное слово и нажать определенную комбинацию клавиш.

Задача электронных словарей — удовлетворить нужды самой широкой аудитории, поэтому основным их качеством должна быть ПОЛЕЗНОСТЬ. Они должны отвечать на запросы пользователя с разным, в идеале — с любым языковым опытом. Это достигается с помощью структурирования словарной статьи, позволяющего выделять в ней основные типы информации о слове (варианты перевода, использование в устойчивых словосочетаниях, синонимы, антонимы и прочее). Каждый элемент информации о слове может быть гипер-ссылкой в другую словарную статью. Система гиперссылок обеспечивает возможность быстрого доступа к нужной информации без изнурительного поиска, одним щелчком мыши.

Очень важно, что структурирование позволяет формировать вид словарной статьи в соответствии с запросом. Например, если пользователя интересует исключительно математическая лексика, он может указать это в запросе, и словарь покажет ему только перевод, применимый в математике. Если пользователя интересует максимальный спектр значений — словарь продемонстрирует ему все разнообразие переводов.

Электронные словари могут “разговаривать”. То есть, все слова или их часть — наиболее употребимая лексика — могут быть озвучены “живым” или синтезированным звуком. Эта особенность полностью отсутствует в “бумажных” словарях и очень помогает тем, кто еще учит иностранный язык. Например, словарь Lingvo содержит 5000 слов, озвученных диктором из Оксфорда (оксфордское произношение считается для английского языка “классическим”).

Современный язык словаря

Язык — отражение реальной жизни. А жизнь не стоит на месте: появляются новые отрасли производства, науки, бизнеса, культуры. В обычную разговорную речь приходят новые слова, термины, устойчивые словосочетания. Можно ли представить в речи наших сограждан лет десять назад такие слова, как “холдинг”, “транш”? Выражение “конечный пользователь” вызвало бы у них недоумение, и никто не мог бы предположить, что слово “мыло” будет означать на компьютерном жаргоне электронную почту (вольная русская транскрипция английского слова “e-mail”).

Вся эта лексика не может быть адекватно отражена в “бумажных” словарях по той простой причине, что они слишком долго готовятся. Так, известный англо-русский словарь Мюллера, сочетающий относительную простоту пользования (один том, хотя и тяжелый!) и полноту содержания, был издан в 1960 году и с тех пор претерпел лишь косметические изменения в 1978 и 1994 годах.

Фактически многие словари, которые сформировались в языковой атмосфере середины века, сильно устарели. В них не указаны современные значения старых слов, а многие новые слова просто отсутствуют. Буквальное перенесение таких словарей на компьютеры бесперспективно. Это стало особенно очевидно в связи с развитием Интернета: большая часть Веб-страниц состоит из английских текстов, написанных живым современным языком, обильно использующим разговорную лексику и сленг. Вряд ли какой-либо из существующих англо-русских словарей может ответить на этот вызов. Решить данную задачу под силу лишь электронным словарям.

Пиши — Читай

Большинство “бумажных” словарей ориентировано на человека, читающего на иностранном языке, то есть человека, который в непонятном ему тексте находит “опорные” слова, помогающие выстроить общую смысловую картину. Человек “пишущий”, кроме знания всех используемых слов, должен четко представлять, как эти слова сочетаются друг с другом, какие предлоги при этом используются, есть ли устойчивые выражения, передающие необходимый смысл.

Увы, если “бумажный” словарь и удовлетворяет нужды Читателя, то уж интересы Писателя на неродном языке он чаще всего попросту игнорирует! А ведь в наш век электронных коммуникаций Писателем стал практически каждый пользователь Интернета!

И здесь электронный словарь оказывается намного полезнее “бумажного”. Даже буквальное воспроизведение приличного “бумажного” словаря на компьютере дает возможность извлечь из него столь необходимую Писателю информацию, похороненную в глубинах словарных статей. Например, пользователь может открыть на экране сразу несколько словарных статей, характеризующих все значения слова “достать” (брать, получать, надоесть и т. д.) как на одном языке, так и на другом, и, таким образом, изучить все нюансы использования слова.

Однако более правильный путь — подумать о Писателе заранее, при составлении словаря. Чтобы учесть его интересы, надо уметь описывать способы образования сложных словосочетаний. Например, как передать по-английски смысл “подтасовать или фальсифицировать результаты выборов”? Это выражение не относится к идеоматическим, потому его не следует искать в словнике целиком. С другой стороны, оно не может быть правильно переведено и по частям. Логичнее всего искать это выражение в статье “election” (выборы). Однако, чтобы оно там оказалось, нужно желание разработчиков словаря его туда поместить.

Чтобы Писатель смог почувствовать оттенки слова, необходимо привести в словаре максимально возможное количество синонимов - слов, близких по смыслу. Например, английский глагол break означает, в частности: 1) ломать, разрушать, разбивать и 2) рвать, разрывать, отрывать. Для первого случая синонимами будут слова crush (давить, дробить) и smash (разбиваться вдребезги). Второму значению близки слова separate (отделять, разделять - более деликатный смысл) и tear off (отрывать, срывать). Через общую “карту” синонимов становится яснее, как перевести на иностранный язык слово с тем или иным смысловым оттенком. Очень полезны иллюстрирующие примеры, особенно на использование слов с предлогами или в устойчивых словосочетаниях. Например: “уехать отсюда”, “уехать куда-то”, “уехать за чем-то”, “уехать” в значении “отсутствовать”.

Информацию о синонимах, словосочетаниях и случаях употребления правильнее всего предоставить на родном языке пишущего: если Писатель русский - то в русско-английском словаре, если он англичанин - то в англо-русском. Ни для кого не секрет, насколько лучше помогают толковые английские словари при решении мучительной проблемы, какое слово употребить. А вот жесткая ориентация словаря на перевод, а не на ОПИСАНИЕ языка делает его использование Писателем непростым и неочевидным.

Место лексикографа - в строю

Электронный словарь - живой организм. После его создания работа лексикографа не только не прекращается, а становится напряженнее. Каждое новое слово, словосочетание или фразеологический оборот, вошедшие в повсеместное употребление, а также новые значения привычных слов и понятий должны как можно скорее появиться в электронном словаре и занять подобающее им место в словарной статье. Вот почему важно привлекать к разработке электронных словарей не только программистов, но и специалистов по языку — лингвистов и лексикографов.

См. в номере на ту же тему

А. ШИШЛОВА - Электронные словари на компакт-дисках.

Г. ШМЕРЛИНГ - Что бы это значило? Ответ - в сети.

Читайте в любое время

Другие статьи из рубрики «Человек и компьютер»

Детальное описание иллюстрации

Две статьи из разных словарей. В статье из словаря LingvoUniversal —E (фото справа) добавлены современные значения слова cookie, используемые в компьютерной лексике. Левое фото — статья из “Нового большого англо-русского словаря” под редакцией Э. М. Медниковой и Ю. Д. Апресяна, издание 1993 года.
Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее