2009г. О формализованном представлении лексических значений «голубоглазость» или «толстостенность» в англо-русских составных терминах

Из: с. 128-136. Материалы II Международной научно-практической конференции «Информационные технологии в гуманитарном образовании», Пятигорск, 22-23 апреля 2009 года. ГОУ ВПО «Пятигорский государственный лингвистический университет», 2009. – 554с.
В.И. Глумов
(Нижний Новгород, Россия)
О ФОРМАЛИЗОВАННОМ ПРЕДСТАВЛЕНИИ ЛЕКСИЧЕСКИХ ЗНАЧЕНИЙ «ГОЛУБОГЛАЗОСТЬ» ИЛИ «ТОЛСТОСТЕННОСТЬ»
В АНГЛО-РУССКИХ СОСТАВНЫХ ТЕРМИНАХ
Victor I. Gloumov
About how to formally describe lexical meanings “blue-eyedness”
or “thick-walledness” in English and Russian multiword terms
Nizhny Novgorod, Russia
| Скачать статью в pdf формате |
|
Abstract. The meanings like blue-eyedness (a blue-eyed girl, a girl with blue eyes), thick-walledness (a thick-walled tank, a tank with thick walls), long-tailedness (a long-tailed dog, …), concrete-surfacedness (a concrete-surfaced runway, a runway with a concrete surface), long-nosedness (a long-nosed man, …), good-heartedness (good-hearted people, …), a 40-legged insect (= centipede) Сороконожка are thought to be similar in their abstraction. There is suggested an algorithm to analize or synthesize such lexical units via a use of a specially arranged Knowledge System. When being analized or synthesized, a two-word term like “a flat-bottomed boat” is suggested to be thought as holding two things fastened by a whole-part relation, the part being thought to be some inalienable portion of the whole. This inalienability is declared in the Knowledge System.
|
Реферат. Думается, что значения вида голубоглазость (голубоглазая девушка, девушка с голубыми глазами), толсто-стенность (толстостенная цистерна, цистерна с толстыми стенками), длинно-хвостость (длиннохвостая собака, …), бетонная поверхностность (взлетная полоса с бетонной поверхностью, бетонная взлетная полоса), длинноносость (длинноносый мужчина, …), добросердечность (добро-сердечные люди, люди с добрыми сердцами), сороконожка (насекомое с 40 ногами) одинаковы своей абстрактностью. Предлагается алгоритм анализа или синтеза таких лексических единиц с использованием специальной Системы Знаний. При анализе или синтезе сочетаний вида плоскодонная лодка (=плоскодонка) предлагается считать, что два предмета (лодка и дно) связаны отношением «целое-часть», часть при этом неотъемлемо принадлежит целому. Эта неотъемлемость заявлена в Системе Знаний. |
При моделировании семантической линейно-организованной структуры составного термина (compound) мы исходим из положения о том, что в составном термине реализуется некая глубинная структура, компоненты которой связаны вполне определенными явными или скрытыми отношениями. Содержание или смысл этих отношений отражает реальные материальные сущности и реальные отношения между ними. Нелингвистическое отражается или выражается в знаке с помощью значений лингвистических.
В [Глумов - 1986, с.86-134] подробно и в [Глумов - 2008] частично описана семантическая триада <субъект-действие-объект>, которую предлагается считать стержнем в линейно-организованной семантической структуре многословного термина. Другие семантические признаки вида <инструментальность>, <локативность>, <материальность> возникают слева или справа от каждого актанта этой триады. Существует гипотеза [Поспелов - 1981,с.35-36] о существовании в языке около 200 базовых семантических признаков. Возможно, что выявленные нами 19 семантических признаков по своей абстрактности могут быть включены в это число базовых признаков. Каждый из 19 семантических признаков был описан [Глумов - 1986] тремя аспектами: 1) определением объема содержания признака, 2) набором грамматических средств его выражения в английском и русском языках, 3) формальной трансформационной процедурой для термина, несущего данный признак.
Формально описывая семантическую структуру многословного термина, мы пытаемся выработать единый подход к монотонному и устойчивому представлению наших признаков в терминах разных предметных областей, а в целом – создать единую методику моделирования семантики термина.
Такое формализованное представление содержания многословного термина может способствовать нормализации терминостроения, решить такую болезненную терминоведческую проблему, как совместимость или дружественность терминологических методик исследования – что будет способствовать объединению усилий терминологов. Знание глубинных структур или формул (А.И. Смирницкий) строения терминов полезно и для школьников и студентов, ибо оно может способствовать как более эффективному выражению научно-технической мысли, так и более эффективному усвоению терминируемых понятий. Начинающему же терминологу это знание может помочь оценить трудоемкость терминологических исследований [Глумов - 2008; 2008а] и устранить постоянно возникающую размытость (fuzziness) в определении своего объекта исследования.
Понимание триады как центра, вокруг которого располагаются другие абстрактности вида <инструментальность>, можно положить в основу построения высокоинформационных лексических единиц (ЛЕ) для контролируемых языков (controlled English и т.п.), для информационно-поисковых языков в моно- и полиязычных системах автоматизированного поиска документов.
Триада может быть выражена словесно (т.е. аналитически) или морфемно (т.е. синтетически). В нижеследующих примерах она выделена жирным курсивом: data-processing system (система обработки данных); program-debugging system (система отладки программ); data processor (процессор/обработчик данных); alphameric data reader (устройство считывания алфавитно-цифровых данных, считыватель алфавитно-цифровых данных); optical character recognizer (программа распознавания оптических символов, распознаватель оптических символов); flight simulator (имитатор полета); program loader (загрузчик программ, система/программа загрузки программ); высоко-скоростной решатель задач; зуборезный инструмент; соломорезательное оборудование; нефтеочистительный завод; энергосберегающая технология; ранозаживляющее средство; судостроительная верфь; водонагреватель; газонефтеанализатор.
Предлагаемые нами семантические признаки содержат один и тот же уровень абстрактности. По крайней мере, мы стремимся к такой гомогенности, однородности.
Препарируя линейно-упорядоченную структуру многословного термина, мы смотрим на термин как на некую линейную последовательность ниш (ячеек). Каждая ниша хранит один из наших семантических признаков. Есть ниша под названием субъект, есть ниша инструмент и т.д. В момент порождения научно-технической речи эти глубинные ниши заполняются конкретным лексическим материалом, конкретными лексическими значениями – исходя из целей речи, из плана говорящего выразить свою мысль.
Существует обширный слой слов вида thin-walled (толстостенный, т.е. с толстыми стенками), long-legged (длинноногий, т.е. с длинными ногами), warm-blooded (теплокровный, т.е. имеющий теплую кровь), blue-eyed (голубоглазый, т.е. с голубыми глазами), wide-winged (ширококрылый, т.е. с широкими крыльями), broad-leaved (широколиственный, т.е. с широкими листьями), big-boned (ширококостный, т.е. с широкой костью/костями), long-horned (длиннорогий, т.е. с длинным рогом/рогами), long-haired (длинношерстный, т.е. с длинными волосами), concrete-surfaced (с бетонной поверхностью) [например, concrete-surfaced runway (бетонная взлетная полоса, взлетная полоса с бетонной поверхностью)] и т.п. В таких сложных словах просматривается одна и та же семантическая идея. Ее мы условно назовем партитивностью или быть частью. Эта семантическая ниша заполняется лексическими (т.е. поверхностными) значениями вида голубоглазости (blue-eyedness), которые замечательно описаны проф. А.И. Смирницкий в [Смирницкий - 1956, c.118]. Эти значения мы назвали голубоглазостью условно, их можно назвать или длинноногостью (long-leggedness), или длиннорукостью (long-armedness), тонкостенностью (thin-walledness), ширококрылостью (large-wingedness) и т.д. Дело здесь не в названии, а в содержании признака.
Анализируя значение голубоглазости, мы неизбежно сталкиваемся с еще до сих пор нерешенной лингвистическая проблемой слова, сочетания слов, взаимодействия лексики и синтаксиса в языке. Решение этой проблемы могло бы повысить эффективность статистической обработки естественных текстов, формирования классов условной эквивалентности в многоязычных информационно-поисковых тезаурусах, и, вообще, автоматизацию анализа и синтеза текста.
Воспользуемся размышлениями А.И.Смирницкого [Смирницкий - 1956] об этой проблеме, но предварительно уясним себе смысл слов вида blackboard классная доска.
О словах вида blackboard. В таких словах идиоматичность и цельнооформленность соединены вместе.
Об идиоматичности. Под идиоматичностью понимается невыводимость значения целого языкового образования из совокупности значений входящих в него частей [Смирницкий - 1956, с.34]. Значение слова blackboard не является простой суммой значений их частей – black- и –board-. Классная доска может быть черной, коричневой, зеленой и т.п. И board – также не конкретная доска. Доской может служить часть стены и т.п. Представьте себе будущие цвета и фактические материалы, из которых будут сделаны классные доски.
Слово blackboard является единицей языка, т.е. в речи оно воспроизводится бесконечное количество раз. Это сложное образование не строится из его компонентов, а мыслится как классная доска в целом [Смирницкий - 1956, с.117].
О цельнооформленности. По своей цельнооформленности сложное слово blackboard сближается с простым словом, его способности изменяться в речи приближаются к способностям простого слова – и этим blackboard отличается от словосочетания.
Теперь об образованиях типа blue-eyed голубоглазый. Это – сложное прилагательное, в нем идиоматичность отсутствует. Общее его значение является сочетанием значений его компонентов blue- синий, голубой и -eye- глаз(а); и, например, blue-eyed children голубоглазые дети значит в основном то же, что и children with blue eyes (следует заметить, что в словосочетании with blue eyes семантическим эквивалентом суффикса –(e)d в blue-eyed является предлог with). Тем не менее, blue-eyed представляет собой сложное слово, а не сочетание слов, как with blue eyes, поскольку, в отличие от последнего оно является образованием цельнооформленным: его цельнооформленность определяется тем, что -eye- не оформлено в нем в отношении числа – в отличие от того, что мы находим при употреблении этой основы в качестве основы отдельного простого слова, выступающего либо в форме множественного eyes (ср. также one-eyed и one eye, many-eyed и many eyes), а также тем, что образование blue-eyed не допускает такого распространения его новыми компонентами, какое возможно в случае эквивалентного ему сочетания слов with blue eyes (ср. with large blue eyes; with large bright eyes; with their blue eyes и т.п.). При этом цельнооформленность слова blue-eyed дополнительно подчеркивается здесь тем, что словообразующий суффикс –(e)d относится в этом слове ко всему отрезку blue-eye-, как к целому, а не только к его компоненту -eye- (так как blue-eyed значит примерно голубые-глаза имеющий, а не «голубой глаза-имеющий») [Смирницкий - 1956, с. 118].
К этому замечательному доказательству цельнооформленности языковой единицы (даже при отсутствии идиоматичности) хотелось бы добавить, что компонент blue-eyed, наверное, можно также мыслить как голубыми-глазами-обеспеченный, голубыми-глазами-снабженный, голубыми-глазами-оборудованный. То есть мы хотим показать здесь присутствие грамматической пассивности.
Для тех, кто хотел бы строить эту конструкцию в речи сознательно, можно предложить такой прием или алгоритм.
Представьте себе, что вы мыслите себе следующую производственную ситуацию: «Есть подросток и нужно выразить на английском языке мысль, что у подростка «неотъемлемо» имеются голубые глаза, т.е. что он – голубоглазый или с голубыми глазами». Сформируйте – мысленно или в вашей формализованной Системе Знаний – английское сложное прилагательное с помощью следующих шагов.
Шаг 1. Вообразите себе некую абстрактную Систему Знания или информационно-поисковый тезаурус, в которых задано понятие ЧЕЛОВЕК или ЛЮДИ. Наш подросток принадлежит этому классу.
Шаг 2. Присвоим нашему подростку некоторые условные признаки – ПЛЕЧО (shoulder), ГОЛОВА (head), НОС (nose), УХО (ear), СЕРДЦЕ (heart), ДУША (soul) и т.п. (Или построим такие утверждения: подросток ИМЕЕТ плечи, подросток ИМЕЕТ душу, и т.п.).
Шаг 3. Каждый признак может принимать конкретное значение: плечи ЕСТЬ широкие, shoulders ARE broad, нос ЕСТЬ длинный, nose IS long, душа ЕСТЬ добрая, soul IS good, и т.п. (Другие виды записи этих утверждений мы пока опускаем).
Шаг 4. Взяв значение LONG признака NOSE, мы образовали комплекс long-nose , которому затем присвоим форму причастия прошедшего времени. Получилось long-nosed = длинноносый, т.е. с длинным носом, имеющий длинный нос, «оснащенный или оборудованный длинным носом».
В результате мы получили a long-nosed teenager или a teenager with a long nose.
Испытайте этот алгоритм в другой ситуации – ситуации с кошкой, которая имеет длинный хвост, с собакой, имеющей черную шерсть, и т.п. Получим long-tailed, black-haired.
Возьмем другую предметную область. Пусть есть ситуация взлетная полоса (runaway), взлетная полоса имеет поверхность (surface), и эта поверхность ЕСТЬ бетонная (concrete). Полученное образование concrete-surfaced runway (бетонная взлетная полоса) структурно ничем не отличается от long-tailed dog (длиннохвостая собака), long-nosed teenager и им подобным.
Теперь опишем ситуацию с цистерной (tank), имеющей стенки (wall), которые есть тонкие (thin). Не забывая о пассивности, получим
a thin-walled tank (тонкостенная цистерна).
Длиннохвостость (long-tailedness), бетонноповерхностность (concrete-surfacedness), длинноносность (long-nosedness), добросердечность (good-heartedness), тонкостенность (thin-walledness) по абстрактности ничем не отличаются от голубоглазости (blue-eyedness) в заглавии нашей статьи.
Абстракции вида голубоглазость являются значениями лексическими.
Абстракции вида субъект, действие, объект, инструментальность, локативность (место) и т.п. принадлежат более высокому уровню абстракций, более высокому уровню значений. На этом уровне уже нет лексической конкретности. Это – уровень грамматической абстрактности. Признаки этого уровня есть грамматические, а не лексические.
Теперь несколько слов о возможных приложениях голубоглазости.
Алгоритм формализованного описания содержания сложного слова вида blue-eyed голубоглазый, предложенный А.И. Смирницким, можно применить при проектировании лексических единиц (ЛЕ) для информационно-поискового тезауруса (ИПТ), когда проектировщик тезауруса оказывается перед весьма сложной проблемой – какие типы связей должны быть допустимы между элементами внутри составных терминов, которые будут играть роль дескрипторов, а какие типы связей будут выражены в лексических единицах, лежащих вне этого тезауруса. При необходимости, и внутренние и внешние лексические единицы будут соединяться в поисковом образе документа (ПОД) с помощью искусственных грамматических средств. Построенные таким образом цепочки из терминов могут распознаваться автоматически. Внетезаурусные связи тогда останутся единственным, что будет порождать поисковый «шум».
Этот алгоритм может найти применение и в любых системах автоматического анализа и синтеза текста – в машинном переводе (МП), в системах автоматического сжатия текста и т.п.
Опишем возможности этого «голубоглазого алгоритма» {Дополнение 1, см. в конце статьи} подробнее.
Содержание сложного слова вида blue-eyed голубоглазый мы предлагаем формально описывать с помощью некоего объектно-признакового языка, в котором, скажем, объект (teenager подросток) представлен конечным набором признаков (глаза, нос, волосы, плечи, руки, ноги, сердце, душа и т.п.). (Примитивы или нулевые трансформационные предложения подробно описаны в [Глумов - 1986,с.90-93])
Здесь уместно вспомнить описание онтологического подхода и понятия ситуации у В.В.Богданова [Богданов - 1996]. Описывая проблемы, возникающие при формализованном представлении смысла предложения, В.В. Богданов пишет [Богданов - 1996, с.163]: «Сущность онтологического подхода заключается в том, что исходным пунктом для построения смысла предложения считается онтология, т.е. отражаемая языком экстралингвистическая действительность. Минимальным компонентом ее, который может описываться предложением, принято считать ситуацию или факт. В соответствии с этим исследование смысла предложения обычно начинается с определения понятия ситуации и с классификации ситуаций, каждой из которых ставится в соответствие определенная семантическая структура, лежащая в основе того или иного предложения.
Определения ситуации, которые встречаются в научной литературе, не отличаются достаточной ясностью. Ситуация, по мнению Л. Витгенштейна (L.J.J. Wittgenstein), есть то, что имеет место» [Витгенштейн - 1958].
Следует особо сказать о так называемой неотъемлемости. Если мы формируем некий искусственный язык, который должен быть способным покрывать текстовые ситуации вида good-souled добродушный и great-souled великодушный, тогда мы заранее должны зафиксировать тот факт, что признак soul душа является неотъемлемой частью, скажем, объекта человек.
При построении искусственной Системы Знания такую неотъемлемость можно зафиксировать с помощью каскада из специальных трансформационных предложений (см. Схему 1 на стр. 10).
Об обязательности неотъемлемости. Отношение «иметь в качестве неотъемлемой части», задаваемое между единицами формализованного языка, характеризуется жесткой прагматичностью. Если вдуматься, мы прагматичны постоянно. Описывая любой предмет ограниченным числом признаков, мы огрубляем действительную картину мира. Ведь предмет бесконечен, его описать полностью нельзя, иногда описанию одного понятия посвящают целые книги. Так и в нашем случае – часть человеческого тела мы считаем неотъемлемой, а 100 рублей – отъемлемой вещью. Здесь невольно вспоминается та «блоха» Чарлза Филлмора (Charles J. Fillmore), которая, как он заметил в своей книге The Case for Case (1968) (Дело о падеже), у некоторых африканских племен считается частью неотъемлемой.
Неотъемлемость приходиться специально оговаривать особенно при построении более длинного каскада трансформаций [Глумов - 1986, с.126-132] для формализованного представления семантической структуры терминов, в которых имело место явление метонимии, т.е. присутствует большая доля образности. К таким терминам относятся следующие вычислительные термины: binary control, двоичное управление, binary arithmetic, двоичная арифметика, binary memory, двоичная память, «полуцветная» память, black memory (букв. черная память, т.е. память содержащая данные, описывающие четные образы) и т.п.
Об одноглазости: one-eyed одноглазый. Этот случай можно считать лишь частным случаем голубоглазости. Для этого случая последнее трансформационное предложение будет иметь вид: eye IS one (глаз ЕСТЬ один). Примеры: a one-armed man (однорукий мужчина), a one-bedded room (одноместный номер гостиницы), a three-bladed propeller (трехлопастный пропеллер, пропеллер с тремя лопастями), a four-engined aircraft (четырехмоторный самолет).
О многоглазости: many-eyed многоглазый. Этот случай можно считать также лишь частным случаем голубоглазости. Для этого случая последнее трансформационное предложение будет иметь вид: eyes ARE many (глаз – много). Примеры: many-sided configuration (многосторонняя конфигурация), many-sided decision (многостороннее решение), many-storeyed building (многоэтажное здание).
Схема 1. Термин и его примитивы
|
Словосочетание |
|
Проверочные трансформации (примитивы) |
|
red-cheeked teenager краснощекий подросток |
|
teenager HAS cheeks подросток ИМЕЕТ щеки cheeks ARE red щеки ЕСТЬ красные или
teenager “IS=EQUIPPED=WITH” cheeks подросток “ОБОРУДОВАН” щеками cheeks ARE red щеки ЕСТЬ красные |
Или трансформация (для плоскодонная лодка) может иметь такой вид:
|
If a boat HAS bottom and if its bottom IS flat then a flat-bottomed boat |
Если лодка ИМЕЕТ дно и если ее дно ЕСТЬ плоское , тогда плоскодонная лодка |
РЕЗЮМЕ
В научно-технической речи (письменной и устной) часто встречается лексическое значение голубоглазости или плоскодонности, обеспеченности=голубыми=глазами, обеспеченности=плоским=дном и т.п.. Нет нужды запоминать сам терминоэлемент, выражающий эту идею, нет надобности запоминать лексическое воплощение этой идеи, а нужно лишь знать содержание предложенного нами алгоритма построения терминоэлемента с такой семантикой. Условно назовем этот алгоритм «голубоглазым». С его помощью можно строить «голубоглазые» терминоэлементы в любой области знания. Иными словами, Вы уподобляетесь математику, забывшему формулу, но тут же готовому ее вывести, потому что он знает процедуру, алгоритм ее вывода. Он знает, КАК вывести формулу.
Значение линейно-организованной формулы blue-eyed и является, по-видимому, лингвистической единицей, т.е. это значение – как и любая языковая единица – «дремлет» в языке и всплывает на лексический уровень, чтобы быть реализуемой в речи. Реализация наступает по мере необходимости человека выразить свою мысль. Мы усматриваем здесь случай, когда язык с помощью ограниченного числа своих средств формирует бесконечный поток речи.
Наш подход с семантическими нишами, заполняемыми конкретными лексическими значениями, и с ужесточенной трансформационной проверкой содержания синтагматической связи между двумя элементами в пределах составного английского термина можно применить для построения оптимальных лексических единиц поискового тезауруса. Его также можно использовать и в других приложениях, где возникает проблема смысла лингвистического знака.
ЛИТЕРАТУРА
(Богданов – 1996) В.В. Богданов. Моделирование семантики предложения. (с. 161-200) В: Прикладное языкознание. Учебник. (Отв. редактор А.С. Герд). С.- Петербургский государственный университет. Санкт-Петербург, издательство С.-Петербургского университета, 1996. – 526с.
(Витгенштейн – 1958) Л. Витгенштейн. Логико-философский трактат. (Перев.с англ.) Москва, 1958.
(Глумов – 1986) В.И. Глумов. Структурно-семантическая организация составных терминов русского и английского языков (на материале текстов по вычислительной технике и программированию). Дис. на соиск. уч. степени к. филолог. н. (10.02.21 – структурная, прикладная и математическая лингвистика). Горький, Горьковский государственный университет им. Н.И. Лобачевского, 1986. – 168с. (Приложение – 81 с.)
(Глумов – 2008) В.И. Глумов. Распознавание составного термина в тексте и подготовка к машинной обработке (нулевой этап). (с. 41-62). Материалы межрегиональной научно-практической конференции «Научно-методическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования», Нижний Новгород, Филиал Российского государственного университета (РГГУ) в г. Нижнем Новгороде, 23-24 октября 2008 года. Нижний Новгород, издание Филиала РГГУ в г. Нижнем Новгороде, 2008. –278с.
(Глумов – 2008а) В.И. Глумов. Статистико-вероятностные особенности поверхностной структуры английских и русских составных терминов (первый этап). (с. 62-81). Материалы межрегиональной научно-практической конференции «Научно- методическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования», Нижний Новгород, Филиал РГГУ в г. Нижнем Новгороде, 23-24 октября 2008 года. Нижний Новгород, издание Филиала РГГУ в г. Нижнем Новгороде, 2008. – 278с.
(Поспелов – 1981) Д.А. Поспелов. Логико-лингвистические модели в системах управления.–М.:Энергоиздат, 1981. –231с.
(Смирницкий – 1956) А.И. Смирницкий. Лексикология английского языка. -М., изд-во литературы на иностранных языках, 1956. – 260с.

