2009г. Роль триады и метонимии в семантической организации составного термина

РОЛЬ ТРИАДЫ И МЕТОНИМИИ В СЕМАНТИЧЕСКОЙ ОРГАНИЗАЦИИ
СОСТАВНОГО ТЕРМИНА
Виктор Глумов
Нижний Новгород, Россия
Филиал Российского Государственного Гуманитарного Университета в г. Нижний Новгород
Из: Сборник трудов участников Пятой Международной конференции «Горизонты прикладной лингвистики и лингвистических технологий (“MegaLing-2009”),
направление конференции: Интеллектуальные системы обработки языка,
Киев, Украина, сентябрь 2009 года, с. 134-160.
| Скачать статью в pdf формате |
Аннотация. Выявленные в английских и русских составных терминах (компаундах-compounds) и формально описанные 20 семантических признаков вида инструментальность, количественность, локативность и т.п. считаются уточнителями некоторого центра в семантической структуре компаунда. Этим центром предлагается считать универсальную семантическую триаду <субъект-процесс-объект>, реализуемую в компаунде полностью или частично. Прямые или косвенные отношения между элементами компаунда зафиксированы в специальном тезаурусе. Формализация содержания связей в пределах компаунда затрудняется широко распространенным явлением метонимии. Возникающие своеобразные метонимические провалы (pits) между смыслами элементов компаунда предлагается «мостить» каскадом, составленном из базовых 3-хчленных предложений (примитивов). Каждый хранимый в тезаурусе примитив выражает прямые парадигматические связи между признаками терминируемого понятия. Предлагаемый подход может способствовать построению эффективных лексических единиц, столь ожидаемых многочисленными приложениями.
Ключевые слова: составные термины (компаунды), семантическая структура термина, онтология, примитивы, метонимия, каскадирование.
Abstract. Recognized within English and Russian multiword terms (compounds) and represented formally, 20 semantic features similar to instrumentality, quantitativeness, locativeness and the like are thought to specify some core or centre within a lineally-arranged compound semantic structure. A certain universal semantic triad <subject-process-object> is suggested to be such a centre. Direct and indirect relations within the body of a compound are specially declared in the thesaurus. Formalizing interelement relations within a compound is heavily hampered by the presence of widely spread metonymy. The emerging metonymical pits between the semantic features of the compound are suggested to be bridged via certain cascades compiled of basic 3-member sentences called primitives. Each thesaurus-held primitive declares immediate paradigmatic links between features of the notion concerned. The approach suggested may be found useful for constructing efficient lexical units so much awaited by their numerous applications.
Keywords: compounds, term semantic structure, ontology, primitives, metonymy, cascading.
Содержание
ПЕРВЫЙ ЭТАП НАБЛЮДЕНИЯ НАД ТЕРМИНСТРУКТУРОЙ
А) Статистико-вероятностное поведение морфологических классов в английском термине
Рис. 1. Вероятности появления английских морфологических классов
в позициях терминоструктуры
Случай 1. Ядро хранит <действие-существительное>
(N-1 N*) (image digitization)
Случай 2. Ядро хранит <действие-герундий>
(N-1 Ger*) (laser programming)
Случай 3. Ядро хранит часть-существительное
(N-1 N*) (computer memory)
Случай 4. Ядро хранит действие-отглаг. существительное
(ADJ-1 VN*) (manual processing)
Случай 5. Ядро хранит действие-существительное
(N-2 ED-1)ins N*action (computer-#aided design)
Случай 6. Ядро хранит целое-существительное
(N-1 N*) (core memory)
Гистограмма 2. Распределение вероятностей появления морфологических
классов в пре- и постпозициях русской и английской терминоструктур
Б) Выводы по первому этапу наблюдения над терминоструктурой
Таблица 3. Морфологическая плотность в пре- и постпозициях
ВТОРОЙ ЭТАП НАБЛЮДЕНИЯ НАД ТЕРМИНОСТРУКТУРОЙ
Линейность семантической организации термина
Особенности распознавания семантического признака
О семантической триаде
Способы реализации триады в компаундах
Полная реализация триады
Частичная реализация триады
О неактантных семантических признаках
Пример описания признака <инструментальность >
Аспект 1. Описание содержания признака
Аспект 2. Примеры лексического выражения признака
(из специализированного тезауруса)
Аспект 3. Морфолого-семантическое описание признака
Аспект 4. Трансформационная процедура
Особенности актантов
1) Сила межактантных связей
2) Абстрактность морфемы “-ER”
О МЕТОНИМИИ И КАСКАДИРОВАНИИ
О «ГОЛУБОГЛАЗОСТИ», «ТОНКОСТЕННОСТИ», «ЧЕТЫРЁХМОТОРНОСТИ»
ВЫВОДЫ ПО СЕМАНТИЧЕСКОМУ ЭТАПУ НАБЛЮДЕНИЯ ЗА ТЕРМИНОСРУКТУРОЙ
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ДОПОЛНЕНИЯ
Дополнение 1
Дополнение 2
Дополнение 3
Дополнение 4
Дополнение 5
ИНФОРМАЦИЯ
* * *
Автоматический анализ и синтез текста, машинный перевод, автоматическое извлечение информации из текста (data mining), объектно-признаковые языки, языки программирования, а также многоязычный поиск информации (cross-language search) (в котором дескриптор чаще всего имеет вид составного термина и на дескриптор порой накладывается требование по длине), нормализация и стандартизация отраслевых терминологий, сфера образования (где эффективно построенный термин может способствовать оптимальному усвоению отраслевых понятий) – вот далеко не полный перечень областей, нуждающихся в оптимально построенном термине.
Планируя наблюдение над внешней и глубинной структурами термина, мы считаем, что наибольшими трудностями в этом наблюдении могут быть:
1) определение объема содержания понятия «терминоэлемент» (Этот термин впервые был предложен Д.С. Лотте в [Лотте – 1940]). Это понятие является принципиальным при нормализации и стандартизации терминологий, при формировании терминосистем с наименьшим количеством терминоэлементов, при описании процессов свёртывания и развёртывания терминоструктуры и т.д.;
2) распознавание терминированности или нетерминированности того или иного терминоэлемента; например, в термине первая космическая скорость следует распознавать специальное отраслевое значение, возложенное на обыденное слово первая. Терминированность, а именно значение количественности, следует видеть и в терминах вида лёгкий бетон [Тезаурус БЕТОН – 1981, с. 22], тяжёлый бетон [Тезаурус БЕТОН – 1981, с. 26], особо тяжёлый бетон [Тезаурус БЕТОН – 1981, с. 26].
В нашем случае объектом исследования являются английские и русские составные термины (компаунды) английского и русского подязыков цифровой вычислительной техники и программирования.
Примечание 1. Современная литература на английском языке для названия «составной термин» предлагает однословный термин – компаунд (a compound) , а сам же процесс построения компаунда назван компаундированием (compounding). Нужно признать, что эти английские имена отличает отсутствие описательности и присутствие системности (a compound – compounding). По-видимому, это есть как раз тот случай, когда калькирование иностранного термина полезно, а не вредно. Назвать же составной термин «соединением», а процесс формирования таких соединений каким-то туманным сочетанием (вспомним «соединение химическое», «соединение военное и т.п.) – такая попытка чревата еще бо́льшей неразберихой. Это лишний раз подтверждает мысль о важности эффективно построенного терминологического знака.
Каждый термин может одновременно иметь как пре-, так и постпозицию.
Извлеченный текстовый термин подвергался двухэтапной обработке: 1) моделированию его внешней или поверхностной структуры [Глумов – 1986; Глумов – 2008] и 2) моделированию его семантической (или глубинной) структуры [Глумов – 1986].
I. ПЕРВЫЙ ЭТАП НАБЛЮДЕНИЯ НАД ТЕРМИНОСТРУКТУРОЙ
На первом этапе исследования каждый элемент в наблюдаемом компаунде был представлен тремя формальными признаками – морфологическим, позиционным и синтагматическим.
Такое – безусловно трудоёмкое – описание терминоэлемента отвечало особенностям внешнего выражения связей в английских и русских терминах. Позиционный и синтагматический признаки особенно необходимы для представления английских терминов, ибо – согласно классику английского языкознания Г. Суиту (Henry Sweet) и Ч. Фризу (Ch. C. Fries) [Fries – 1952, p. 94)] – само местоположение слова в словосочетании имеет вполне определённое значение. Эту роль позиции элемента в так называемой «формуле» строения сложных лингвистических образований подчеркивал и А.И. Смирницкий [Смирницкий-1956, с. 19; Смирницкий-1957, с. 37].
Укажем особенности формирования поверхностной модели компаунда.
1) Описание каждого элемента компаунда с помощью вышеуказанных признаков составляет поверхностную модель компаунда. Признак «поверхностная» несколько усло́вен, ибо распознать термин в тексте, затем распознать в нём элементы, соотнести каждый элемент с одним из морфологических классов (tagging), зафиксировать связь между элементами – эти операции возможны лишь на логико-семантических основаниях.
2) Компонентом нашей модели является и сам извлечённый из текста термин. В результате, такая модель – однажды сформированная – становится не́ким микробанком, к которому можно программно и неоднократно обращаться с поисковыми запросами – разумеется, в пределах тех сведений, что были вручную заложены в него предварительно [Глумов – 1986; 2008].
3) В терминах нижеуказанных видов мы усматривали присутствие двух элементов.
Примечание 2. На этапе предмашинной обработки термина границы между его элементами обозначались следующими условными знаками: грамматически главный элемент (т.е. ядро) обозначался знаком * (звезда); искусственно созданная граница между элементами обозначалась знаком # (решётка) , а знаком A обозначалось, напротив, объединение двух наборов символов – например, *оператор GOATO. В текстовых терминах вида *statement GO TO, GOTO *statement терминоэлемент GO TO может иметь постпозитивную форму GO TO (*statement GO TO) или препозитивную форму GOTO (GOTO *statement). Так что распозновать такой терминоэлемент (вручную или автоматически) пам придёться только на логико-семантических основаниях.
Укажем некоторые примеры.
а) H-#*data; холлеритные *данные; C-#*compiler (т.е. транслятор программ, написанных на языке С; или транслятор С-программ); GOTO *statement (оператор GO TO);
б) many-sided *configuration; многосторонняя *конфигурация; read-only *memory; постоянная *память;
в) FORTRAN-#*compiler; ФОРТРАН-#*транслятор (т.е. транслятор для ФОРТРАН-программ); RAM-#*memory (= random-#access *memory, т.е. память с произвольной выборкой/доступом).
Если же термин вида ФОРТРАН-транслятор имел и описательный вид – скажем, транслятор для ФОРТРАН-программ, тогда фиксировалось наличие 4 элементов: *транслятор для ФОРТРАН-#программ). (Второе значение этого термина здесь не обсуждается.) 4) Формирование поверхностной модели предполагает разбиение компаунда на элементы.
Такое разбиение возможно только на семантических основаниях. Например, искусственный пробел ставился в случае дельта-#*конфигурация, но не ставился в случае delta-like дельтаобразный, потому что delta и delta-like принимались нами выражающими один и тот же семантический признак <сходство, подобие> . (Сравните также присутствие <сходства> в рыбном термине *рыба-#звезда и в строительном термине сэндвич-#*панель).
По мере усложнения содержания информационных потребностей описательные возможности нашей модели можно наращивать, т.е. встраивать новые внешние (а со временем и глубинные) признаки и этим готовить модель для удовлетворения все более растущих «интеллектуальных» потребностей пользователя.
Машинной обработке подвергались 4 экспериментальных массива, а именно: 1) массив из 2000 английских составных терминов, 2) массив из 2000 русских составных терминов, 3) массив из 2000 английских поверхностных моделей и 4) массив из 2000 русских поверхностных моделей. В терминологических массивах один термин употреблялся только один раз. Английские термины на русский язык не переводились. И английские и русские термины извлекались из неадаптированных текстов [Глумов – 1986].
Предлагаемая поверхностная 3-хпризнаковая модель позволяет выявить частоты длин составных терминов (длина измеряется в терминоэлементах), частоты морфологических категорий в терминоструктуре, частоты морфологических конструкций терминов, а также выявить частоты появления конкретных морфологических категорий в той или иной позиции терминоструктуры.
Также возникает возможность:
а) сформировать ранжированный перечень синтагматических цепей вида
![]() |
и т.д.? |
К массивам английских и русских моделей становиться возможным обращаться со следующими поисковыми запросами:
а) какова длина (в терминоэлементах) каждого термина экспериментального массива и какова частота терминов такой длины?
б) какова частота морфологических классов в терминах по всему экспериментальному массиву?
в) каковы статистика и вероятность появления морфологических классов в той или иной позиции терминоструктуры, например, в 1-й и 2-й препозициях или во 2-ой постпозиции и т.д.?
г) сформировать ранжированный перечень морфологических конструкций;
д) какова частота цепей синтагматических связей вида
![]() |
и т.д.? |
е) сформировать ранжированный перечень всех синтагматических цепей, выявленных в экспериментальном массиве терминов данного подъязыка;
ж) какие элементы появляются, например, в позиции «ядро», или в позиции «-1» (т.е. непосредственно слева от ядра), или в позиции «1» (т.е. непосредственно справа от ядра) и т.д.
Ниже укажем некоторые статистико-вероятные результаты машинной обработки поверхностных моделей [Глумов – 1986; Глумов – 2008].
Примечание 3. В примерах и рисунках применялись следующие условные обозначения.
а) английские морфологические классы:
N – английское существительное общего падежа;
Nacr – существительное-акроним (например, элемент ROM- в термине ROM-#memory постоянное запоминающее устройство, ПЗУ;
N-1 и N1 – существительное в 1-й препозиции или 1-й постпозиции относительно ядра;
ING и ED – причастие-I и причастие-II;
VN – отглагольное существительное;
GER* – герундий, являющийся ядром составного термина;
ADJ – полное или краткое прилагательное;
ADJ1– сложно-составное прилагательное вида errorproof устойчивый от ошибок, сбоеустойчивый;
I – идентификатор, т.е., например, элемент RESIDENT в термине RESIDENT-#*routine стандартная программа RESIDENT. б) русские морфологические классы: C* C1род С2род – однопризнаковая модель термина, содержащая существительное в ядерной позиции (С*), существительное родительного падежа в 1-ой постпозиции (С1род) и существительное родительного падежа во 2-ой постпозиции (С2род).
Предлоги указаны в круглых скобках (см. Рис. 1).
А) Вероятностное поведение морфологических классов в английском термине
На Рис. 1 в колонках общая сумма вероятностей появления морфологических классов и конкретних предлогов в конкретной позиции терминоструктуры равна единице. Классы или предлоги с вероятностью меньше 0,01 в столбцах не указаны. На этом рисунке с помощью «волн» мы хотим лишь показать некую динамику изменений активности морфологических классов в конкретных позициях влево и вправо от ядра термина.
Используя наши семантические признаки, которые будут описаны во второй части нашего доклада, кратко опишем сейчас поведение некоторых морфологических классов в зависимости от того, какой семантический признак появляется в ядерной позиции термина, т.е. становится грамматически господствующим.
Возьмём на Рис.1 конкретную точку, а именно 1-ую препозицию. На рисунке видно, что в этой точке самым активным является существительное. Если и ядро (*) структуры выражено существительным, тогда мы имеет конструкцию N-1N*. Частоту этой конструкции отмечают многие исследователи. Мы же пойдем дальше и попытаемся описать семантически причины появления морфологического класса в 1-ой препозиции.
Случай 1. N-1N* (ядро хранит категорию <действие>)
Итак, для случая N-1 N* что будет происходить в 1-ой препозиции, если ядерная позиция (*) будет занята глубинным признаком <действие>?
а) Тогда в 1-й препозиции может появится признак <объект>-существительное.
Например: program compilation (трансляция программ); image digitization (оцифровка изображений);
б) может появиться признак <инструментальность>-существительное.
Например, computer programming (машинное программирование, т.е. программирование с помощью машин); computer synthesis (машинный синтез, т.е. автоматизированный синтез, синтез с помощью ЭВМ).
Случай 2. N-1 GER* (ядро хранит <действие>)
Если ядро занято признаком <действие>, но оно выражено морфологическим классом «герундий», тогда 1-ая препозиция может быть оккупирована признаком <инструментальность>: laser programming (лазерное программирование).
Случай 3. N-1 N* (ядро хранит <часть>)
Если же ядро занято признаком <часть>, тогда 1-ая препозиция может быть оккупирована признаком <целое>: computer memory (машинная память, т.е. память машины).
Случай 4. ADJ-1 VN* (ядро хранит <действие>)
Если же ядро и 1-ая препозиция выражены вышеуказанной поверхностной конструкцией (прилагательное–отглагольное существительное), тогда – при ядре-<действие> – 1-ую препозиции может занять признак <инструментальность>: automatic processing (автоматическая обработка); half-automatic processing (полуавтоматическая обработка); manual processing (ручная обработка).
На Рис.1 прилагательное оккупирует 1-ую препозиции с вероятностью 0,14, но это не значит, что эта вероятность принадлежит только <инструментальности>. Здесь прилагательное может выражать и другие глубинные признаки.
Рис.1. Вероятности заполнения морфологическими классами позиций английской терминоструктуры
Случай 5. (N-2 ED-1)ins N*action (ядро хранит <действие>)
Если ядро занято признаком <действие> (N*action) и мы имеем вышеуказанный морфологический случай , тогда 1-ую препозицию занимает причастие прошедшего времени (ED-1), а 2-ую существительное (N-2). Отметим, что в данном случае инструментальность выражается двумя терминоэлементами – (N-2 ED-1)ins: computer-aided analysis автоматизированный анализ, т.е. анализ с помощью ЭВМ; computer-aided design машинное проектирование; computer-based data processing автоматизированная обработка данных. (Сравните морфологическое выражение инструментальности в виде «наречие - причастие прош. вр.» в терминах другой тематической области: ionically-damaged layers (слои кристалла, разрушаемые ионным способом, т.е. с помощью ионов)).
Случай 6. N-1 N* (ядро хранит <целое>)
И наконец, возьмем случай N-1 N* c ядром-<целое>. Здесь препозитивное существительное N-1 может обозначать признак <часть>: core memory (стержневая память, т.е. память на магнитных стержнях).
Примечание 4. Как часто в позициях терминоструктуры встречаются сами глубинные признаки – такое сверхтрудоёмкое наблюдение могло бы составить отдельную тему логико-лингвистического исследования. Но к этому семантическому наблюдению все равно надо стремиться, ибо только на основе вероятностных сведений о поведении глубинных признаков в теле составного термина можно будет затем думать об автоматизации их распознавания.
Трёхпризнаковое описание каждого терминоэлемента позволяет нам сравнить английскую и русскую терминоструктуры (см. Гистограмму 2), увидеть особенности расширения каждой терминоструктуры влево {Дополнение 1, см. в конце статьи}.

Гистограмма 2. Распределение вероятностей появления морфологических классов
в пре- и постпозициях русской и английской терминоструктур
Гистограмма 2 показывает, что русская терминоструктура имеет тенденцию расширяться вправо от ядра (nucleus), а английская влево (left and right extensions). В русской постпозиции (right) выявлено 50,56% употреблений морфологических классов от всего количества их употреблений в экспериментальном массиве русских терминов, а препозитивные классы составили лишь 18,29% , т.е. почти в 3 раза меньше, чем в постпозиции. Правое расширение русской терминоструктуры (*система обработки данных, *устройство высокоскоростной оцифровки оптических изображений) привносит некую описательность термину, делает его похожим на предложение дефиниции. (Cр. *самолет с изменяющейся геометрией крыла, *больной с высоким хирургическим риском).
Английская же терминоструктура имеет явную тенденцию к левому расширению – 47,51% (two-pass *compiler двухпроходной *транслятор, binary-coded decimal *representation двоично-закодированное десятичное *представление, statement-by-statement *debugging пооператорная *отладка), а не к правому расширению – 19,12% (*reading in data *считывание данных). В приведённых примерах иногда видно, что и в английских и в русских терминах-эквивалентах направление расширения терминоструктуры совпадает, но эти отдельные факты тенденцию не описывают. Вышеуказанные тенденции английской и русской терминоструктур подтверждаются обсчётом весьма доверительных массивов моделей – повторяем, было обработано 2000 английских и 2000 русских моделей неповторяющихся терминов.
Сколько морфологических категорий/классов претендуют на ближайшие места перед и после ядра терминоструктуры, т.е. плотность классов, – это показано в Таблице 3. Здесь следует отметить, что в английских препозициях от (-5) до (-1) морфологические классы активнее русских в несколько раз. По-видимому, это объясняется существующим аналитизмом английского языка, в т.ч. способностью английского существительного играть роль препозитивного атрибута.
Выводы по первому этапу наблюдения за терминоструктурой
1) Разбиение термина на элементы с опорой на семантические признаки
Вычленяя в составном термине элементы, полезно заимствовать практику информационного поиска, а именно присвоение ключевому слову статуса «дескриптора» или «адескриптора/недескриптора», т.е. синонима. Например, при многоязычном поиске документ, содержащий термин холлеритовы данные, считается релевантным как документу, содержащему термин H-data, так и документу с Hollerith data. Это – синонимичные термины. Поэтому, на этапе ввода термина H-data в наш экспериментальный массив он подвергался предварительному «редактированию» и принимал автоматически распознаваемую форму H-#*data. В результате, все три варианта термина (холлеритовы *данные, Hollerith *data, H-#*data) содержали 2 программно-опознаваемых элемента {Дополнение 2}.
|
Общее количество морфологических классов, возникающих с любыми вероятностями в конкретных позициях терминоструктуры |
|||||||||||||
|
Термино- структура |
-5 |
-4 |
-3 |
-2 |
-1 |
* |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Русская |
– |
1 |
3 |
5 |
10 |
2 |
11 |
15 |
14 |
12 |
8 |
5 |
– |
|
Английская |
4 |
4 |
9 |
10 |
9 |
4 |
6 |
12 |
7 |
6 |
6 |
3 |
10 |
Таблица 3. Морфологическая плотность в пре- и постпозициях
Но что делать, если в тексте это же самое понятие описано более расширенно – «данные на перфокартах, закодированные методом Германа Холлерита». Это описание является частью дефиниции [Sippl - 1972, p.205]. К тому же терминоэлемент Hollerith используется и самостоятельно ("Hollerith" = холлеритова система кодирования)(Sippl - 1972, p.205) и в составе сочетаний (Hollerith strings = холлеритовы цепочки) [Sippl - 1972, p.205]. В нашем случае длинные сочетания вида "данные на перфокартах, закодированные методом Германа Холлерита" объектами нашего исследования не считались и в исходный экспериментальный массив составных терминов не включались.
Искусственный пробел ставился и в случаях: дельта-≠*конфигурация, но не ставился в случае delta-like (дельтообразный), потому что delta и delta-like выражают один и тот же признак <сходство, подобие>. (Сравните рыбный термин *рыба-#звезда и строительный термин сэндвич#*панели, где также реализован признак <сходство>).
2) Об английском морфологическом классе «герундий». В сочетании вида data processing system (N-2 GER-1 N*) (система обработки данных (C* Cрод Cрод)) ing-форма считалась активным герундием. Здесь триаду <деятель-действие-объект> можно развернуть в трехчленное стандартное предложение system PROCESSES data, где объект (data – прямое дополнение) прочно связан с действием. Прочность связи между объектом и действием сохраняется и в терминах, где реализуется усечённая формула – <действие-объект>: data *processing (N-1 GER*) (обработка данных). Действие-герундий и его объект-существительное сохраняются и в термине *reading in data (считывание данных).
3) Условный морфологический класс «идентификатор». В терминах вида язык Ада, LISP-#*language (ЛИСП-язык), команда compare register, LIFO-#*list подчёркнутые элементы считались нами «идентификаторами». Введение этого условного морфологического класса терминоэлементов помогло нам внести определенную стабильность в процесс предмашинного редактирования терминов.
Безусловно, предлагаемые нами 3 морфолого-синтагматических признака достаточно полно представляют поверхностную структуру терминов двух языков. Но такое описание не вскрывает само содержание межэлементных связей в пределах составного термина, а поэтому, целью следующего этапа наблюдений над терминоструктурой было формализованное представление само́й семантической организации термина.
II. ВТОРОЙ ЭТАП НАБЛЮДЕНИЯ НАД ТЕРМИНОТРУКТУРОЙ
Линейность семантической организации термина
Разрабатывая свой подход к формализованному представлению семантики термина, мы рассуждаем следующим образом.
Если речь – письменная или устная – линейна, значит и линейна структура или организация составного термина. То есть, эта структура нами мыслиться в виде некоторой линейной последовательность ниш или позиций и каждая ниша наделена некоторым глубинным/скрытым (hidden) значением (или смыслом, идеей). Здесь возможна аналогия с линейно-организованной числовой последовательностью, где каждый разряд (т.е. место) нагружен вполне определённым значением (significance), «весом» (“weight”). При производстве числовой речи человек загружает каждый числовой разряд конкретным местным значением. Выбор такого локального значения определяется целью числовой речи человека? Здесь уместно отметить, что, по-видимому, впервые сравнение структуры/«формулы» словосочетания с организацией «сложных числовых образований» сделал А.И. Смирницкий [Смирницкий – 1956, с.19].
Анализ семантики составных терминов позволил выделить в них присутствие следующих абстракций, которые мы назвали семантическими признаками. Они – следующие: активный субъект-деятель, фиктивный субъект-деятель, действие, объект, назначение-цель, конкретизация, инструментальность, локативность, сходство, устойчивость, партитивность, аблятивность (т.е. отсутствие признака), квантитативность, сделанный=из/материал, идентификатор, адресность/фамильность, язык, счисление.
Мы считаем, что эти признаки надлексичны, они выражают достаточно абстрактные идеи, чтобы считаться универсальными, т.е. они способны возникать в терминах любой предметной области. Но мы допускаем, что содержание некоторых из них не столь надлексично, чтобы причислить признак к разряду универсальных. В последующем мы обсудим проблемы слияния однородных признаков в более абстрактные, более глубинные категории.
Специфика распознавания признака
Предлагаемые семантические признаки (иногда будем их называть просто «признаки») извлекались из неадаптированных текстов вручную, причём признак распознавался путем анализа и ближайших окрестностей термина. Из текста извлекалась номинативная группа, затем каждый компонент группы анализировался на присутствие терминированности или нетерминированности. Анализ объёма содержания опирался на наше понимание терминируемой производственной ситуации, при этом анализ иногда проходил как бы на срезе двух языков. Можно отметить, что выявлению семантического признака способствовало то, что в английском термине он иногда оформлен отчетливее, чем в русском термине. Широко распространённая английская препозиция способствует распознаванию содержания признака, русская же высокочастотная постпозиция придает термину описательность, т.е. расплывчатость. Хотя иногда термины обоих языков имеют препозицию: binary *control, двоичное *управление, octal *representation, восьмеричное представление, binary-coded decimal representation, двоично-закодированное десятичное *представление.
О семантической триаде
Рассматривая многоэлементный термин как линейную цепочку семантических признаков (ниш, позиций), мы вправе задать себе следующие вопросы: когда и почему данный признак появляется в той или иной позиции? Зависит ли его поведение от того, что ядерная позиция термина занята признаком конкретного значения? Какими особенностями должен обладать признак, чтобы иметь позицию недалеко от ядра? Кто или что взвешивает значимость (significance) признака? Можно предположить, что ближайшее место к ядру обычно занимает признак, который в данный момент речи является самым информативным. Иными словами, он несет самую существенную информацию об оттенках терминируемого понятия. Задавая такие вопросы, мы должны также учитывать, что и само ядро может быть занято субъектом, который является всего лишь фиктивным, т.е. малоинформативным. И наконец, возможен вопрос: если признаков много, то кто их организует вокруг себя, так чтобы создавалась некая прочная конструкция. Эту конструкцию А.И. Смирницкий называл «формулой».
Выбирая среди выделенных признаков главные, вокруг которых могли бы группироваться остальные признаки терминоструктуры, мы рассуждаем следующим образом.
1) В предметной области «вычислительная техника и программирование» можно отметить следующую особенность – всегда существует широкий класс материальных предметов (компьютер, оборудование, аппаратное обеспечение; программа, программное обеспечение, алгоритм и т.д.), которые выполняют широкий класс действий или процессов (считывать, выводить, транслировать, преобразовывать, отлаживать и т.д.) над широким классом других предметов (данные, числа, цифры, файлы, информация, знаки, изображения, образы и т.д.). Такая схема, по-видимому, присутствует и в большинстве других предметных областей.
2) В своей речи человек обычно стремится как можно быстрее заявить главное, существенное, но при этом стремится терминологический знак сделать максимально коротким. Реализуется принцип – максимум информации в минимум времени. Что такое самое главное? Это – ответы на вопросы: кто/что делает? Что делает? Над чем совершается действие?
Кроме этого, обилие отраслевых терминов, выражающих автора, процесс и объект, подтверждает нашу мысль о главенстве признаков деятель, действие и объект действия.
Отсюда и наше решение: считать такую тройку признаков опорой или стержнем, вокруг которой группируются все остальные семантические признаки, уточняющие главные признаки.
Деятеля (субъекта), его действие и объект этого действия – каждого такого участника терминируемой ситуации назовем актантом, а всю группу – триадой [Глумов – 1986, с.99].
Абстрактность актантов аналогична абстрактности вышеперечисленных семантических признаков, т.е. все предложенные признаки однородны/гомогенны (homogeneous).
Способы реализации триады в составных терминах
Триада реализуется полностью или частично, её актанты выражаются или словестно, или морфемно, или смешанным способом.
Полная реализация триады
Триада реализуется полностью:
а) в терминах вида data-processing system, система обработки данных, information extraction technique, способ извлечения информации. Здесь триада выражена словесно;
б) в терминах вида data processor, процессор/обработчик данных, program debugger, отладчик программ. Здесь два актанта – <действие> и <объект> – выражены морфемно.
в) в терминах вида газораспределитель, кораблестроитель, нефтеанализатор. Здесь вся триада выражена морфемно.
Термины с полной реализацией триады назовем триадными.
Словесное представление, при необходимости, можно свернуть в морфемное и наоборот:
image digitization *software
image *digitizer
*программа оцифровки изображений
*оцифровщик изображений
нефтеанализатор
*прибор/программа/система анализа нефти
Триадный термин способен быть развернутым в стандартное трехчленное предложение структуры с сохранением глубинной структуры деятель-действие-объект:
system PROCESSES data; система ОБРАБАТЫВАЕТ данные.
Возможен и такой вид фиксации отношений между актантами:
действие (ДЕЯТЕЛЬ, объект).
Заполнив эту конструкцию конкретными лексическими значениями, получим программно-опознаваемый вид:
process (SYSTEM, data) или обрабатывать (СИСТЕМА, данные).
Частичная реализация триады
Двухактантные термины (актанты даны курсивом):
– image processing, обработка изображений, pattern recognition, распознавание образов, two-pass compiler, двухпроходной транслятор,
– самолетостроение, нефтеочистка, энергосбережение, кроветворение.
Одноактантные термины: two-pass compiling или two-pass compilation, двухпроходная трансляция/транслирование/сборка, high-speed debugging, высокоскоростная отладка, black memory, «черная» память (термин поясним позже), двоичный разряд, binary digit, laser programming, лазерное программирование.
О других (неактантных) семантических признаках
В нашем случае каждый семантический признак представлен четырёхаспектной моделью, которая содержит:
1) описание объема содержания признака;
2) лексическое выражение признака;
3) морфолого-семантическое описание признака;
4) трансформацию (т.е. проверочную (диагностическую) процедуру для определения объема содержания вычленяемого признака).
Пример описания признака <инструментальность>
1) Описание содержания признака:
из двух анализируемых слов составного термина грамматически подчиненное обозначает орудие (средство), с помощью которого выполняется действие, обозначенное вторым словом, или характеризуется предмет, обозначенный вторым словом.
2) Примеры лексического выражения признака (из специализированного тезауруса): машинное программирование, автоматическое управление, деление вычитанием, computer programming, computer-aided programming, automatic check
3) Морфолого-семантическое описание признака:
<инструментальность – действие>


Выше помета “ins” при терминоэлементе обозначает <инструментальность>, а “action” признак <действие>.
4) Трансформационная процедура
Тинс-действие
подлежащее + пассивн.сказуемое + прямое дополнение
или
Тинс-деятель
подлежащее + пассивн.сказуемое + косв. дополнение
|
computer control |
|
control |
IS=MADE |
by computer |
|
automatic programming |
|
programming |
IS=MADE |
by automate или automatically |
|
division by subtraction |
|
subtraction |
IS=MADE |
by division |
|
машиночитаемый носитель |
|
носитель |
СЧИТЫВАЕТСЯ |
машиной |
|
умножение сложением |
|
умножение |
ВЫПОЛНЯЕТСЯ |
сложением |
Особенности актантов
1) Сила межактантных связей
Триадные термины – из-за своей простоты, наглядности, но одновременно и прочности межактантных связей – широко применяются в любой предметной области:

С большой вероятностью триада в таких терминах скоро примет вид: data processor, image processor и дробемет.
Отметим традиционную левую направленность или развертку английской триады
объект ← действие ← ДЕЯТЕЛЬ
noise – imitating technology (технология имитации шумов)
content extraction system (система извлечения смысла)
data processing system (система обработки данных)
и правую развёртку русской триады
ДЕЯТЕЛЬ → действие → объект
технология имитации шумов
система извлечения смысла
система обработки данных
Деятель и действие тоже настолько прочно связаны, что связь может быть выражена морфемно (синтетически):
content-bearing unit → content bearer (смыслонесущая единица → носитель смысла),
text-synthesizing system → text-synthesizer (система синтеза текста → синтезатор текста).
Связь настолько прочная, что в варианте data-processing system действие и объект становятся связанными дефисом, а иногда и возможно свёртывание в морфемное образование вида текстосинтезатор (ср. газоанализатор, кровеохладитель). Свёртывается ли или развёртывается внешнее выражение триады – содержание межактантных отношений сохраняется.
Отметим поведение «страдальца».
Реализуется ли триада полностью или частично - прочность связи между действием и объектом-прямым дополнением сохраняется. Эту более тесную связь между глаголом и его прямым дополнением, чем между глаголом и его косвенным дополнением (хотя косвенное дополнение во многих языках помещается ближе к глаголу, чем прямое) отмечал О. Есперсен [Есперсен – 1958] (см. в [Апресян – 1966, с.151]). Нам эта мысль кажется интересной, ибо составной термин способен развертываться в предложение с прямым и косвенным дополнениями. (Такое устойчивое поведение объекта по отношению к действию можно использовать в информационном поиске для достижения монотонного и устойчивого индексирования.)
Если речь здесь зашла о силе валентностной связи между глаголом и прямым дополнением (сила связи «управление»), то опишем здесь и нашу интерпретацию записи вида
обрабатывать (СИСТЕМА, данные).
Эту программно-опознаваемую запись (см. выше) можно развернуть в программно-опознаваемое предложение
СИСТЕМА обрабатывает данные.
В этой записи мы даже внешне хотим подчеркнуть "страдания объекта". Он представлен тускло, неярко. Господин ситуации здесь СИСТЕМА, это – субъект, он может быть реальным или фиктивным. Процесс выделен жирно, это – будущий предикат. Итак, перед нами развёрнута сцена, где один актант активный (active), а другой (т.е. объект) пассивный (passive), страдающий, лишь принимающий на себя воздействие. (Вспомним русские термины «действительный залог», «страдательный залог»)
2) Абстрактность морфемы -ER
Для случая терминов вида image digitizer отцифровщик данных, где действие и объект представлены морфемно, нужно отметить большую абстрактность высокочастотной морфемы –er (-or). Ее значение шире {Дополнение 3}, чем, скажем, узко-отраслевое значение морфем в медицинских и геологических терминах вида невроз и курчатовит. Эти локальные морфемы уже подверглись стандартизации – в термине вида невроз за корневой морфемой закреплено только значение объект заболевания, а за суффиксальной – заболевание; в терминах же вида курчатовит суффиксальная морфема выражает идею о минерале.
Выше мы показали устойчивость межактантных связей – несмотря на словесное или морфемное выражение триады. По-видимому, такая прочность обусловлена тем, что эти связи прямые, непосредственные, работает связь «управление». Такую прямую связь получают те лексические значения, которые дружественны друг другу, т.е. они лексически совместимы.
О метонимии и каскадировании
Существует широкий слой английских и русских терминах вида binary control, двоичное управление, binary numeration system, двоичная система счисления, в которых рядом стоящими часто оказываются элементы с казалось бы лексически несовместимыми значениями. Эти элементы грамматически связаны, но парадигматические (онтологические, внетекстовые) связи между ними не прямые, а косвенные. Такое грамматическое содружество лексически далеких элементов в пределах одного термина придает термину определенную яркость и оттенок иносказательности. В английском термине black memory букв. «черная» память (т.е. память, содержащая данные о черных образах) парадигматическая связь между элементами вообще не просматривается, как не просматривается она и в терминах с латинскими элементами – post mortem dump (т.е. «посмертный» дамп).
Мы считаем, что такие семантические пропасти или провалы (pits) между элементами в термине возникли в результате действия метонимических явлений, т.е. переподчинение признака от одного понятия к другому понятию. Имя-признак как бы покидает своего прежнего парадигматического хозяина и становится грамматически (т.е. формально) зависимым от нового хозяина. Строго говоря, для терминов binary computer двоичный компьютер, binary arithmetic двоичная арифметика парадигматически неточно будет сказать: computer IS binary компьютер ЕСТЬ двоичный, arithmetic IS binary арифметика ЕСТЬ двоичная. А случай black memory трансформировать в сообщение memory IS black – эта операция вообще кажется странной.
Такие семантические пропасти между элементами в термине мы предлагаем «мостить» с помощью каскада стандартных 3-членных предложений (примитивов – primitives). Каскад может содержать один или нескольких базовых предложений. Каждый примитив фиксирует прямые (непосредственные) парадигматические связи между подлежащим-субъектом, сказуемым-действием и прямым дополнением-объектом. Таким образом фиксируются непосредственные связи между признаками терминируемого понятия. В каскаде самое нижнее предложение является самым опорным, базовым, фундаментальным. (О форме тезаурусного представления прямых или косвенных связей между элементами компаунда мы здесь не говорим.). Процесс формирования каскада называется каскадированием (cascading).
Разные метонимические термины требуют разное количество примитивов. Например, для термина binary numeration двоичное счисление каскадирование не требуется, ибо с точки зрения данной понятийной системы целесообразнее считать, что признак двоичность определяет понятие счисление непосредственно. Выразим эту прямую связь с помощью предложения
numeration IS binary система счисления ЕСТЬ двоичная
Здесь налицо тот самый случай, когда грамматическая связь совпадает с парадигматической.
В тезаурусе (это – система знания) такой примитив будем хранить в виде
IS (NUMERATION,binary)
Для термина binary data двоичные данные уже потребуется формировать 2х-ступенчатый каскад:
data HAS numbering system
данные ИМЕЮТ систему счисления
numbering system IS binary
система счисления ЕСТЬ двоичная
Для cлучая black memory, самый базовый (т.е. нулевой) примитив будет, по-видимому, заявлять цвет ИМЕЕТ волну, если учитывать современную способность техники распознавать волны, излучаемые цветом.
Такое каскадирование или «наведение мостов» (bridging) через метонимические пропасти может способствовать, например, формированию эффективного управляемого языка (controlled English) – для оптимального описания смысла документа и поискового запроса {Дополнение 4}.
О «голубоглазости», «тонкостенности» и «четырехмоторности»
В терминоструктуре позиция <партитивность> может заполняться лексическим значением вида «голубоглазость» (или «тонкостенность» или «четырехмоторность» и т.п.). Мы используем здесь толкование А.И. Смирницким значений вида «голубоглазость» (“blue-eyedness”) в сложных словах вида long-nosed длинноносый, short-legged коротконогий и т.п. [Смирницкий – 1956, с.118]. Подробнее о формализованном представлении этой ситуации см. в [Глумов - 2009], где терминосочетания вида
thick-walled tank толстостенная цистерна (т.е. цистерна с толстыми стенками),
concrete-surfaced runway (взлетная полоса с бетонным покрытием),
many-sided configuration многостороння конфигурация (т.е. конфигурация со многими сторонами),
three-bladed propeller трехлопастный пропеллер (т.е. пропеллер с 3 лопастями),
one-armed man однорукий мужчина (т.е. мужчина с одной рукой),
four-engined aircraft четырехмоторный самолет и т.п.
предлагается описывать с помощью наших трехчленных каскадных примитивов [Глумов - 1986; 2009].
Выводы по семантическому этапу наблюдения над терминоструктурой
Формулируя свой рабочий подход к семантическому моделированию составного термина, по-видимому, целесообразно изучать опыт наших предшественников. Например, известны выделенные А.А. Потебней многочисленные оттенки творительного падежа – творительный места (где?), творительный времени (когда?), творительный образа действия (как?) и т.д. Одна и та же форма выражает многочисленные оттенки содержания. Это содержание надлексическое, грамматическое или когнитивное? Как формально представить его? Совместимы ли эти содержательные оттенки, скажем, с содержанием семантических падежей Ч. Филлмора [Филлмор - 1980] или с категориями В.Л. Уорфа [Уорф - 1960]?
Возьмем одну из т.н. «скрытых категорий» или «криптотипов» В.Л. Уорфа [Уорф - 1960] , которая – согласно В.Л. Уорфу – несет значение «форма+бесформенное вещество»: «мешок муки», «брусок меди» и т.д.
Он считал, что в английском языке это значение обычно выражается грамматической формой вида N* OF N1 (cup of tea чашка чая) или N-1 N* (wood stick деревянная палка/посох). Подобные формы В.Л. Уорф называл формулами, в которых предлог OF имеет явное значение «содержащийся». Если сравнить наш признак <сделанный=из> c этим криптотипом, то, по-видимому, криптотип более абстрактен: медный гвоздь, карман семечек, река крови, океан слез). Наш вывод: в последующем этот криптотип мы можем использовать для иерархизации выявленных нами признаков.
Возьмем наш следующий признак – <конкретизация>. Мы приписали ему содержание: «Из двух анализируемых слов термина грамматически главное обозначает лишь общий класс предметов, процессов или способов, а подчиненное слово конкретизирует и уточняет этот класс, неся существенную информацию о терминируемом понятии» [Глумов - 1986, с.100-102]. То есть, при анализе терминов вида программные средства, средства программирования, способ трансляции, programming aids (программные средства), quantization process (процесс квантования) подчеркнутые элементы считаются именами информационно-недостаточными, они «обязательно требуют распространителей, обеспечивающих определенность и однозначность называния, полноту обозначения.» [Рус. грамматика - 1980, с.16].
И здесь мы тоже можем видеть, что вышеуказанный криптотип тоже поглощает наш признак. Идея «безбрежности» массы и идея формирования жесткой «формы» (конфигурации) для этой массы – эти идеи нам кажутся ценными и их можно применять для представления наших текстовых ситуаций вида способ трансляции или compiling technique. Такой безбрежностью будут наши отраслевые «процессы/действия», а формой будут отраслевые «средства, программы, способы, методы, инструкции» и т.п. Тогда нашу конкретизацию придется назвать не семантической, а понятийной категорией. Но ведь дело не в названии категории, а в её содержании и в проверочном трансформировании её внешней формы выражения.
Наш признак <идентификатор> тоже может быть включен в данный криптотип.
Значение данного криптотипа, похоже, покрывает значение и категории количественности [Б. де Куртенэ – 1963], которую И.А. Бодуэн де Куртенэ выделял как отдельную. Но это требует дальнейших наблюдений.
И наконец, обсуждая трудности семантической формализации, нельзя не вспомнить особенности известных 10 аристотелевых категорий или классов: 1) substance, 2) quantity, 3) quality, 4) relation, 5) place, 6) time, 7) position, 8) state, 9) action, 10) affection [Wikipedia. Aristotle]. Их большой уровень абстрактности может служить своеобразным ориентиром при будущей иерархизации выделенных нами признаков.
Подчеркивая стихию разных языков и трудности определения внеязыкового содержания категорий, О. Есперсен отмечал [Есперсен - 1958, с.50]: говоря «о различиях между языками, мы наблюдаем, как предметы, представленные словами, группируются самым различным образом соответственно капризам данного языка. То, что сливается воедино в одном языке, различается в другом.» И далее он отмечал расплывчатость категорий.
«Эти категории являются универсальными, поскольку они применимы ко всем языкам, хотя они редко выражаются в этих языках ясным и недвусмысленным способом. Некоторые из них относятся к таким фактам внешнего мира, как пол, другие – к умственной деятельности или к логике. За отсутствием лучшего термина я буду называть эти категории понятийными категориями.» [Есперсен - 1958, с.58].
«Грамматические категории представляют собой в лучшем случае симптомы, или тени, отбрасываемые понятийными категориями, иногда «понятие», стоящее за грамматическим явлением, оказывается таким же неуловимым, как кантовская вещь в себе.» [Есперсен - 1958, с.61-62].
Семантический (глубинный) элемент терминоструктуры, по-видимому, является основополагающим лингвистическим понятием для формирования термина. Единственным способом проверки содержания терминоэлемента оказывается трансформационная процедура.
III. ЗАКЛЮЧЕНИЕ
1) На сегодня возникло большое противоречие между фантастическими возможностями современной вычислительной техники, систем связи, высокими описательными возможностями языков программирования, с одной стороны, и пока ещё слабыми выразительными способностями информационно-поисковых языков дескрипторного типа. Результатом этого противоречия является слабая эффективность информационного поиска, т.е. точность и полнота поиска – а они являются его основными характеристиками – оставляют желать много лучшего. Возникший многоязычный поиск ещё больше усугубляет эту проблему.
Современный дескриптор обычно имеет вид составного термина.
Как построен термин, т.е. в чем заключается эффективность организации его элементов в теле термина, какова сила связи между элементами, как терминоэлемент выигрывает сражение за свое место у грамматически главного ядра термина – на эти и другие интересные вопросы еще нужно ответить. Только после этого можно будет предложить эффективную организацию лексической единицы. Здесь существует некая аналогия с автоматическим построением названия лекарства, когда мы идем от содержания (т.е. известных компонентов лекарства) к созданию имени с наперед заданными ( и программно-распознаваемыми) свойствами.
Понимая принципиальную значимость отраслевых терминологий в СССР, вопросы об упорядочении, нормализации и стандартизации терминов ставили еще в 30-х годах прошлого века академик С.А. Чаплыгин [Чаплыгин - Лотте - 1937], курирующий в то время терминологические исследования в стране, известный инженер-лингвист Д.С. Лотте [Лотте - 1940; 1940а], известный лингвист Г.О. Винокур [Винокур - 1939].
2) Остро ощущается отсутствие единого подхода к описанию внешней и внутренней структур термина. Такой подход создал бы возможность получать «дружественные», совместимые терминологические результаты, объединяя этим исследовательские усилия.
3) Создавая единую методику наблюдения за терминами, нужно полагать, что возникающие новые утонченные понятия, демонстрирующие прогресс науки и техники, не будут названы терминами-поездами, т.е. терминами-дефинициями. Надо ожидать, что названия этих понятий будут иметь вид коротких составных терминов, но с углубленными и метафорическими отношениями между элементами термина. Эти связи придают яркость и необычность, что способствует лучшему запоминанию термина и терминируемого понятия. Поэтому, формальное представление значений таких терминов нужно будет проводить с помощью весьма абстрактных категорий. Лингвист должен как бы заранее запастись достаточной абстрактностью категорий с тем, чтобы с их высот взглянуть на стихию текста. Высокая абстрактность категорий затем позволит провести иерархическое упорядочение семантических признаков, очертить границу между содержанием таких групп однородных (гомогенных) признаков.
Из вышесказанного вытекает следующая возможная процедура опознавания признаков: вначале мы пытаемся выделить случаи с одинаковой лексичностью – скажем, случаи вида «голубоглазости», интуитивно усматривая реализацию в них глубинного значения <партитивности>, далее, заимствуя криптотип «ФОРМА+БЕСФОРМЕННОЕ ВЕЩЕСТВО», мы сливаем все партитивности в этот криптотип. Иными словами, мы проходим все ступени нижепоказанного каскада, где нижняя ступень содержит стихийное (локальное) значение, средняя – значение надлексическое, а верхняя – самую высокую абстракцию.
|
|
|
ФОРМА+БЕСФОРМЕННОСТЬ |
|
|
партитивность |
|
|
голубоглазость |
|
|
Феномены каждой ступени, каждого слоя этого каскада являются гомогенными.
Трехактантная триада может стать стержнем при формализованном описании линейной организации термина. Содержание каждого актанта триады разноплановое. При свертывании 3-хактантного термина вида data(-) processing system система обработки данных в 2-хактантный вида data(-)processing обработка данных сохраняется прочность связи между действием и объектом («страдальцем» действия). Возникает возможность глубинные отношения между актантами выразить внешними формами – активными или пассивными.
Построение «мостов» через метонимические пропасти в терминоструктуре предлагается производить с помощью базовых примитивов, т.е. стандартных трехчленных предложений, фиксирующих парадигматические отношения между признаками понятий. Такое фиксирование производится в специальном тезаурусе.
Вернемся к стихии текста. Термин является частью такой текстовой стихии. Но, выбирая термины в качестве объекта исследования, мы ожидаем, что описываемый терминами мир науки и техники несколько у́же, чем вообще мир материальных и идеальных сущностей.
Нужно быть готовым к тому, что наш терминоэлемент (т.е. семантический признак) будет выражен в русском термине словесно, в английском иногда словесно и морфемно, а в немецком всегда морфемно. (В этом месте вспоминаются слова, кажется, Л.В. Щербы о том, что самым устойчивым объектом для исследования является морфема. С этим трудно не согласится, если вспомнить, что немецкий термин может иметь вид морфемного комплекса длиной в целую строчку.)
4) В целом, многопризнаковое описание внешней структуры термина и многоаспектное представление семантических признаков может помочь подойти к изучению проблемы как «сказывается» (А.А. Потебня) научно-техническая мысль.
IV. ЛИТЕРАТУРА
(Апресян – 1966) Ю.Д. Апресян. Идеи и методы современной структурной лингвистики (краткий очерк). – М.:Изд-во «Просвещение», 1966. – 302с.
(Б. де Куртенэ – 1963) И.А. Бодуэн де Куртенэ. Количественность в языковом мышлении//Избранные труды по общему языкознанию. – М.,1963. Том 2, с. 278-287.
(Винокур – 1939) Г.О. Винокур. О некоторых явлениях словообразования в русской технической терминологии//Труды Московского института истории, философии и литературы. – М.,1939, том 5, с.3-54.
(Глумов – 1986) В.И. Глумов. Структурно-семантическая организация составных терминов русского и английского языков (на материале текстов по вычислительной технике и программированию). Дис. на соиск. уч. ст. к. филолог. н. (10.02.21 – структурная, прикладная и математическая лингвистика). Горький, Горьковский государственный университет им. Н.И. Лобачевского, 1986. –168с. (Приложение – 81с.)
(Глумов – 2008) В.И. Глумов. Распознавание составного термина в тексте и подготовка к машинной обработке (нулевой этап). (с.41-63). Материалы межрегиональной научно-практической конференции «Научно-методическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования», Нижний Новгород, Филиал Российского государственного университета (РГГУ) в г. Нижнем Новгороде, 23-24 октября 2008 года. Нижний Новгород, издание Филиала РГГУ в г. Нижнем Новгороде, 2008. – 279с.
(Глумов – 2008а) В.И. Глумов. Статистико-вероятностные особенности поверхностной структуры английских и русских составных терминов (первый этап). (с.63-84). Материалы межрегиональной научно-практической конференции «Научно- методическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования», Нижний Новгород, Филиал РГГУ в г. Нижнем Новгороде, 23-24 октября 2008 года. Нижний Новгород, издание Филиала РГГУ в г. Нижнем Новгороде, 2008. – 279с.
(Глумов – 2009) В.И. Глумов. О значениях вида «голубоглазость» или «толстостенность» в англо-русской терминологии. Сборник докладов на 2- ой Международной научно-практической конференции «Информационные технологии в гуманитарном образовании», Пятигорск, Пятигорский государственный лингвистический университет (ПГЛУ), 23-24 апреля 2009 года. http://itgo.pglu.ru.
(Есперсен – 1958) О. Есперсен. Философия грамматики. ( Пер. с англ. В. В. Пассека и С. П. Сафроновой; Под ред. и с предисл. Б. А. Ильиша. — М.: Изд-во иностранной литературы, 1958. (Otto Jespersen. The Philosophy of Grammar. London, George Allen & Unwin Ltd. 1924. (First published in 1924, reprinted 1925, 1929, 1935.)
(Тезаурус БЕТОН – 1981) Информационно-поисковый тезаурус промышленности строительных материалов. Раздел «БЕТОН И ЖЕЛЕЗОБЕТОН». Москва, Всесоюзный НИИ научно- технической информации и экономики промышленности строительных материалов (ВНИИЭСМ) Минстройматериалов СССР, 1981. – 223с.
(Лотте – 1940) Д.С. Лотте. Изменение значений слов как средство образования научно-технических терминов //Известия АН СССР. Отделение технических наук. 1940, № 6, с.73-90.
(Лотте – 1940а) Д.С. Лотте. Некоторые принципиальные вопросы отбора и построения научно-технических терминов // Изв. АН СССР. Отделение технических наук. 1940, №7, с.79-98.
(Рус. грамматика – 1980) Русская грамматика (в 2-х томах). – М.: Наука, 1980. Том 2: СИНТАКСИС. –709с.
(Смирницкий – 1956) А.И. Смирницкий. Лексикология английского языка. – М.: Изд-во лит-ры на иностр. языках, 1956. – 260с.
(Смирницкий – 1957) А.И Смирницкий А.И. Синтаксис английского языка. – М.: Изд-во лит-ры на иностр. языках, 1957. – 286с.
(Сэпир – 1934) Э. Сэпир. Язык: Введение в изучение речи. (Перев. с англ.) – М.– Л.:Соцэкгиз, 1934. – 223с. (Edward Sapir. LANGUAGE: An Introduction to the Study of Speech. New York:Harcourt, Brace, 1921)
(Уорф – 1960) Б.Л. Уорф. Отношение норм поведения и мышления к языку (Перев. с англ.) //Новое в лингвистике. – М.:1960. – Вып. I, с. 135-169. (Benjamin Lee Whorf. The Relation of Habitual Thought and Hehavior to Language. Language, Culture, and Personality: Essays in Memory of Edward Sapir (Menasha, Wisconsin, 1941, –pp. 197-201.)
(Филлмор – 1980) Ч. Филлмор. Дело о падеже (Перев. с англ.) // Новое в зарубежной лингвистике. В.А. Звегинцев. –Вып. X : ЛИНГВИСТИЧЕСКАЯ СЕМАНТИКА. – М.: Прогресс, 1981. – с.69-495. (Charles J. Fillmore. The Case for Case. –In: Universals in linguistic theory. N.Y., 1968.)
(Чаплыгин – Лотте – 1937) С.А. Чаплыгин, Д.С. Лотте. Задачи и методы работы по упорядочению технической терминологии. – Изв. АН СССР. Отделение технических наук, 1937, с. 867-883.
(Wikipedia. Aristotle) http://en.wikipedia.org/wiki/Categories_(Aristotle)
(Fries – 1952) Ch.C Fries. The structure of English: An Introduction to the Construction of English Sentences. –New York, 1952.
(Sippl – 1972) Charles J. Sippl and Charles P. Sippl. Computer Dictionary and Handbook. Howard W. Sams & Co., Inc., The Bobbs-Merrill Co., Inc., Indianapolis, Kansas City, New York, 1972. – 778p.
ДОПОЛНЕНИЯ
Дополнение 1.
Левое расширение терминоструктуры иногда называют регрессивным, а правое прогрессивным (В. Ингве); у Н. Хомского соотвественно левоветвящейся структурой и правоветвящейся структурой.
Дополнение 2.
Если такое предварительное редактирование применить в многоязычном информационном поиске – на этапе, скажем, индексирования смысла документа или поискового запроса, то оно может способствовать достижению столь желанной монотонности и устойчивости индексирования.
Ниже дадим толкование английских терминов Hollerith, a Hollerith string, Hollerith code.
Hollerith холлеритова система кодирования алфавитно-цифровой информации на перфокартах.
A widely used system of encoding alphanumeric information onto cards; hence, Hollerith cards (холлеритовы перфокарты) is synonymous with punch cards (перфокарты). Such cards were first used in 1890 for the U.S. Census and were named after Herman Hollerith, their originator (изобретатель). [p. 205: Charles J. Sippl & Charles P. Sippl. COMPUTER DICTIONARY AND HANDBOOK. Howard W. Sams & Co.,Inc.; The Bobbs-Merrill Co.,Inc. Indianapolis, Kansas City, New York. 1972. – 778p.]
Hollerith code код Холлерита, Холлерит
12 11 0 1 2 3 4 5 6 7 8 9
R X
An alphanumeric punched-card code (алфавитно-цифровой код для перфокарт) invented by Dr. Herman Hollerith in 1889, in which the top three positions in a column are called ‘zone’ punches (12, 11, and 0, or R,X and O, from the top downward), and are combined with the remaining punches (остальные перфорационные отверстия (перфоотверстия)), or digit punches (1 through 9) (перфорационные отверстия для изображения цифр – от 1 до 9 включительно) to represent alphabetic, numeric, and special characters. For example, A is a combination of an R (12) and a 1 punch (перфорационное отверстие 1) ; an L is a combination of an X (11) and a 3 punch (перфоотверстие 3), etc. [Sippl – 1972, p. 205]
Hollerith strings холлеритовы цепочки/цепи
In addition to their use in FORMAT statements, Hollerith strings can be used as arguments of functions and can be stored with floating-point or fixed-point variable names in an arithmetic assignment statement (...могут быть названы переменными с плавающей запятой или фиксированной запятой и занесены в арифметический оператор присвоения.) A Hollerith string is specified in writing the character count followed by an H, and then the string of characters. A string must have eight characters, or less, when stored with a floating-point variable name; it must have four characters, or less, when stored with a fixed-point variable name. If used as an argument, the string can be any length. When strings are less than the maximum (eight for real, four for integer), they are stored left-justified (выравнивать влево) and blanks are filled in for the missing characters (some computers). [ Sippl – 1972, p. 205]
Дополнение 3.
В задачах автоматического извлечения научно-технических знаний из естественных узко-тематических текстов проблема определения содержания популярных английских суффиксов "-er" и "-or" оказывается отнюдь не совсем простой. В ситуациях вида "computing system" (вычислительная система, вычисляющая система, вычислитель, компьютер) "compiling program" (транслирующая программа, программа-транслятор, транслятор), пытаясь формально представить семантику таких терминов, нам приходиться "взвешивать" информативную значимость терминоэлементов вида "system" и "program", которые в большинстве случаев сливаются или объединяются с более информативными терминоэлементами вида "computing" и "compiling", образуя казалось бы однословные термины "computer" (вычислитель, компьютер) и "compiler" (транслятор, программа-транслятор). Когда индексатор одноязычной и, особенно, многоязычной информационно-поисковой системы (ИПС) приступает к формированию очередной тезаурусной/словарной статьи (entry), именно проблемы расширения и сжатия терминоструктуры (computing system ⇔ computer) обычно вызывают у него головную боль. (Напомним, что тезаурусная статья содержит поисковый дескриптор, его условные синонимы (адескрипторы), родовой дескриптор, видовые дескрипторы, ассоциативные дескрипторы.) В момент логико-семантического анализа терминоструктуры длинного термина поиск и распознавание (в терминоструктуре) фиктивности "деятеля" (computing system , computing device/unit) или "действительного деятеля" (computer) является не совсем лёгким делом.
В этой связи существенным подспорьем для нашего анализа термиоструктуры может быть решение английской ассоциации стандартизации (терминов) различать или дифференцировать значения английских суффиксов "-er" и "-or". На с. 24-25 своей знаменитой статьи Г.О. Винокур пишет: "... Английская ассоциация стандартизации провела размежевание значений в суффиксах -or и -er , употребляя первый только для образования терминов с значением орудия, а второй – для образования терминов с значением действующего лица, и соответственно заменила напр. прежние термины starter, converter на startor, convertor. Чистая условность таких семасиологических квалификаций по отношению к словообразовательным элементам заставляет, однако, признать их годными только по отношению к очень специальным отраслям терминологии, не имеющим прочных связей с обиходным языком. Это уже собственно не термины, а номенклатурные знаки. Поэтому же они не представляют и собственно-лингвистического интереса, хотя, вероятно, вполне отвечают своему практическому назначению."
Современная робототехника нуждается именно в узко-тематических подъязыках – в частности, в регулируемых естественных подъзыках (controlled sublanguages), обеспечивающих устойчивое и надёжное человеко-машинное общение. (Известны уже десятки таких подъязыков.) В связи с этим, здесь уместно отметить, что в момент строительства терминологического знака активную роль играет как лингвистическая система, так и система мышления человека. Совершается процесс "научного терминирования" (Г.О. Винокур). Какова роль "будничного речевого процесса, направляемого привычными бытовыми ассоциациями," в процессе "научного терминирования" – большая или второстепенная – степень влияния законов повседневного языка на строительство любого узко-тематического подъязыка заслуживает, по-видимому, особого исследования.
Отметим также следующее [Винокур - 1939, с.24-25]:
"Слово, употребляемое в качестве термина, находится под постоянным контролем тех, кто им пользуется. В особенности это относится к термину научному. Естественно поэтому, что в области научных терминологий, как бы близко они ни были связаны с практическим языком повседневности, элемента стихийности, непроизвольного возникновения лексем и морфем, гораздо меньше, чем вообще в языке. Автоматизм будничного речевого процесса, направляемого привычными бытовыми ассоциациями, ни в какой мере не может служить характеристикой научного терминирования. Сознательность и, в той или иной мере, планомерность в именовании отвлечённых понятий – факт совершенно бесспорный. Термины не "появляются", а "придумываются", "творятся", по мере осознания их необходимости . ... Так, Ломоносов сознательно работал над русской естественно-научной терминологией, которая, по признанию специалистов, обязана ему многими завоеваниями . ... Так, уже не в сфере науки, а вообще в сфере отвлечённых понятий, придумывал именования Карамзин, напр. промышленность. ... Поэтому всегда в истории науки вполне естественными и законными являлись попытки рационализации терминологии .
Сноска 4: "Со стороны словообразовательной такие попытки . как известно. в особенности характеризуют историю терминов химии. Ср. в добавление к сказанному выше о дифференциальном значении суффиксов
-ватый . -оватистый в русской химической терминологии такие напр. факты, как систематически выдерживаемое в суффиксах, при помощи которых создаются названия ациклических углеводородов. напр.
этан – этен – этин – этадиен ,
бутан – бутен – бутин – бутадиен,
гексан – гексен – гексин – гексадиен и т.д. "
(Далее говорится о стандартизации суффиксов -or и -er, о которых мы сказали выше)
Нечего и говорить, что в наше время для таких попыток, как раз в области технической терминологии оснований более чем достаточно. ... Техническая терминология на наших глазах ежедневно обогащается всё новыми и новыми явлениями, и в то же время технические термины всё в большей степени проникают и в общий язык. В качестве технических терминов таким образом заинтересованы одновременно и учёные деятели техники, и практические технические работники, и лингвисты, и лица, понимающие необходимость стилистического контроля над повседневной речью... ".
Заканчивая такую длинную цитату, мне хочется подчеркнуть мысль Г.О. Винокура о "законности рационализации терминологии". Потребность в рационализации он видел уже в 40-х годах прошлого века. Сегодня, когда основы цифровой вычислительной техники и программирования для цифровых ЭВМ уже изучаются в общеобразовательной средней школе, а лингвистическое обеспечение (ЛО) систем искусственного интеллекта и роботов разной степени интеллекта, ЛО интеллектуального многоязычного поиска (intelligant cross-language retrieval) стало повседневной задачей – задача строительства оптимальных терминологических знаков приобретает всё бóльшую знáчимость.
Дополнение 4.
Сфера применения таких регулируемых языков огромна. В принципе, такие укороченные естественные языки, имеющие ограниченную грамматику и ограниченную лексику, нужны и при преподавании основ , скажем, английского языка. Принципиально важно здесь то, что обучение языку должно проводиться по общеизвестному методу "от простого к сложному". В противном случае мы, затратив много времени и денег, не добьёмся серьёзных результатов, и не обеспечим устойчивое и надёжное общение между людьми, между людьми и машинами/роботами, а также общение в режиме "машина – машина". Выделенные мною курсивом понятия должны заставить нас критически взглянуть на наши методы преподавания естественных языков и оценить их эффективность. Если эти методы и методики никчёмные и малоэффективные, тогда нам нужно срочно (Время не ждёт!) научиться правильно преподавать данный предмет как человеку, так и роботу. Это тем более нужно сделать потому, что здоровье и настроение школьника иногда напрямую зависит, как говорят его родители, от его успехов или неудач в изучении, скажем, английского языка. Особенно, английского научно-технического подъязыка – например, подъязыка цифровой вычислительной техники и программирования для этого вида техники. Основы ЦЭВМ и программирования для ЦЭВМ, т.е. вычислительные понятия и терминология, понятия программирования и языки программирования – всё это уже должно быть успешно усвоено старшеклассниками российской средней школы. Иными словами, именно в средней школе формируются основы преодоления технологической отсталости России.
Цель построения таких естественных языков общеизвестна – деятельность или жизнь человека или робота должна быть организована под неусыпным контролем со стороны человека (как творца ученика-человека или ученика-робота. )
Напомним себе, что деятельность человека на планете Земля звезды Солнце регулируется вполне конкретными международными законами. В этих законах заданы такие принципиальные, регулирующие жизнь человека понятия, как "жизнь", "гуманность", "достоинство", "честь", "предательство" и т.п. Эти понятия лингвистам приходится объяснять школьнику-человеку и школьнику-роботу, применяя иной, т.е. искусственный или полуестественный/регулируемый естественный, язык. Иными словами, мы пытаемся объяснить молодому человеку или "металлической штуке" законы нашего бытия.
ИНФОРМАЦИЯ:
1) В.И. Глумов (V.I. Gloumov) , к. филолог. н. (10.02.21 – структурная, прикладная и математическая лингвистика), зав. кафедрой гуманитарных и социально-экономических дисциплин Нижегородского филиала Российского Государственного Гуманитарного Университета (РГГУ, г. Москва).
2) Данная статья, опубликованная в 2009 году, размещена на сайте gloumov.com 21 июля 2015 года.
| Скачать статью в pdf формате |


