2008г. Моделирование поверхностной структуры английских и русских составных терминов

МОДЕЛИРОВАНИЕ ПОВЕРХНОСТНОЙ СТРУКТУРЫ АНГЛИЙСКИХ И РУССКИХ СОСТАВНЫХ ТЕРМИНОВ
(первый этап)
В.И. Глумов
к. филолог.н., доцент
Филиал РГГУ в г. Нижний Новгород
ИЗ: (с. 63-84) Материалы межрегиональной научно-практической конференции «Научно-методическая и учебная деятельность ВУЗа в связи с переходом на многоуровневую систему образования» (Нижний Новгород, Филиал РГГУ в г. Нижний Новгород, 23-24 октября 2008 года), Изд. Филиала РГГУ в г. Нижний Новгород, 2008. – 279с.
| Скачать статью в pdf формате |
В предыдущей статье в результате выполнения нулевого этапа обработки текстовых терминов было сформировано 2000 английских и 2000 русских составных терминов подъязыка «Цифровая вычислительная техника и программирование». Каждый термин в экспериментальном массиве употреблялся лишь один раз.
Внешняя или поверхностная структура каждого составного термина была описана трехпризнаковой моделью, которая также имела связь с самим термином, т.е. программно обеспечивался переход от термина к его модели и обратно.
Таким образом, программной обработке подвергалось 4000 составных терминов и 4000 моделей.
В предыдущей работе (а подробнее в [2]) мы указали, что три признака (морфологический, позиционный и синтагматический) составляют поверхностную модель термина.
Трудоёмкость описания каждого элемента многословного термина тремя признаками компенсируется получением более устойчивых и надежных сведений о поведении морфологических категорий в пределах термина. На это нас толкала и сама особенность английского языка, в котором – по словам Г. Суита – одним из распространённых средств выражения грамматического значения является порядок слов. На важность учёта индивидуальных позиций морфологических категорий по отношению друг к другу в определённой "диагностической рамке" также указывал и Ч. Фриз [7,с.94]. Понятие «формулы» строения сложного лингвистического образования, предложенное А.И. Смирницким (см. пред. статью), также повлияло на наше решение о выборе признаков для поверхностной модели термина.
Раз сформированная и введённая в компьютер модель позволяет многократно к ней обращаться с разнообразными запросами. Такими запросами могут быть:
а) каковá длина (в терминоэлементах) каждого термина экспериментального массива и каковá частота терминов такой длины? Такие сведения важны, скажем, при проектировании информационно-поискового языка (ИПЯ), когда на длину дескриптора накладываются определенные ограничения.
б) каковá частота морфологических классов в терминах по всему экспериментальному массиву?
в) каковы статистика и вероятность появления морфологических классов в той или иной позиции терминоструктуры, например, в 1-й и 2-й препозициях или во 2-ой постпозиции и т.д.?
г) сформировать ранжированный перечень морфологических конструкций;
д) каковá частота цепей синтагматических связей вида
и т.д. ?
е) сформировать ранжированный перечень всех синтагматических цепей, выявленных в экспериментальном массиве терминов данного подъязыка;
ж) другие запросы, требующие связи модели с её термином.
Нашу поверхностную модель следует рассматривать как некий микробанк, к которому можно программно обращаться с запросами – с учетом, разумеется, тех сведений, что были введены в него предварительно. Наша модель состоит из двух блоков: в одном хранится сам составной термин, а в другом блоке – его поверхностная модель.
По мере роста содержания информационных потребностей описательные возможности этой модели можно наращивать, т.е. встраивать новые признаки и этим готовить её для удовлетворения всё более растущих «интеллектуальных» потребностей пользователя.
В результате вышеописанного моделирования был сформирован экспериментальный массив из 2000 английских и массив из 2000 русских составных терминов, массив из 2000 английских и массив из 2000 русских моделей терминов.
Результатом машинной обработки этих массивов являются нижеследующие сведения.
1. Частотный словник терминоэлементов
Машинная обработка экспериментальных массивов английских и русских составных терминов позволила сформировать ранжированные словники, содержащие 1426 английских и 1035 русских терминоэлементов соответственно. В Таб. 1 дано 10 самых высокочастотных терминоэлементов каждого подъязыка. ( f – общая частота терминоэлемента).
Таблица 1
Высокочастотные английские и русские терминоэлементы
|
Ранг |
Английские термино-элементы |
f |
% |
Ранг |
Русские термино-элементы |
f |
% |
|
1 |
of |
250 |
4,17 |
1 |
программа |
345 |
5,37 |
|
2 |
data |
182 |
3,04 |
2 |
данные |
84 |
1 |
|
3 |
system |
167 |
2,79 |
3 |
на |
64 |
1 |
|
4 |
image |
145 |
2,42 |
4 |
управле-ние |
63 |
0,98 |
|
5 |
computer |
118 |
1,97 |
5-6 |
с |
59 |
0,92 |
|
6 |
memory |
107 |
1,79 |
5-6 |
язык |
59 |
0,92 |
|
7 |
program |
88 |
1,47 |
7 |
система |
58 |
0,9 |
|
8 |
time |
75 |
1,25 |
8 |
в |
48 |
0,75 |
|
9 |
processing |
65 |
1,08 |
9 |
память |
47 |
0,73 |
|
10 |
digital |
60 |
1 |
10-11 |
программный |
44 |
0,69 |
|
|
|
|
|
10-11 |
устройство |
44 |
0,69 |
Укажем особенности наших терминоэлементов. В терминах вида H-data холлеритные данные считалось присутствие двух терминоэлементов – элемента H (первая буква фамилии автора) и элемента data, хотя термин H-data расположен между двумя пробелами. В большинстве статистических исследований текста «словом» считается набор символов, лежащих между двумя пробелами. В данном случае мы использовали семантический подход, а не формальный.
На этапе предмашинного редактирования термин H-data оформлялся в виде H-#*data, где # есть искусственный пробел между терминоэлементами, а * (звезда) обозначает грамматическое ядро или центр составного термина. Варианты Hollerith *data и H-#*data вводились в массив и считались синонимичными формами. Такое оформление форм термина нужно, например, при формировании классов условной эквивалентности в информационном поиске.
Х. Кучера [8] при подсчёте слов на больших массивах американских текстов, по-видимому, за «слово» принимал набор символов между двумя пробелами и на этом основании покоятся все его статистические результаты.
Случаи же разного оформления одного и того же термина не единичны: read only memory и read-only memory (ROM) постоянная память, GOTO statement и statement GO TO оператор перехода GO TO, read-in of information и reading in information считывание информации, random access memory и random-access memory память с произвольной выборкой (ЗУПВ), binary-coded-decimal (BCD) representation и binary-coded decimal representation двоично-закодированное десятичное представление. При подготовке термина к машинной обработке, особого внимания также требуют и терминоэлементы на латинском языке. В термине вида post mortem dump букв. посмертный дамп терминоэлемент post mortem нами блокировался от автоматического разрыва.
В английской научно-технической литературе выше указанные словосочетания не так уж редки, чтобы ими пренебрегать. Определять границу между элементами в таких терминах приходиться на семантических основаниях, т.е. считать, что распознанный нами элемент выражает один из наших семантических признаков. Безусловно, такой немеханический подход в разбиении многословного термина на элементы требует совсем других трудозатрат и знания особенностей терминируемой ситуации. Но эти трудозатраты компенсируются тем, что накопленный опыт работы с такими терминами может пригодиться при формировании дескрипторного ИПЯ.
2. Поведение морфологических классов в пределах составного термина
ЧАСТОТА МОРФОЛОГИЧЕСКИХ КЛАССОВ. В английских вычислительных терминах высокочастотны: существительное общего падежа (62,11%), прилагательное (13,96), герундий (6,57), в русских вычислительных терминах: существительное (62,4%), прилагательное (21,64). Высокая частота английских существительных общего падежа, по-видимому, обусловлена тенденцией в английских терминах определять один объект через другой, при этом оба существительных употребляются в общем падеже. В целом, активность этих морфологических категорий обусловлена тем, что в данной отрасли нашего материального мира существует широкий набор физических и абстрактных объектов, физических и абстрактных процессов, выражаемых в английском и русском языках категориями предметности и признака.
В терминах обоих научно-технических подъязыков активны предлоги. Это говорит о распространённости аналитизма в терминостроении, т.е. о выражении межсловных связей с помощью слов. Предложным способом выражаются такие семантические признаки, как партитивность, назначение, инструментальность.
Отметим, что в препозициях от (-5) до (-1) английские морфологические классы активнее русских в несколько раз. Это объясняется аналитизмом английского языка, т.е. способностью языка выражать межсловные связи с помощью соположений существительных. Левое существительное обычно играет роль препозитивного атрибута.
ПРИМЕЧАНИЕ: Укажем условные обозначения морфологических классов. Препозитивные морфологические классы (т.е. слева от грамматически главного элемента термина – ядра) отмечены знаком «минус», постпозитивные обозначены положительным числом.
N* или C* – грамматически главное английское существительное общего падежа или русское существительное в именительном падеже (ядро терминоструктуры).
ADJ или П – английское или русское прилагательное, полное или краткое.
ADJcom – английское сложно-составное прилагательное
(вида errorproof сбоеустойчивый).
ADJacr и Пакр – английское и русское прилагательные-акронимы
(alphameric data, СВЧ-#*прибор).
ADV или НАР – наречие, русское или английское.
Срод, Сдат, Свин, Ств – русские существительные в косвенных падежах – в
родительном, дательном, винительном, творительном падеже.
ING или ПЧ1– английское или русское причастие настоящего времени.
ED и ПЧ2– английское или русское причастие прошедшего времени.
ID или ИД – английский или русский идентификатор (т.е. собственное имя,
скажем, вычислительной программы или системы): RESIDENT-#*program,
РЕЗИДЕНТ-#*программа.
GER* – герундий-ядро термина;
GER – герундий в любой позиции.
VN – английское отглагольное существительное.
INF – инфинитив.
Предлоги указаны явно, набраны курсивом (of, for, in). В морфологических конструкциях они набраны большими буквами (OF, FOR, IN).
Таблица 2
Плотность английских и русских морфологических классов
в отдельных позициях терминоструктуры
|
Терми-ноcтрук-тура |
Количество морфологических классов, возникающих в конкретных позициях терминоструктуры | ||||||||||||
| -5 | -4 | -3 | -2 | -1 | * | 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
|
Англий- ская |
4 | 4 | 9 | 10 | 9 | 4 | 6 | 12 | 7 | 6 | 6 | 3 | 10 |
| Русская | – | 1 | 3 | 5 | 10 | 2 | 11 | 15 | 14 | 12 | 8 | 5 | – |
Таблица 3
Активность отдельных морфологических классов в английской терминоструктуре
(первые 5 рангов)
|
Ранг |
Морфо-логический класс |
Позиции структуры составного термина препозиция ядро постпозиция |
||||||
| -3 | -2 | -1 | * | 1 | 2 | 3 | ||
| 1 | N |
63 :0,3 |
396 :0,49 |
996 :0,56 |
1698 :0,85 |
66 :0,17 |
222 :0,56 |
163 :0,78 |
| 2 | ADJ |
97 :0,46 |
177 :0,22 |
241 :0,14 |
16 :0,04 |
61 :0,15 |
6 :0,03 |
|
| 3 | GER |
13 :0,02 |
158 :0,09 |
197 :0,1 |
15 :0,04 |
8 :0,04 |
||
| 4 | ADJ1 |
14 :0,07 |
36 :0,04 |
141 :0,08 |
1 _ |
11 :0,03 |
1 _ |
|
| 5 | of |
190 :0,48 |
8 :0,02 |
4 :0,02 |
||||
Пояснение к Таблицам 3-4. В них представлены 5 самых частотных морфологических классов и указан фрагмент терминоструктуры, а именно: лишь три препозиции, ядро и три постпозиции. На пересечении строки и столбца указана частота (f) класса в данной позиции и (после двоеточия) вероятность (p) появления этого класса в данной позиции. Общая вероятность появления всех морфологических классов в одной и той же позиции, естественно, равна единице.
В Таблице 3 видно, что английское существительное в ядерной позиции (*) возникает с частотой f = 1698 и с вероятностью p = 0,85. Этот же морфологический класс в 1-ой препозиции имеет p = 0,56 (f = 996), в 1-ой постпозиции p = 0,17 (f = 66) и т.д. Герундий становится ядром с вероятностью p = 0,1 (f = 197). Предлог of возникает в 1-й постпозиции с вероятностью p = 0,48 (f = 190).
Таблица 4
Активность отдельных морфологических классов в русской терминоструктуре
(первые 5 рангов)
|
Ранг |
Морф. класс |
Позиции структуры составного термина препозиция ядро постпозиция |
||||||
| – 3 | – 2 | – 1 | * | 1 | 2 | 3 | ||
| 1 | C |
10 :0,04 |
1968 :0,78 |
4 – |
2 – |
2 – |
||
| 2 | Cрод |
761 :0,5 |
544 :0,6 |
176 :0,38 |
||||
| 3 | П |
15 :0,75 |
110 :0,55 |
686 :0,71 |
102 :0,07 |
101 :0,11 |
52 :0,11 |
|
| 4 | ИД |
9 :0,01 |
102 :0,07 |
21 :0,02 |
17 :0,04 |
|||
|
5 |
Ств |
43 :0,03 |
51 :0,05 |
49 :0,01 |
||||
Левое и правое расширения английской и русской терминоструктур
Английской терминоструктуре свойственно левое, т.е. препозитивное, расширение. Из всех 5994 случаев появления всех морфологических классов во всех позициях английской терминоструктуры препозиция была занята в 47,51% случаев (f = 2848), а постпозиция – только в 19.12% случаев (f = 1146), т.е. препозиция заполнялась морфологическими категориями в 2,49 раз чаще, чем постпозиция.
Русской же терминоструктуре, напротив, свойственно правое, т.е. постпозитивное, расширение. Из всех 6420 случаев появления всех морфологических классов во всех позициях русской терминоструктуры постпозиция была занята 3246 раз (50,56%), а препозиция лишь 1174 раза (18,29%), т.е. в 2,76 раз реже, чем постпозиция. (Ядерная позиция, естественно, занималась 2000 раз, что составляет 33,37 %).
Расширение английской препозиции можно объяснить широким использованием такого типа синтаксической связи, как примыкание, а расширение русской постпозиции обусловлено широким использованием синтаксической связи управление. Управление же в английской терминоструктуре ограничено.
Хоть английской терминоструктуре и свойственно левое расширение, но английское существительное (т.е. существительное общего падежа, отглагольное существительное и существительное-акроним) активно возникает по обеим сторонам от ядра: из всех 2848 препозитивных случаев употребления всех морфклассов существительное появляется в 56,21 % (f = 1601), а из всех постпозитивных появлений всех классов оно появляется в 50,52 % случаев (f = 579).
Препозитивное прилагательное встречалось в 25,53 % (f = 727), а постпозитивное – 9,6 % (f= 110).
Герундий в препозиции составляет 6 % , а постпозиции – 2,27 %.
Предлог активен в постпозиции – 18,24 %. Его препозитивное употребление нами не замечено.
О русской препозиции. Из всех препозитивных морфклассов наиболее активно прилагательное (всех видов): из всех 1174 препозитивных употреблений всех морфклассов прилагательное возникало в 79 % случаев (f = 919). Затем идёт менее активное действительное причастие (9,85 %) и страдательное причастие (7,39 %).
О русской постпозиции. Здесь налицо явная активность существительного родительного падежа (Срод). Из всех постпозитивных случаев оно возникает в 48,98 % случаев (f = 1595). Далее с мéньшей активностью следуют: прилагательное (все виды) – 14,47 % , затем идентификатор – 5,17 % , существительное творительного падежа
– 5,33 % , существительное предложного падежа – 4,03 % .
Таблица 5
Активность морфологических классов по мере приближения к ядру
Английские вычислительные термины
| Структура английских составных терминов | ||||||
| П р е п о з и ц и я | П о с т п о з и ц и я | |||||
| -3 | -2 | -1 | * | 1 | 2 | 3 |
|
ADJ(0,75) |
N(0,49) | N(0,56) | N(0,56) | N(0,48) | N(0,56) | N(0,78) |
|
ED 0,15 |
ADJ 0,22 |
ADJ 0,14 |
GER 0,1 |
N 0,17 |
ADJ 0,15 |
GER 0,04 |
|
ING 0,1 |
ED 0,08 |
GER 0,09 |
VN 0,04 |
for 0,07 |
GER 0,04 |
in 0,04 |
|
Всего 8 классов |
Всего 9 |
Всего 8 |
Всего 4 |
Всего 13 |
Всего 12 |
Всего 7 |
Русские вычислительные термины
| Структура русских составных терминов | ||||||
| П р е п о з и ц и я | П о с т п о з и ц и я | |||||
| -3 | -2 | -1 | * | 1 | 2 | 3 |
| П | П | П | С | Сакр | Срод | Срод |
| ПЧ2 | ПОЛ | ПЧ1 | Сакр | П | П | Спр |
| ПЧ1 | НАР | ПОЛ | ИД | Ств | П | |
|
Всего 3 класса |
Всего 5 |
Всего 7 |
Всего 2 |
Всего 12 |
Всего 10 |
|
3. Морфологические конструкции терминов
Таблица 6
Типы морфологических конструкций английских терминов
Машинная обработка 2000 английских и 2000 русских моделей терминов выявила 257 английских и 289 русских морфологических конструкций терминов. В Таблицах 6 и 7 показаны 10 самых частотных конструкций каждого подъязыка.
Укажем некоторые особенности морфологических конструкций.
1) В Таблице 6 английские конструкции первых 5 рангов составляют 37,9% от общего количества (2000 шт.), а русские – 42% (Таблица 6). Первые 10 английских и русских составляют, соответственно, 49,7% и 52,2%, а первые 15 составляют 56% и 57% [2,с.65].
Таблица 7
Типы морфологических конструкций русских терминов

Эти данные принципиально не отличаются от данных, полученных при наблюдении над русскими терминами других предметных областей. Этот факт скорее говорит об универсальности морфологических конструкций, их способности обслуживать тематически далёкие друг от друга области знаний.
2) Результаты в Таблицах 6 и 7 демонстрируют явную разницу в направлениях, по которым происходит расширение (extension) терминоструктуры. Это говорит о существовании в естественных языках своих специфических способов «связывания слов в более крупные единства».
3) В английской терминологии широко используется соположение существительных. (См. ранги 1- 5 в Таб. 6).
О популярности и эффективности такого вида связи Эдуард Сепир [5,с.49] говорит так: «В английских же конструкциях отчётливо просматривается использование соположения двух или нескольких существительных в некоторой определённой последовательности, причём для выражения наличной между ними связности эти существительные не подвергаются никаким особым модификациям».
Безусловно, такое перечисление английских существительных общего падежа значительно усложняет анализ логико-семантической структуры составного термина. И тем не менее, следует согласиться с мнением Э. Сепира о том, что такое соположение слов в словосочетании является «наиболее экономным выражением некоторого рода грамматического представления» [5,с.49].
В противоположность английской терминоструктуре терминоструктура русских вычислительных терминов имеет явную тенденцию расширяться вправо от ядра. Постпозиция увеличивается за счёт существительных косвенных падежей (см. ранги 2-6). Сказывается синтетичность русского языка, т.е. роль каждого элемента в составном термине указывается собственными ресурсами слова [2,с.65-69].
4. Длина вычислительных терминов
В целом, средняя длина вычислительных терминов составляет: английских – 2,95 терминоэлементов, а русских – 3,21 терминоэлементов.
Значительный процент 3-х и 4-хэлементных вычислительных терминов говорит о ещё существующей описательности терминов.
Таблица 8
Длина терминов
(в терминоэлементах)
|
кол-во элементов |
английские (%) |
русские (%) |
кол-во элементов |
англий-ские (%) |
русские (%) |
| 2 | 41,4 | 35,6 | 6 | 1,9 | 5,1 |
| 3 | 34,3 | 31,5 | 7 | 0,8 | 0,9 |
| 4 | 15,7 | 17,4 | 8 | 0,2 | 0,7 |
| 5 | 5,7 | 8,8 |
5. Виды синтагматических цепей в терминах
Машинная обработка моделей терминов выявила 76 английских и 96 русских типов синтагматических цепей, реализованных в составных терминах. Укажем наиболее частотные из них.
Придерживаясь уже устоявшейся в синтаксических исследованиях терминологии, назовём цепочки синтагматических связей лево- и правоветвящимися (Н. Хомский) или регрессивными и прогрессивными (В. Ингве).
Цепь вида
назовём гнездующейся, т.е. имеет место факт наложения синтагматической зависимости. Связь, вложенная в цепь, указана пунктиром. Этот вид цепи реализован в терминах вида: dynamic memory allocation (динамическое распределение памяти), отладка пользовательских программ. У А.И. Пешковского такое «разветвлённое» подчинение нескольких слов одному слову названо соподчинением [4].
В английских терминах расстановка синтагматических стрелок – трудная операция, это особенно относится к распознаванию гнездующихся цепей.
Эти трудности вызваны тем, что три вида синтаксической подчинительной связи (согласование, управление и примыкание) слабо и неярко выражаются с помощью изменения форм слов.
Таблица 9
Синтагматические цепи в терминах
В русских же терминах согласование и управление заявлено вполне выразительно, а в английских совсем слабо и невыразительно. В результате, всю тяжесть выражения межсловных связей в многословном термине берет на себя вид «примыкание», т.е. когда зависимое слово выражает свою зависимость не изменением формы, а только «соположением» (Э. Сэпир).
Ни сама морфологическая конструкция, ни сама синтагматическая цепь составного термина не сообщают нам о самом содержании связи, что возникает между элементами термина. Напротив, наиболее частотные конструкции «сигнализируют» о многочисленных семантических отношениях между терминоэлементами.
Отсюда вытекает необходимость наблюдения над самим содержанием синтагматических связей в составном термине, что ведёт к выявлению логико-семантической структуры составного термина [2,с.86].
Моделирование семантики термина
(второй, т.е. семантический, этап)
Анализ содержания связей между элементами в пределах составного термина с пре- и постпозициями, а именно формализованное представление глубинной структуры такого термина, составляет второй этап нашего исследования.
В предыдущей статье о нулевом этапе мы перечислили выявленные нами 19 семантических признаков. Ниже опишем один из них – количественность. Он – как и все – представлен 4 аспектами: содержанием, лексическим выражением, семантической моделью и трансформационной процедурой.
Количество аспектов может быть увеличено по мере усложнения моделирования признака.
Семантический признак <количественность>
Аспект 1
Содержание признака:
из двух анализируемых слов термина грамматически подчиненное обозначает единицу измерения и количество таких единиц, содержащихся в субъекте или процессе, обозначенных грамматически главным словом. Единица измерения и количество единиц в термине иногда только подразумевается.
Аспект 2
Лексическое выражение признака:
двухкубовая память, двухядерный процессор, многозадачный режим трансляции, однокристальный микропроцессор, мощныйканал, сверхбольшая ИС, быстрый доступ, bi-directional buss, quick access,
2-branch IF statement, two-pass compiler,
quick access memory
Аспект 3
Семантическая модель

Аспект 4
Трансформация:
Tквант-суб / действ <=> S + P + Dir.Obj.
| двусторонняя шина | <=> | Шина |
ИМЕЕТ |
две стороны |
| многотерминальная вычислительная система | <=> | Вычислительная система | ИМЕЕТ | много терминалов |
| слабый канал | <=> | Канал | ИМЕЕТ | малое количество подсоединенных устройств |
| multiprocessor system | <=> | System | HAS | many processors |
У этого признака долгая история. Как отдельная категория количества он был выделен ещё И.А. Бодуэном де Куртэнэ [1,с.18] который считал эту категорию "в некотором роде параллельной к понятию количества в математике".
Категория количественности исследовалась также Б.Л.Уорфом, который упоминал её среди своих "скрытых категорий" или "криптотипов" [6,с.18]. Он исследовал сочетания существительных, обозначающих однородную и не имеющую границ массу (вода, масло, мясо, железо), с существительными, обозначающими форму, т.е. ту или иную конкретизацию (кусок, брусок, мешок, чашка). В сочетаниях слов, обозначающих материальное количество, им выделялось значение "форма + бесформенное вещество". Он указывал, что это значение обычно выражается грамматической формой вида N* + OF + N1 (cup of coffee) или вида N-1 N* (wood stick). Подобные сочетания он называл формулами, в которых предлог OF имеет явное значение "содержащийся" [6, с.144-145].
Этот семантический признак широко распространён в терминосистеме нашей предметной области, ибо количественная оценка любого явления в вычислительной технике (ВТ) имеет существенное значение. С помощью этого признака языковáя система и выражает эту оценку.
Признак <количественность> в значении термина занимает существенное место не только в связи с ролью количественных оценок в области ВТ, но также и в связи с обычно возникающими проблемами совместимости разнообразных вычислительных устройств, элементной базы ЭВМ, носителей данных, каналов связи, языков программирования и т.п. Отсюда следует ожидать еще бóльшего количества терминов с этим признаком.
Термины с этим семантическим признаком также широко применяются в автоматизированном поиске фактографической информации.
Резюме
Предложенные статистико-вероятностные сведения о поведении морфологических категорий и синтагматических связей в пределах составного термина, полученные на достаточно доверительных выборках терминов двух языков, могут способствовать уяснению такого краеугольного понятия языковóй системы как «терминоэлемент». Это понятие лежит в основании проблемы будущей нормализации и стандартизации отраслевых терминологий. Решение этой проблемы – хотя бы частичное – способно увеличить эффективность многоязычных информационно-поисковых тезаурусов и других систем, занимающихся автоматическим анализом и синтезом текста.
Следует лишь восхищаться пытливостью и профессиональностью учёных далеких 40-х годов ушедшего века, которые занимались терминоведением, понимая его знáчимость в повышении эффективности умственного труда. Известно мнение Д.С. Лотте о том, что любая терминосистема «должна быть составлена из наивозможно мéньшего числа отдельных терминоэлементов» [3,с.94].
Эти терминоэлементы, по-видимому, будут иметь своеобразный внешний вид, желательно, программно распознаваемый.
Формализованное представление семантики многословного термина, вскрытие содержания отношений между элементами в пределах составного термина составляет второй этап нашего исследования, т.е. этап формализованного представления линейно-упорядоченной глубинной структуры составного термина [2]. В данной статье этот этап описан лишь частично.
Литература
1. И.А. Бодуэн де Куртэнэ. Количественность в языковом мышлении //Избр. труды по общему языкознанию. – М.:1963. –Т.2. – с.278-287.
2. В.И. Глумов. Структурно-семантическая организация составных терминов русского и английского языков (на материале текстов по вычислительной технике и программированию). Дис. на соиск. уч. ст. к. филолог. н. (10.02.21 – структурная, прикладная и математическая лингвистика). Горький, Горьковский государственный университет им. Н.И. Лобачевского, 1986. –168с. (Приложение – 81с.)
3. Д.С. Лотте. Некоторые принципиальные вопросы отбора и построения научно-технических терминов//Изв. АН СССР. Отделение технических наук. –1940, №7. – с.79-98.
4. А.И. Пешковский. Русский синтаксис в научном освещении. – М.:Учпедгиз,1956. – 511с.
5. Э. Сэпир. Язык: Введение в изучение речи. –М.–Л.:Соцэкгиз, 1934. – 223с. (Перев. с англ.)
6. В.Л. Уорф. Отношение норм поведения и мышления к языку // Новое в лингвистике. – 1960. – Вып.1. – с.135-169.(Перев. с англ.).
7. Ch. C. Fries. The structure of English: An Introduction to the Construction of English Sentences. –New York, 1952.
8. H. Kucera, W.N. Francis. Computational analysis of present-day American English. Brown UniversityPress, Providence, RhodeIsland, USA, 1967.
Информация:
1) В.И. Глумов, к. филолог. н. (10.02.21 – структурная, прикладная и математическая лингвистика),зав. кафедрой гуманитарных и социально-экономических дисциплин Нижегородского филиала Российского Государственного Гуманитарного Университета (РГГУ, г. Москва)
2) Данная статья, опубликованная в 2008 году, выложена на сайт 15 сентября 2015 года.
| Скачать статью в pdf формате |

