2013г. О проблеме автоматического понимания многословных терминов

Из: Глумов В.И. О проблеме автоматического понимания многословных терминов. Сборник тезисов Международной научной конференции MegaLing’2013 “Horizons of Applied Linguistics and Linguistic Technologies” (Горизонты прикладной лингвистики и лингвистических технологий), Направление – «Интеллектуальные системы обработки языка» , Украина, Киев, 26 сентября 2013 года. (Сайт конференции http//megaling.ulif.com.ua/attachments/article/108/Gloumov_Tezysy.pdf)
О проблеме автоматического понимания многословных терминов
Глумов Виктор Игнатьевич
Нижегородский филиал Московского государственного университета
экономики, статистики и информатики (МЭСИ)
Нижний Новгород, Россия
| Скачать статью в pdf формате |
Принципиален вопрос Р.И. Павилёниса: «что́ знает человек, когда он понимает выражение» языка? [3,с.9]. Поверхностные и глубинные связи между элементами в термине распознаются на основе как лингвистических, так и экстралингвистических знаний – в момент порождения или чтения термина человек мысленно видит всю «картину мира». Если мы хотим считать наш анализатор терминов «интеллектуальным», тогда его следует снабдить такими же знаниями. Если под лексическим значением слова понимать широкий и все обнимающий образ, тогда и в объем лексического значения, скажем, слова «Волга» должен входит и тот факт, что река Волга у Нижнего Новгорода имеет ширину несколько сот метров, а в самых верховьях лишь около метра. Поэтому, утверждение «Иван перешагнул реку Волгу у Нижнего» наш анализатор должен «понимать» как ложное утверждение.
Заранее для слова «Волга» перечислить все возможные признаки его лексического значения нельзя – поэтому, анализатор должен отыскивать эти признаки в корпусе отраслевых текстов, который (т.е. корпус) следует считать своеобразной Центральной Системой Знаний (ЦСЗ). Благодаря такому поиску анализатор наращивает свою собственную Систему Знаний (СЗ), «обучая» самого себя. Одной из частных задач в автоматическом анализе терминов является распознавание одинаковости лексических значений слов, составляющих, например, следующие ряды:
ряд «лошадь, конь, жеребец, кляча»,
ряд «стул, кушетка, диван, табуретка»,
ряд «отец, мать, внук, теща, золовка, кум»,
ряд “write, scrawl, autograph, print” (Ч. Филлмор)” 1 ,
ряд «шелковый путь/дорога/тропа, ситцевый путь, пшеничный путь» 2. Ряд слов, обозначающих близость или отдаленность родства, нам особо интересен, потому что система отношений между членами этого ряда стала общенародной 3. Этот ряд мы хотим использовать в качестве полигона, на котором мы хотим испытать наш подход к формализованному представлению лексических значений других слов.
«Прототипное значение» [5] поименованного участника этого ряда включает в себя – кроме одушевленности и неотъемлемых частей человеческого тела 4 – другие признаки, описывающие деятельность человека. Участники этого ряда объединены в специальную семантическая сеть «Родство», способную генерировать умозаключения/выводы вида: «если Федор является отцом Анастасии, а Анастасия является матерью Виктора, тогда Виктор является внуком Федора, а Федор дедом Виктора». Однородность участников ряда создает возможность анализатору, найдя новый имманентный признак в текстах, приписывать этот признак всем участникам. Такую операцию мы называем «обучением сети» или «пополнением знаний». Каждый ряд обрабатывается своей семантической сетью, нацеленной на поиск имманентных признаков, свойственных участникам этой сети. Сеть «Корабли», скажем, способна распознавать признак «плоскодонность» в текстах вида «лодка с плоским дном», «плоскодонка», «плоскодонная лодка», «лодка, имеющая плоское дно» [1]. При описании объема лексического значения терминологической единицы мы опираемся на следующее методологическое положение: весь мир содержит лишь вещи и их качества. «Вещь – это система качеств. Качество, свойство, признак при таком подходе есть отношение предмета к другому предмету.» [4,с.21]. Линейная последовательность словоформ рассматривается нами как последовательность имен вещей и их признаков. Расположение словоформ в цепи определяется как законами языка, так и целью речи.
Литература
1.Глумов В. И. О формализованном представлении лексических значений «голубоглазость» или «толстостенность» в англо-русских составных терминах».(с. 128-136). В: Мат-лы 2-ой Межд. научно-практич. конф. «Информационные технологии в гуманитарном образовании», Пятигорск, ГОУ ВПО «Пятигорский государственный лингвистический университет (ПГЛУ)», 22-23 апреля 2009 года. Изд. Пятигорск, ПГЛУ, 2009. – 554с. http://itgo.pglu.ru ] (См. сайт rsuhnn.ru)
2.Келер В.Р. СЕРГЕЙ ВАВИЛОВ. М.: «Молодая гвардия», 1975. – 320с.
3.ПавилЁнис Р.И. Проблема смысла . Современный логико-философский анализ языка. М.:Мысль, 1983. – 286с.
4.Уёмов А.И. Вещи, свойства и отношения. М.: изд. АН СССР, 1963. – 184с.
5.Charles J. Fillmore. Topics in lexical semantics. – In: “Current Issues in LinguisticTheory” (ed. By Roger W. Cole). Bloomington and London, 1977, pp. 76-138. Indianna University Press, 1977.
1Нам представляется интересной идея Ч. Филлмора о «прототипном значении» глагола, т.е. способность глагола описывать какую-то деятельность – скажем, описывать процесс write, как некто водит неким заостренным инструментом по какой-то поверхности, оставляя следы. Иными словами, описывается «сцена-прототип, связанная с данным глаголом». Такая сцена «… более или менее полно описывает то основное содержание, которое вкладывается в глагол, если при этом отсутствует какая-либо добавочная информация» [5].
2Можно принять, что нижеследующие слова древнегреческого философа Платона [2] тоже относятся и к нашей задаче: «Лошадь увидеть всякий сумеет, а вот увидеть лошадиность!»
(То есть способность делать обобщения, видеть связь явлений, а не их изолированность.)
3Ср. «Всякая наука начинает с результатов, добытых мышлением и речью народа» (В.В. Виноградов).
4Признак неотъемлемости части целого нами используется для автоматического понимания сочетаний вида самолет с широкими крыльями, ширококрылый самолет и т.п.
Информация:
Данные тезисы, опубликованные в 2013 году, размещены на сайте gloumov.com 21 августа 2015 года.
| Скачать статью в pdf формате |

