Автоматизированная система морфемно-словообразовательного анализа как инструмент лингвистических исследований часть 2

Такая лингвистическая модель позволяет автоматически описать каждую морфных структуру через программную процедуру: заледениты / P2R5И7S8F10 — где латинскими буквами обозначается тип морфа P — префикс, R — корень, S — суффикс, F — флексия, и — интерфиксы, X — постфикс, а цифрами — границы морфа через порядковый номер ( с начала слова) конечной графемы каждого морфа R4I5R8S9F10 — лед о риз-- (отметка нулевого аффикса также определяется как графема). Формализованное описание морфных структуры слова в виде программной процедуры отражает функциональную закономерность организации слова на морфемному уровне — PRИSF, а субстанциальное выражение этой структуры представлены через количественно-графемно модель (за — 2, лед — 5; ен — 7, и — 8, ты — 10). Графемно-цифровые пределы морфов в интерфейсе словаря представлены через латинскую букву по порядковому номеру в алфавите: R4I5R8S9F10 = RD (4) IE (5) RH (8) SJ (9) FK (10). Автоматически сформирована программная процедура модели морфных структуры, связана с формой выражения каждого слова МБД, дает полную лингвистическую информацию о морф, его структурные отношения с другими морфами и определяется как рабочая единица морфемного базы данных (представленной lex-файлом). Согласно разработанным принципам формализации морфемный анализ проводился с помощью удобного компьютерного инструмента, работу которого обеспечивает файл morfem.
купить платье
exe. Каждое слово lex файла представляется на отдельной компьютерной карточке Рис.1. Каждое поле электронной карточки выполняет свою функцию: 1 поле. дуло . Экран карты, на котором освещается слово. Определение морфных структуры слова осуществляется следующим образом: на экране является подвижной курсор, который передвигается мышью влево или вправо графемно записи слова; наведя курсор на место морфных шва, нужно мышью актуализировать окошко, в котором освещаются позиционно-функциональные типы морфов; выбрав мышью нужный тип морфа, можно автоматически приписать ему отметку в верхнем индексе слова. Рис.2

  1. п
    оле. № слова в морфемной базе данных (МБД) , что позволяет осуществлять навигацию по lex-файла.
  2. поле. <<<- левосторонняя навигация . Позволяет вернуться к предыдущему слову в МБД.
  3. поле. >>> — правосторонняя навигация . Позволяет перейти к следующему слову в МБД.
  4. поле. Reset . Позволяет исправить информацию о морфных структуру слова.
  5. поле. Save . Позволяет запомнить информацию об определенной морфных структуру слова в виде программной процедуры. Запись информации осуществляется на res. ini — файлы в таком виде:
Рис.3 В процессе укладки электронного морфемного словаря было учтено, что корневая система украинского языка характеризуется высокой степенью омонимии и аломорфии, поэтому к одной однокоренных выборки могут попасть слова из омонимическими корнями, а слова с аломорфив одного корня могут быть сгруппированы в различные однокоренные классы. В электронном морфемному словаре проблему аломорфии корней было решено таким образом: каждому корневом морфу, характеризующееся различными морфонологичними зминами1, было приписано аломорфив этого корня в непроизводным слове, то есть его первичный аломорфив, который условно в пределах МБД можно назвать инвариантным корнем по-лед-Энит — лед , лед-овый — лед. Информация о инвариантный корневой аломорфив приписывается каждому аломорфив одной корневой морфемы, позволяет автоматизировать идентификацию тождественных по значению корневых морфов, которые субстанциально отличаются хотя бы одной графемы. Омонимия корневых морфов была снята приписыванием каждому омонимический корневом морфу цифрового кода, который позволяет определять корни-омонимы как различные единицы морфемного базы данных: в существительному вод-а определяется корень вод1 , а в глаголе вод-и-ти — корень вод2 . Информация о аломорфию и омонимия анализируемого морфа записывается в 7-м поле карточки файла morfem. exe Корень — дул1 , а затем автоматически приписывается к анализируемого слова с определенной морфных структурой (программной процедурой) в res. ini — файле. Параллельно с автоматизированным формированием lex-файла в Access создается две базы данных: база аломорфичних корней и база омонимических корней. Связь с этими БД осуществляется также через электронную карточку файла morfem. exe
  1. поле. Рассматриваемый корень . Это поле находится в правом верхнем углу карты. Для освещения на карточке информации о аломорфию и омонимия корня это поле можно использовать в двух режимах морфемного анализатора: 1) в этом окошке автоматически освещается корень, границы которого определены в 1-м поле; 2) в случае необходимости здесь необходимо напечатать корень, информацию о аломорфию или омонимии которого хочет получить пользователь-лингвист.
  1. поле. Go . Щелчком мыши на эту кнопку, актуализируется связь корня 8-го поля электронной карточки с БД омонимических и аломорфичних корней. Информация о корнях-омонимы и корневые алломорфы освещается в 10-м и 11-м полях
  2. поле. Аломорфични корни — дул1 о | дубль, дул2-я | дубль . Подается информация о аломорфию рассматриваемого корневого морфа.
  3. поле. омонимический корни — дул1 | дуло, дул2 | дуля, дул3 | Дулеб, дул4 | дуливка . Подается информация о омонимические корневые морфы.
12 поле — Комментарий , в котором подается необходимое для проведения морфемного анализа информация о лексическом значении омонимов, этимологические толкования заимствованной лексики, объяснение сложных случаев морфемного анализа, и тому подобное. На сегодняшний день завершена работа над созданием морфемного модуля АСМСА в рабочем варианте, который состоит из трех баз данных: 1) базы морфных структур слов ≈ 170 тыс. Слов; 2) базы аломорфичних корней (≈ 2500 корней); 3) базы омонимических корней (≈ 3100 корней). Заключение морфемного словаря и использование морфемного модуля в режиме лингвистического анализа обеспечивается автоматизированным инструментом, функции которого представлены на электронной карточке файла morfem. exe. Морфемный электронный словарь нуждается верификации. Формализация морфных структур слов через их описание в терминах программных процедур МБД позволила создать на основе этой базы данных автоматизированная система лингвистического анализа, способную выполнять целый ряд задач:
  • группировать лексику в однокоренные и спильноафиксальни классы;
  • классифицировать лексику по количественно-морфных моделями;
  • создавать корневые и аффиксальные словари;
  • проводить морфемный анализ исходных словоформ.