А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ь Ы Ъ Э Ю Я

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА — математическая дисциплина, предметом к-рой является разработка формального аппарата для описания строения естественных и нек-рых искусственных языков. Возникла в 50-х гг. 20 в.; одним из гл. стимулов появления М. л. послужила назревшая в яз-знании потребность уточнения его осн. понятий. Методы М. л. имеют много общего с методами матем. логики — матем. дисциплины, занимающейся изучением строения матем. рассуждений,— и в особенности таких ее разделов, как теория алгоритмов н теория автоматов. Широко используются в М. л. также алгебраич. методы. М. л. развивается в тесном взаимодействии с языкознанием. Иногда термин «М. л.» используется также для обозначения любых лингвистич. исследований, в к-рых применяется к.-л. матем. аппарат. Матем. описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование к-рого проявляется в речевой деятельности его носителей; ее результатом являются «правильные тексты» — последовательности речевых единиц, подчиняющиеся определ. закономерностям, многие из к-рых допускают матем. описание. Разработка и изучение способов матем. описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М. л.— теории способов описания сиитаксич. структу-р ы. Для описания строения предложения — точнее, его сиитаксич. структуры — можно либо выделить в нем составляющие — группы слов, функционирующие как цельные сиитаксич. единицы, либо указать для каждого слова те слова, к-рые ему непосредственно подчинены МАТЕМАТИЧЕСКАЯ 287 (если такие есть). Так, в предложении «Ямщик сидит на облучке» (А. С. Пушкин) при описании по 1-му способу составляющими будут все предложение П, каждое его отд. слово и группы слов А = сидит на облучке и В = на облучке (см. рис. 1; стрелки означают «непосред- ственное вложение»); описание по 2-му способу дает схему, показанную на рис. 2. Возникающие при этом матем. объекты называются системой составляющих (1-й способ) и деревом синтаксич. подчинения (2-й способ). Точнее, система составляющих — это множество отрезков предложения, содержащее в качестве элементов все предложение н все вхождения слов в это предложение («однословные отрезки») и обладающее тем свойством, что каждые два входящих в него отрезка либо не пересекаются, либо один из них содержится в другом; дерево синтаксич. подчинения, или просто дерево подчинения, есть дерево, множеством узлов к-рого служит множество вхождений слов в предложение. Деревом в математике называется множество, между элементами к-рого — их называют узлами — установлено бинарное отношение — его называют отношением подчинения и графически изображают стрелками, идущими от подчиняющих узлов к подчиненным,—такое, что: 1) среди узлов имеется точно один — его называют корнем,— не подчиненный никакому узлу; 2) каждый из остальных узлов подчинен точно одному узлу; 3) невозможно, отправившись из к.-л. узла вдоль стрелок, вернуться в тот же узел. Узлы дерева подчинения — это вхождения слов в предложения. При графич. изображении система составляющих (как на рис. 1) также приобретает вид дерева (дерева составляю-щ и х). Построенное для предложения дерево подчинения или систему составляющих часто называют его синтаксич. структурой в виде дерева подчинения (системы составляющих). Системы составляющих используются пре-им. в описаниях языков с жестким порядком слов, деревья подчинения — в описаниях языков со свободным порядком слов (в частности, русского). Формально для каждого (не слишком короткого) предложения можно построить много разных синтаксич. структур любого из диух видов, но среди них только одна пли несколько являются правильными. Корнем правильного дерева подчинения служит обычно сказуемое. Предложение, имеющее более одной правильной синтаксич. структуры (одного вида), называется синтаксически омоии-м и ч н ы м; как правило, разные синтаксич. структуры отвечают разным 288 МАТЕМАТИЧЕСКАЯ смыслам предложения. Напр., предложение «Школьники из Ржева поехали в Торжок» допускает два правильных дерева подчинения (рис. 3, а, б); первое из них отвечает смыслу «Ржевские школьники поехали (не обязательно из Ржева) в Торжок», второе—«Школь- ники (не обязательно ржевские) поехали из Ржева в Торжок». В русском и ряде др. языков деревья подчинения предложений «делового стиля» подчиняются, как правило, закону проективности, состоящему в том, что все стрелки можно провести над прямой, на к-рой записано предложение, таким образом, что никакие две из ннх не пересекутся и корень не будет лежать ни под какой стрелкой. В языке худож. лит-ры, особенно в поэзии, отклонения от закона проективности допустимы и чаще всего служат задаче создания определ. худож. эффекта. Так, в предложении «Друзья кровавой старины народной чаяли войны» (Пушкин) непроективность приводит к эмфатич. выделению слова «народной» и одновременно как бы замедляет речь, создавая этим впечатление известной приподнятости, торжественности. Имеются и др. формальные признаки деревьев подчинения, к-рые могут использоваться для характеризации стиля. Напр., макс, число вложенных друг в друга стрелок служит мерой «синтаксич. громоздкости» предложения (см. рис. 4). Для более адекватного описания строения предложения составляющие обычно помечаются символами грамматич. категорий («именная группа», «группа переходного глагола» и т. n.)i а стрелки дерева подчинения — символами син-таксич. отношений («предикативное», «определительное» и т. п.). Аппарат деревьев подчинения и систем составляющих используется также для представления глубинно-син-таксич. структуры предложения, к-рая образует промежуточный уровень между семантич, и обычной синтаксич. структурой (последнюю часто называют поверхностно-синтаксической). Более совершенное представление синтаксич. структуры предложения (требующее, однако, более сложного матем. аппарата) дают системы синтаксич. групп, в к-рые входят как словосочетания, так и синтаксич. связи, причем не только между словами, но и между словосочетаниями. Системы синтаксич. групп позволяют совмещать строгость формального описания строения предложения с гибкостью, присущей традиционным, неформальным описаниям. Деревья подчинения и системы составляющих являются предельными частными случаями систем синтаксич. групп. Другой раздел М. л., занимающий в ней центр, место,— теория фор- мальных грамматик, начало к-рой было положено работами Н. Хом-ского. Оиа изучает способы описания закономерностей, характеризующих уже не отд. текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются с помощью формальной грамматики— абстрактного «механизма», позволяющего с помощью единообразной процедуры получать правильные тексты" данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — порождающая грамматика, или грамматика Хомского, представляющая собой упорядоченную систему Г = ( V, W, П, R >, где V и W — непересекающиеся конечные множества, называемые соответственно основным, или терм и-нальным, и вспомогательным, или нетерминальным, алфавитами (их элементы называются соответственно основными, или терминальными, и вспомогательными, или нетерминальными, символам и), П — элемент W, называемый начальным символом, и R — конечное множество правил вида ф -> ф, где фиф — цепочки (конечные последовательности) из основных и вспомогат. символов. Если ф -> tp — правило грамматики Г и cot, а>2—цепочки из основных и вспомогат. символов, говорят, что цепочка coi^coj не посредственно выводима в Г из Ш1фа>2. Если ?о, |i, ..., En — цепочки и для каждого i = 1.....п цепочка gi непосредственно выводима из jji-i, говорят, что |„ в ы-в о д и м а в Г из go. Множество тех цепочек из осн. символов, к-рые выводимы в Г из ее начального символа, называется языком, порождаемым грамматикой Г, и обозначается Ь(Г). Если все правила Г имеют вид TliArij -» tiicoTia, то Г называется грамматикой составляющих (пли непосредственно состав- ляющих), сокращенно НС-г р а м м а-т и к о й; если при этом в каждом правиле цепочки Гц и Гц (п р а в ы й и левый контексты) пусты, то грамматика называется бесконтекстной (или контекстно-свобод-н о й), сокращенно Б-г рамматикой (или КС-г рамматикой). В наиболее обычной лингвистич. интерпретации осн. символы представляют собой слова, вспомогательные — символы грамматич. категорий, начальный символ — символ категории «предложение»; при этом язык, порождаемый грамматикой, интерпретируется как множество всех грамматически правильных предложений данного естеств. языка. В НС-грамматике вывод предложения дает для нее дерево составляющих, в к-ром каждая составляющая состоит из слов, «происходящих» от одного вспомогат. символа, так что для каждой составляющей ука. зывается ее грамматич. категория. Так, если грамматика имеет, в числе прочих, правила П -> Si,у,им, Vy -> V О.О-* у S»,y, предл, V -» СИДИТ, SMyjK, ед. , им -+ На, ЯМЩИК, S„y>K. гд.. предл. -+ ОблуЧКе, ТО предложение «Ямщик сидит на облучке» имеет вывод, показанный на рис. 5, где стрелки идут от левых частей применяемых правил к элементам правых частей. Система составляющих, отвечающая этому выводу, совпадает с изображеивой на рис. 1. Возможны и др. интерпретации: напр., осн. символы могут интерпретироваться как морфы, вспомогательные — как символы типов морф и допустимых цепочек морф, начальный символ — как символ типа <словоформа>, а язык, порождаемый грамматикой,— как множество правильных словоформ (морфология, интерпретация); употребительны также морфонологич. и фонология, интерпретации. В реальных описаниях языков используются обычно «многоуровневые» грамматики, к-рые содержат последовательно работающие синтаксич., морфология, и морфонологически-фонологич. правила. Другой важный тип формальной грамматики — доминационная грамматика, к-рая порождает множество цепочек, интерпретируемых обыя-но как предложения вместе с их синтаксич. структурами в виде деревьев подчинения. Грамматика синтаксич. групп порождает множество предложений вместе с их синтаксич. структурами, имеющими вид систем синтаксич. групп. Имеются также раэл. концепции трансформационной грамматики (грамматики деревьев), служащей не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих. Примером может служить Д-г рамматика — система правил преобразования деревьев, интерпретируемых как «чистые» деревья подчинения предложений, т. е. деревья подчинения без линейного порядка слов. Особняком стоят грамматики М о и т е г ю, служащие для одновременного описания синтаксич. и семантич. структур предложения; в них используется сложный математико-логич. аппарат (т. наз. интенсиональная логика). Формальные грамматики находят применение для описания не только естеств., но и искусств, языков, в особенности языков программирования. В М. л. разрабатываются также авали т и ч. модели языка, в к-рых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом к-рых является описание нек-рых аспектов строения языка. В этих моделях обычно используется несложный матем. аппарат — простые понятия теории множеств и алгебры; поэтому аналитич. модели языка иногда называют теоретико-множественными. В аналитич. моделях наиболее простого типа исходными данными служат множество правильных предложений и система окрестностей — совокупностей «слов», принадлежащих одной лексеме (напр., {дом, дома, дому, домом, доме, дома, домов, домам, домами, домах}). Простейшим производным понятием в таких моделях является замещаем ость: слово а завещаемо на слово Ь, если всякое правильное предложение, содержащее вхождение слова а, остается правильным при замене этого вхождения вхождением слова Ь. Если а замещаемо иа b и Ь на в, говорят, что а и Ь взаимозамещаем ы. (Напр., в рус. яз. слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозаме-щаемы.) Класс слов, взаимозамещае-мых между собой, называется семейством. Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из к-рых приблизительно соответствует традиционной системе частей речи. В др. типе аналитич. моделей вместо множества правильных предложений используется отношение потенциального подчинения между словами, означающее способность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных грамматич. категорий — напр., формальное определение падежа существительного, представляющее собой процедуру, к-рая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, являющихся формами существительных. В аналитич. моделях языка используются простые понятия теории множеств и алгебры. К аналитич. моделям языка близки дешифровочные модели — процедуры, позволяющие по достаточно большому корпусу текстов на неизвестном языке без к.-л. предварит, сведений о нем получить ряд данных о его структуре. По своему назначению М. л. является прежде всего инструментом теоретич. языковедения. В то же время ее методы находят широкое применение в прикладных лингвистич. исследованиях — автоматической обработке текста, автоматическом переводе и разработках, связанных с т. наз. общением между человеком и ЭВМ. • Кулагина О. С Об одном способе определения грамматич. понятий иа базе теории множеств, в сб.: Проблемы кибернетики, в. 1, М., 1958: X о м с к и й Н., Синтаксич. структуры, в сб.: НЛ. в. 2, М., 1962; Гладкий А. В., Мельчук И. А.. Элементы матем. лингвистики, М., 1969 (лит.); их же. Грамматики деревьев, I, II, в сб.: Информационные вопросы семиотики, лингвистики и автоматнч. перевода, в. 1, 4, М., 1971—74 (лят.): Маркус С., Теоретико-множеств. модели языков, пер. с англ., М., 1970 (лит.); Гладкий А. В., Формальные грамматики и языки, М.. 1973 (лит.); его же. Попытка формального определения понятий падежа и рода существительного, в сб.: Проблемы грамматич. моделирования, М., 1973 (лит.); его же, Синтаксич. структуры естеств. языка в автоматизиров. системах общения, М., 1985 (лит.); С у х о т и и Б. Б., Оптимизационные методы исследования языка, М.. 1976 (лит.); Севбо И. П., Графич. представление синтаксич. структур и стнлнстнч. диагностика, К., 1981; П а р т н Б, X., Грамматика Монтегю, мысленные представления н реальность, в кн.: Семиотика, М., 1983; Montague R., Formal philosophy. New Haven — L., 1974 (лит.). Л. В. Гладкий.
МАРИЙСКИЙ ЯЗЫК МАШИННЫЙ ПЕРЕВОД