<<
>>

ПРОСТОЙ ПРИМЕР ДИСТРИБУЦИОННОГО АНАЛИЗА

Мы еще далеки от того, чтобы прийти к удовлетворительному представлению о лингвистическом описании. Мы еще не сказали, в частности, как определяются приемлемые сочетания слов. Пере­числение списком всех приемлемых последовательностей слов со­вершенно невозможно, поскольку, как мы видели, ни один естест­венный язык нельзя рассматривать как ограниченное множество предложений.

В случае замкнутого корпуса материала можно было бы, конечно, составить список всех фонологически (или орфографи­чески) различных предложений и затем решать вопрос о приемле­мости, справляясь в этом списке. Но это было бы малоинтересно в том смысле, что ничего не давало бы для нашего понимания спо­собности носителя языка производить «новые» предложения; это не было бы к тому же и самым экономным способом описать данный текст. Если продолжить рассмотрение этого вопроса, мы поймем, по какой причине.

В достаточно большой и представительной выборке из предло­жений какого-либо языка дистрибуции разных слов будут в зна­чительной мере совпадать. Например, вместо milk ‘молоко’ можно поставить beer ‘пиво’, water ‘вода’, gin ‘джин’ и т. п. не только в I drink a pint of milk; этот же ряд слов мог бы появиться и во мно­гих других окружениях, в которых может встретиться milk. Ана­логично, слова they ‘они’, we ‘мы’ и you ‘вы’ могут заменить I ‘я’, a buy ‘покупать’, take ‘брать’, order ‘заказывать’ и т. д. могут за­менить drink ‘пить’ во многих других окружениях, кроме нашего предложения. Слова, которые, как правило, способны заменять друг друга в целом ряде различных предложений, можно сгруппи­ровать на этом основании в дистрибуционные классы.

Допустим, что нам необходимо проанализировать корпус мате­риала, состоящий из следующих 17 «предложений»: ab, аг, рг, qab, dpb, аса, pea, pep, qar, daca, qaca, dacp, dacqa, dacdp, qpcda, acqp, acdp. Разными буквами обозначены разные слова: условная запись используется из соображений общности, а также чтобы пояс­нить, что на данном этапе мы обходимся без непосредственного привлечения семантики.

(Впрочем, это может вызвать известные сомнения, поскольку мы исходим из того, что приемлемость сохра­няется при операции замены, а понятие «приемлемости» включает «осмысленность». Мы, однако, стремимся разграничить «граммати­ческую правильность» и «осмысленность», хотя еще не достигли этого.) Мы видим, что аир имеют некоторые общие окружения (ср. -г, рс-, dac-), так же как & и г (ср. a-, qa-) и d и q (ср. dac-a, -аса, ас-р), но что с имеет уникальную дистрибуцию (а-а, p-а, р-р, qa-a, da-a, da-p и т. д.) в том смысле, что ни в одном окружении, в котором встречается с, не встречается никакое другое слово. Теперь поместим а и р в класс X и поставим классный показатель X всюду, где встретятся а или р (предложения, которые отличаются только тем, что в одном из них представлено а, там, где в другом представлено р, будут сведены нашими формулами в один класс предложений): Xb, Xr (ar, pr), qXb, dXb, ХсХ (аса, рса, рср), qXr, qXcX, dXcX (daca, dacp), dxcqX, dXcdX, qXcdX, XcqX, XcdX. Теперь сгруппируем b и г в дистрибуционный класс Y, a d и q — в класс Z. Подставив Y вместо b и г, a Z вместо dw q, получим:

(1) XY (Xb, Xr); (2) ZXY (qXb, qXr, dXb); (3) XcX; (4) ZXcX (qXcX, dXcX); (5) ZXcZX (dXcqX, dXcdX, qXcdX); (6) XcZX (XcqX, XcdX). Таким образом, мы можем описать предложения нашего корпуса в терминах шести структурных формул, определяющих приемлемые последовательности классов слов (с является одноэле­ментным классом). Эти формулы являются линейными (в смысле, который мы поясним ниже; см. §6.1.1).

Пока мы можем удовлетвориться описанием предложений наше­го корпуса в терминах их линейной структуры, то есть на языке следующих формул или правил:

(1) XY

(2) ZXY

(3) XcX

(4) ZXcX

(5) ZXcZX

(6) XcZX.

Можно считать, что каждое из этих правил описывает отдельный тип предложения. (Тот факт, что можно свести эти типы предложе­ний к подтипам, привлекая принципы структуры составляющих, не релевантен на данном этапе изложения; см. §6.1.2 и сл.) Заметим, что эта система правил удовлетворительно объясняет приемлемость семнадцати предложений корпуса (она определяет их как грамма­тичные).

Но это достигается только путем включения имеющихся предложений в общее множество из 48 предложений в качестве его элементов. (Число 48 получается после применения формулы, при­веденной в §2.3.8, к каждому из шести типов предложения и сум­мирования результатов.) Имеется 2x2=4 предложения типа (1), 2х2х2=8 предложений типа (2), 2х 1x2=4 предложения ти­па (3), 16 предложений типа (4), 8 — типа (5) и 8 — типа (6). 4+8+ +4+16+8+8=48. Поэтому язык, описываемый такой граммати­кой, содержит ровно 48 предложений. Тридцать одно не встречаю­щееся предложение можно допустить в качестве приемлемых или исключить, если мы почему-либо решим, что они должны быть ис­ключены посредством дополнительных правил, запрещающих опре­деленные сочетания отдельных слов. Дополнительные правила, очевидно, весьма усложнят «грамматику». Следовательно, наиболее экономным способом описания данного текста будет такой, кото­рый представит его как случайную выборку из 17 предложений, являющихся подмножеством общего множества из 48 пред­ложений, которые и составляют язык. «Грамматика», построенная нами для описания этого текста, является генеративной в описанном выше смысле (см. §4.2.2). Мы будем говорить, что она порождает, или характеризует, язык текста, приписывая каждому из имею­щихся в «выборке» предложений (так же как и тем, которых нет в «выборке») особое структурное описание: рг — это предложение структуры XY, pcda — структуры XcZX и т. д.

Этот ограниченный искусственный язык, использованный нами в качестве примера, содержит всего семь слов, а корпус включает лишь семнадцать простых предложений (из сорока восьми, порож­даемых грамматикой). В случае естественных языков ситуация, без сомнения, оказывается значительно более сложной. Число слов выражается в десятках тысяч; их дистрибуционная классификация будет не столь простой и, несомненно, не сможет быть осуществлена только что проиллюстрированным способом. Кроме того, нам при­дется описывать целый ряд различных типов предложений, в том числе предложения значительной степени сложности.

Однако эти факты не затрагивают самого принципа. Слова естественного языка могут быть сгруппированы в дистрибуционные классы (что всегда и делалось составителями грамматик на практике, как мы увидим ниже); дистрибуционные классы, установленные для конкретных позиций в предложениях одного типа, оказываются обычно действи­тельными и для конкретных позиций в других, более сложных типах предложений. Грамматика, как она здесь понимается, есть не что иное, как описание предложений языка в терминах сочетаемостных свойств слов (а также словосочетаний и т. д.), определяемых их принадлежностью к тому или иному дистрибуционному классу. Это род алгебры, в которой в качестве «переменных» выступают сло­весные классы, а в качестве «постоянных», или «значений», при­нимаемых этими переменными в конкретных предложениях,— ин­дивидуальные слова.

Чтобы понять, что речь идет в принципе о такого рода описа­нии, которое обычно называется «грамматическим», нам достаточно интерпретировать приведенный выше пример применительно к анг­лийскому языку. Пусть a=men ‘мужчины’, p=women ‘женщины’, live ‘живут’, r=die ‘умирают’, c=love ‘любят’, d=old ‘старый (~ые, ~ых)’,

<< | >>
Источник: Джон Лайонз. ВВЕДЕНИЕ В ТЕОРЕТИЧЕСКУЮ ЛИНГВИСТИКУ. Перевод с английского языка под редакцией и с предисловием В. А. ЗВЕГИНЦЕВА. Москва «ПРОГРЕСС» - 1978. 1978

Еще по теме ПРОСТОЙ ПРИМЕР ДИСТРИБУЦИОННОГО АНАЛИЗА:

  1. Образцы синтаксического анализа простого предложения
  2. Полный анализ простого предложения
  3. Краткий анализ простого предложения
  4. Схема синтаксического анализа простого предложения
  5. 29.Простейшие дифференциальные уравнения 1-го порядка (разрешенные относительно производной, с разделяющимися переменными) и их решение. Примеры.
  6. § 7. Анализ некоторых частных примеров и их интерпретация
  7. Расчеты показателей для финансового анализа по базовому примеру
  8. 3.4. Пример использования функционально-стоимостного анализа для стратегического управления
  9. Определение. Трансакционный анализ - психодинамический метод, центрированный на анализе личности, межличностного конфликта, анализе взаимодействия и человеческой судьбы.
  10. 23. Явление обособления в структуре простого предложения. Другие способы осложнения простого предложения.