ТОЧНЫЕ МЕТОДЫ В ЛИНГВИСТИКЕ
Последние десятилетия развития науки характеризуются стремлением решать различные проблемы соединенными усилиями наук, ранее не имевших никаких точек соприкосновения. Конкретным случаем реализации этой общей тенденции, оправдавшей себя эффективными результатами в области теории и практики, является обращение лингвистики к исследовательским методам точных наук.
Впрочем, для лингвистики такого рода союзы не новы. Ввиду сложности предмета своего изучения она всегда обращалась к помощи других наук — логики, психологии, физики, социологии, физиологии и т. п., обогащая арсенал своих исследовательских приемов. Новые союзы лингвистики — с математикой, кибернетикой, теорией связи, электроникой, бионикой и пр.— обусловлены главным образом потребностями решения различного рода практических задач, но вместе с тем делаются попытки обратить их на пользу лингвистики как таковой. Таким образом, новые союзы лингвистики с точными науками имеют двоякую направленность.Содержанием одного направления является изучение собственно лингвистических проблем методами точных наук (главным образом математическими методами). Сюда, например, относится статистика стиля и установление авторства. Задачей этой проблемы является установление статистического критерия, который бы объективным образом выражал различия в стиле разных авторов, давал возможность установления авторства в сомнительных случаях (как в случае с некоторыми произведениями, приписываемыми Чосеру или Шекспиру) или определял относительную хронологию произведений одного и того же автора. Другим примером из этой же области являемся использование количественных методов в историческом и сравнительном языкознании. В одном случае здесь идет речь о так называемой лексикостатистике, или глоттохронологии, которая на основе количественных признаков стремится не только констатировать наличие генетических отношений между языками (преимущественно тех, которые «не имеют истории», т.
е. памятников различного исторического состояния языков), но и датировать временную точку их разветвления (работы М. Сводеша по лексикостатистике см. в 1-м выпуске серии «Новое в лингвистике», Изд. иностр. лит., М., 1960). В другом случае имеется в виду установление степени близости родства (индоевропейских) языков на основе числа фонологических и морфологических признаков. Числовой критерий используется также для типологических классификаций языков (см. работу Дж. Гринберга «Квантитативный подход к морфологической типологии языков» в 3-м выпуске серии «Новое в лингвистике», Изд. иностр. лит., М., 1963).Следует отметить, что все подобного рода применения математических (или, как иногда говорят, квантитативных) методов для решения собственно лингвистических проблем носят пока в значительной мере спорный характер.
Это происходит главным образом в силу произвольности отбора признаков или фактов для определения квантитативных критериев, а также и потому, что содержанием количественных манипуляций служат языковые явления, установленные традиционными (иногда сугубо качественными) методами, которые допускают различное толкование. Но все это отнюдь не должно давать повод к огульно отрицательному отношению к использованию математических методов в ряду других методов лингвистического исследования и говорит лишь об их несовершенстве и о необходимости разумного и обоснованного их применения. Последняя оговорка тем более необходима, что научная литература содержит немало примеров совершенно фантастического использования математических методов в лингвистике. Нередко можно услышать суждения о том, что само по себе обращение лингвистики к математике уже достаточно, чтобы вывести ее из путаницы необоснованных представлений и определений, в которых она погрязла, и сделать из нее, наконец, подлинную науку, которой она до сих пор не является. В связи с этим представляются очень своевременными предупреждения, которые делает Уоррен Плат в своем весьма благожелательном обзоре математических методов в лингвистике, приготовленном им к 9-му Международному конгрессу лингвистов (1962).
«Представление о том,— пишет он,— что всякое привлечение чисел и математических операций для описания системы элементов (языка) делает утверждения более «точными» или более «научными», является абсолютно ошибочным... Одна из основных опасностей, связанных с построением математических моделей, в особенности количественных, состоит в том, что неразборчивое использование математического аппарата неизбежно приводит к бессмысленным и даже дезорганизующим результатам. Необходимо ясно понимать поэтому, что предпосылкой обогащения лингвистики с помощью математики является не только знание соответствующих областей математики, но и, кроме того, глубокое понимание сущности лингвистических проблем, на разрешение которых должны быть направлены математические методы».Другое направление предполагает использование лингвистических знаний для решения совместно с точными науками конкретных практических задач. Это направление обычно именуется прикладной лингвистикой.
Область исследований прикладной лингвистики чрезвычайно широка, и с каждым днем она расширяется все более и более. Она включает налаживание взаимопонимания в системе «человек — машина» (в частности, при речевом управлении всякого рода механизмами), создание автоматических программирующих систем, способных переводить с символического языка алгоритма на язык машинных операций, объективное распознавание устной речи, позволяющее машине фиксировать звуковую речь в виде буквенной записи или в форме специального кода, автоматический поиск информации и т.д. В данном очерке не представляется возможным более подробно изложить сущность каждой из названных практических проблем и указать роль лингвистических знаний при их решении. Для примера обратимся лишь к одной проблеме — автоматической обработке, классификации и реализации информации.
Здесь прежде всего необходимо проводить разграничение между данными и информацией. В отличие от числовых, графических, операционных и прочих данных информация имеет семантическую значимость.
И естественный язык является не только хранилищем всей накопленной человечеством информации (или совокупности знаний), но и определенным способом ее классификации и организации. Практически мы не можем передать информацию помимо естественного языка и при этом вынуждены пользоваться теми классификациями, которые представлены в лексике естественных языков. Из этой предпосылки следуют весьма существенные выводы для определения принципов построения и функционирования информационных, информационно-логических автоматов и вообще «думающих» машин, создание которых находится на повестке дня современной науки и техники. Всякая операция «думающей» машины, имеющая дело с заключенной в словах семантической информацией, группирующая ее под определенным углом зрения и предоставляющая в распоряжение человека те или иные заключения и подборки, осуществляется на основе языковых схем. Но всю поступающую в «думающую» машину информацию необходимо соответствующим образом переработать, приспособить к возможностям или к «пониманию» машины. Так возникает необходимость в создании «машинных» языков, с помощью которых оказывается возможным наладить общение человека с машиной, обмен информации между человеком и информационно-вычислительными машинами. Ясное дечо, что при переводе с естественного языка на «машинный» (перекодирование) очень важно осуществлять этот процесс не «вручную», а быстрым и наиболее совершенным образом. Отсюда возникает новая проблема — автоматического кодирования (или перекодирования), связанная с первой.Роль прикладной лингвистики в подобных проблемах заключается в выработке наиболее экономных и строгих языковых схем (формализации естественного языка), в исключении избыточных элементов (компрессии языка), в определении границ субкодов (т. е. лексики различных специальностей), в точном вычленении из коммуникативного поведения человека тех систем, или структур, которые доступны «пониманию» машины, в выработке приемов устранения потенциальной семантической двусмысленности слов и т.
д.Как показывает это краткое перечисление задач, связанных лишь с некоторыми проблемами прикладной лингвистики, она нередко прибегает к соответствующей обработке естественного языка, например к разного рода математическому моделированию (построению статистических, теоретико-вероятностных, теоретико-множественных, теоретико-информационных моделей). Но делается это не ради изучения естественного языка, а в качестве обязательной предпосылки для решения конкретной прикладной задачи. Иными словами, все подобные процедуры формализации языка носят вспомогательный характер и обусловлены особенностями частных практических задач.
Следует отметить, что всю совокупность проблем, представленных в описанных выше двух направлениях использования точных методов, иногда подводят под общее наименование «математической лингвистики», выделяя ее даже в отдельную «пограничную» дисциплину. Это неудачный, вводящий в заблуждение термин. Использование в лингвистике точных методов наряду с другими, конечно, не создает особой науки; оно в значительной мере продиктовано лишь расширением проблематики языкознания. Далее, когда говорят ныне о союзе лингвистики с точными науками, то под последними разумеют не только математические дисциплины, но и множество других наук — физику (акустику), электронику, кибернетику, теорию связи и пр. Нередко математика оказывается необходимой лишь в той мере, в какой она, будучи «служанкой всех наук» (по выражению А. Эйнштейна), составляет формальный аппарат этих наук. В силу указанных причин термин «математическая лингвистика» в настоящее время изживает себя. В настоящий раздел включен ряд работ, которые дают представление о том, каким образом и в каких направлениях в зарубежном и советском языкознании делаются опыты приложения точных методов к лингвистике. Хотя они носят в значительной степени предварительный характер и не отличаются единством взглядов, нетрудно сделать вывод о большой перспективности новых союзов лингвистики с другими науками.
ЛИТЕРАТУРА
О.
С. А х м а н о в а, И. А. М е л ь ч у к, Е. В. П а д у ч е в а, Р. М. Фрумкина, О точных методах исследования языка, изд. МГУ, 1961.В. А. 3 вег и н це в, раздел «Математическая лингвистика?» в книге «Очерки по общему языкознанию», изд. МГУ, 1962.
B. А. 3 в е г и н ц е в, Лингвистическое датирование методом глоттохронологии (лексикостатистики). Сб. «Новое в лингвистике», вып. I, Изд. иностр. лит., М., 1960.
Р. Б. Л и з, Что такое трансформация?, «Вопросы языкознания»,1961,№3.
И. А. М е л ь ч у к, О стандартной форме и количественных характеристиках некоторых лингвистических описаний, «Вопросы языкознания», 1963, N° 1.
C. К. Ш а у м я н, Теоретические основы трансформационной грамматики. Сб. «Новое в лингвистике», вып. 2, Изд. иностр. лит., М., 1962-
Норберт Винер отказывается видеть «сколько-нибудь существенную противоположность между проблемами наших инженеров при измерении информации и проблемами наших филологов». В самом деле, между последними этапами лингвистического анализа и подходом к языку в математической теории связи обнаруживаются поразительные совпадения и сближения. Поскольку каждая из этих двух дисциплин имеет дело с одной и той же областью устных сообщений, хотя и различным и совершенно самостоятельным образом, тесный контакт между ними оказался взаимополезным и, несомненно, будет становиться все более плодотворным.
Р. ЯКОБСОН
Поток устной речи, физически непрерывный, первоначально поставил математическую теорию связи перед ситуацией «значительно более сложной», чем в случае конечного множества дискретных составляющих, даваемых письменным текстом. Однако лингвистический анализ позволил превратить устную речь в конечный ряд элементарных информационных единиц. Эти элементарные дискретные единицы, так называемые «различительные признаки», объединяются в одновременные пучки, называемые «фонемами», которые в свою очередь, идя друг за другом, образуют последовательности. Таким образом, форма в языке имеет отчетливо гранулированную структуру и поддается квантованному описанию.
Главная задача теории информации, как она сформулирована, например, Д. М. Маккеем, состоит в том, чтобы «выделить из частных контекстов те общие признаки представлений, которые могут оставаться инвариантными при всех формулировках». Лингвистической аналогией этой проблемы являются поиски относительных фонематических инвариантов. Различные возможности измерения количества фонематической информации, которые предвидели инженеры-связисты (они различают «структурное» и «метрическое» содержание информации), могут быть весьма полезны как в синхронной, так и в исторической лингвистике и особенно важны для
типологии языков как в чисто фонологическом аспекте, так и при взаимодействии фонологии с лексико-грамматическим уровнем.
Дихотомический принцип, лежащий в основе всей системы различительных признаков в языке, был постепенно обнаружен лингвистикой и поставлен в соответствие с двоичными знаками (битами), используемыми инженерами в качестве единицы измерения в теории связи. Когда они определяют избранную информацию сообщения как минимальное число двоичных решений, которое позволяет адресату реконструировать то, что ему необходимо извлечь из сообщения на основе уже известных ему данных, то эта реалистическая формула вполне соответствует назначению различительных признаков в устном сообщении. Как только был предложен «способ распознавания универсалий при помощи их инвариантов» и обобщающая классификация различительных признаков была описана в соответствии с этими принципами, немедленно вслед за этим в лекциях Д. Габора по теории связи была поставлена проблема перевода критериев, предложенных лингвистами, «на математический и операционный» язык[133]. А недавно появилась весьма полезная работа Г. Унгехоера (Ungeheuer), в которой предлагается способ математической интерпретации различительных признаков в их двоичном изображении[134].
Понятие «избыточности», пришедшее в теорию связи из риторики, являющейся ветвью лингвистики, приобрело важное значение в развитии этой теории и было несколько смело заново определено как «единица минус относительная энтропия». В этом новом определении оно опять попало в современную лингвистику в качестве одной из основных категорий. Необходимость строгого разграничения различных типов избыточности в настоящее время признается как в теории связи, так и в лингвистике, где понятие избыточности включает, с одной стороны, многословные способы выражения, в противоположность краткости (brevitas — в традиционной терминологии риторики), а с другой стороны, полноту выражения — в противоположность умолчанию (эллипс). На фонологическом уровне лингвисты умеют разграничивать фонематические различительные единицы и контекстуальные, комбинаторные, аллофонические варианты, но обращение с такими взаимосвязанными проблемами, как избыточность, предсказание и условные вероятности в теории связи, позволило внести большую ясность в отношении двух основных лингвистических характеристик свойств звуков — различительных признаков и избыточных признаков.
Фонематический анализ, если он последовательно ставит своей целью исключение избыточности, неизбежно дает оптимальное и однозначное решение. Мистическая вера некоторых теоретиков, не связанных с лингвистикой, в то, что «не существует сколько- нибудь серьезных оснований для разграничения различительных и избыточных признаков», полностью противоречит многочисленным лингвистическим данным. Если, например, в русском языке различие между передними гласными и соответствующими им задними гласными всегда сопровождается различием между предшествующими им согласными, которые палатализуются перед передними гласными, но лишены палатализации перед задними гласными, и если, с другой стороны, различие между палатализованными и непалатализованными согласными не определяется их гласным окружением, то лингвист обязан сделать вывод, что в русском языке наличие или отсутствие палатализации согласных является различительным признаком, тогда как различие между передними и задними гласными оказывается всего лишь избыточным. Избыточные и различительные признаки, не будучи ни в какой мере произвольными умозаключениями исследователя, являются объективно присутствующими и различаемыми в языке.
Предубежденная трактовка избыточных признаков как не относящихся к делу, а различительных признаков как единственно оправданных, исчезает из лингвистики, причем и здесь именно теория связи, и в особенности ее концепция транзитивных вероятностей, помогает лингвистам изжить их неправильное отношение к избыточным и различительным признакам как нерелевантным и релевантным соответственно.
Согласно Маккею, предугаданные возможности «являются основным элементом теории связи», и аналогичную заявку делает лингвистика. Ни в одной из этих дисциплин не возникает ни малейшего сомнения относительно фундаментального значения избирательных операций в речевой деятельности. Инженер предполагает, что «регистрирующая система» для заранее построенных возможностей является более или менее одинаковой в передатчике и приемнике вербального сообщения, соссюрианская лингвистика соответственно говорит о языке (langue), который делает возможным обмен речью (parole) между собеседниками. Такое «со» четание возможностей, заранее предугаданных и обеспеченных» \ предполагает наличие кода, рассматриваемого в теории связи как «согласованное преобразование — обычно взаимооднозначное и обратимое»[135], с помощью которого один набор информационных единиц переводится в другой набор, например грамматическая единица переводится в фонематическую последовательность и наоборот. Код приводит в соответствие обозначение (signans) с его обозначаемым (signatum) и обозначаемое (signatum) с его обозначением (signans). В наши дни в связи с изучением проблем кодирования в теории связи дихотомия язык — речь Соссюра может быть обоснована гораздо более точно и приобретает новое операционное значение. С другой стороны, теория связи может почерпнуть в современной лингвистике необходимые сведения относительно стратифицированной структуры сложного языкового кода в его различных аспектах.
Хотя основные черты языкового кода в достаточной мере описаны в лингвистике, все же нередко забывают, что конечный набор «стандартных представлений» сводится к лексическим символам, их грамматическим и фонологическим составляющим, а также к грамматическим и фонологическим правилам сочетания. Только эту часть сообщения можно определить как простую «операцию повторения представления». С другой стороны, необходимо напомнить, что код не сводится только к тому , что инженеры-связисты называют «чисто мыслительным содержанием речи»; стилистическая стратификация лексических символов и соответственно мнимое «свободное» варьирование как в их построении, так и в правилах их сочетания также являются «предугаданными и обеспеченными» при помощи кода.
В своей программе для будущей науки знаков (семиотики) Чарлз Пирс пишет: «Законознак (legisign) есть закон, который есть Знак. Этот закон обычно устанавливается людьми. Любой условный знак является законознаком»[136]. Словесные символы приводятся в качестве примера законознаков. Собеседники, принадлежащие к одному данному речевому коллективу, определяются как действительные обладатели одного и того же языкового кода, включающего одинаковые законознаки. Общий код является средством их общения; он лежит в основе обмена сообщениями, обеспечивая его возможность. В этом существенная разница между лингвистикой и естественными науками, и эта разница отчетливо и постоянно подчеркивалась в теории связи, особенно в ее английской школе, которая настаивает на четком разграничении теории связи и теории информации. Тем не менее это различие, как ни странно, иногда игнорируется лингвистами. «Стимулы, получаемые от Природы,— как мудро замечает Черри,— не являются картинами действительности, но суть показания, на основании которых мы строим наши собственные модели»[137]. В то время как физик создает свое теоретическое построение, накладывая свою собственную гипотетическую систему новых символов на полученные данные, лингвист только перекодирует, переводит в символы метаязыка ее наличные символы, которые используются в языке данного языкового коллектива.
Компоненты кода, например различительные признаки, действительно имеют место и реально функционируют в речевом сообщении. Как для получающего информацию, так и для передающего ее операция выбора, как указывает Р. М. Фано, составляет основу «процессов передачи информации»[138]. Набор операций выбора по принципу «да — нет», лежащих в основе любого пучка этих дискретных признаков, не является произвольным измышлением лингвиста, а действительно производится адресатом сообщения, если необходимость их распознавания не снимается данными словесного или несловесного контекста.
Как на грамматическом, так и на фонологическом уровне не только адресат при декодировании сообщения, но и кодирующий это сообщение могут использовать эллипс; в особенности тот, кто кодирует, опускает некоторые признаки или даже некоторые их пучки и последовательности. Но эллипс также управляется кодифицированными правилами. Язык никогда не является монолитным; его основной код включает ряд подкодов, и такие вопросьї, как правила трансформации оптимального, явно выраженного, основного кода в различной степени эллиптические подкоды, а также их сравнение в отношении количества информации, требуют как лингвистического, так и инженерного исследования. О б р а* тимый код языка со всеми его переходами от подкода к под- коду и со всеми постоянными изменениями, которые этот код претерпевает, должен быть описан средствами лингвистики и теории связи в результате совместного и внимательного изучения. Понимание динамической синхронии языка, включающей координаты пространства и времени, должно прийти на смену традиционной схеме произвольно ограниченных статичных описаний.
Лингвист-наблюдатель, который уже владеет или овладевает языком в процессе исследования, является или постепенно становится потенциальным или действительным участником в обмене вербальными сообщениями между членами языкового сообщества, его пассивным или даже активным членом. Инженер-связист прав, когда он защищает от «некоторых филологов» совершенно безусловную «необходимость вывести на сцену Наблюдателя» и когда он соглашается с Черри в том, что «описание наблюдателя-участ- ника будет наиболее полным». Антипод участника, совершенно посторонний и незаинтересованный наблюдатель, ведет себя как специалист по расшифровке, который получает сообщения, не будучи их адресатом и не зная их кода. Он старается раскрыть код при помощи тщательного исследования сообщений. Надо стремиться, чтобы этот уровень лингвистического исследования был лишь первым этапом на пути к внутреннему подходу к изучаемому языку, когда исследователь приобщается к говорящим на этом языке, как на своем родном, и декодирует сообщения на их родном языке при помощи их собственного кода.
Коль скоро исследователь не знает обозначаемого (signatum) в данном языке и не располагает ничем другим, кроме обозначений (signans), он волей-неволей должен напрячь свои детективные способности, чтобы получить всю возможную информацию о структуре этого языка из внешних показателей. Современное состояние этрускологии является хорошим примером такой техники. Но если лингвист знаком с кодом и, в частности, владеет правилами трансформации, с помощью которых ряд обозначений (signans) переводится в ряд обозначаемых (signatum), то ему незачем изображать из себя Шерлока Холмса, если только он не вознамерится обнаружить, сколь широки и надежны данные, которые он мог бы получить таким образом. Трудно, однако же, симулировать незнакомство со знакомым кодом: придуманные значения искажают естественный метод расшифровки.
Вполне очевидно, что «неразделимость объективного содержания и субъективного наблюдения», отмечаемая Нильсом Бором[139] как преддверие всякого достоверного познания, следует непременно принимать во внимание также и в лингвистике, и позиция исследователя по отношению к языку, который он наблюдает и описывает, должна быть точно определена. Прежде всего, как отмечает Юрген Рюш (Jurgen Ruesch), информация, которую получает исследователь, зависит от его места внутри или вне изучаемой системы[140]. Более того, если исследователь находится внутри коммуникативной системы, то язык представляется в двух совершенно различных аспектах при рассмотрении его с двух противоположных концов канала связи. Грубо говоря, процесс кодирования идет от значения к звуку и от лексико-грамматического к фонологическому уровню, тогда как процесс декодирования идет в обратном направлении — от звука к значению и от признаков к символам. Если при произнесшим речевого сообщения установка (Einstellung) предшествует непосредственно составляющим, то при восприятии речи сообщение является прежде всего стохастическим8 процессом. Вероятностный аспект речи отчетливо проявляется в отношении слушателя к омонимам, в то время как для говорящего омонимии не существует. Говоря /sAn/, он знает заранее, подразумевается ли «sun» (солнце) или «son» (сын), тогда как восприятие слушающего зависит от вероятностей контекста. Для принимающего сообщение содержит множество неясностей, которые вполне однозначны для передающего. Двусмысленность в шутливой игре слов и в поэзии основывается на этом свойстве ввода и вывода при передаче сообщений.
Нет сомнения, что существует и обратная связь между говорением и восприятием, но иерархия этих двух процессов является противоположной для кодирующего и декодирующего. Эти два различных аспекта языка не сводимы друг к другу; оба они одина- ново важны и должны рассматриваться как дополняющие друг друга в том смысле, как это понимает Нильс Бор в упоминавшейся работе. Относительная автономия вводимой модели (input pattern) подтверждается широко известным временным приоритетом пассивного овладения языком как детьми, так и взрослыми. Требование Щербы выделить и создать две грамматики — «активную» и «пассивную»,— недавно вновь повторенное молодыми русскими лингвистами, одинаково важно для лингвистической теории, для обучения языкам и для прикладной лингвистики.
Если лингвист имеет дело с одним из этих двух аспектов языка на манер Журдена, т. е. не отдавая себе отчета, относится ли его наблюдение к выводу или к вводу, то это все-таки менее опасно, чем произвольные компромиссы, часто имеющие место в анализе ввода и вывода, к примеру, описание в грамматике вывода порождающих операций безотносительно к значению, несмотря на безусловный приоритет значения для кодирующего. В настоящее время лингвистика получает из теории связи чрезвычайно важные идеи для изучения вербального ввода, до сих пор несколько недооценивавшегося.
Маккей предостерегает против смешения обмена вербальными сообщениями с получением информации из внешнего мира, поскольку они обычно неправильно объединяются под одним названием «сообщение»; у этого слова существуют неизбежно антропоморфические ассоциации, «обсуждение которых превращается в ожесточеннейшее словопрение»[141]. Возникает аналогичная же опасность, если интерпретировать общение в человеческом обществе в терминах физической информации. Попытки построить модель языка безотносительно к говорящему и слушающему и таким образом гипостазировать код, абстрагированный от действительного общения, таят в себе опасность превратить язык в схоластическую фикцию.
Помимо кодирования и декодирования, процесс перекодирования, замены кодов, короче говоря, различные аспекты перевода также становятся в ряд основных проблем как лингвистики, так и теории связи не только у нас, но и в Западной и Восточной Европе. Только теперь такие увлекательные проблемы, как способы и степени взаимного понимания говорящих на близкородственных языках, например датском, норвежском и шведском, начинают привлекать внимание лингвистов и обещают дать отчетливое представление о явлении, известном в теории связи под названием «семантический шум», а также о весьма важной, теоретически и педагогически, проблеме преодоления его.
Между прочим, и лингвистика и теория связи в течение некоторого времени имели тенденцию рассматривать всякий интерес к значению как разновидность семантического шума и исключали семантику из изучения вербальных сообщений. В настоящее же время лингвисты обнаруживают тенденцию вновь обратиться к значению после весьма поучительного опыта его временного изгнания. В теории связи также можно наблюдать аналогичное явление. Согласно Виверу, анализ сообщений «столь основательно прочистил атмосферу, что сейчас, едва ли не впервые, можно действительно обратиться к теории значения» и в особенности к изучению «одного из наиболее важных и трудных аспектов значения, а именно влияния контекста»[142]. Лингвисты постепенно приходят к тому, что надо рассматривать значение, и в особенности соотношение между общим и контекстным значениями, как внутреннюю лингвистическую проблему, отчетливо отделяемую от онтологических проблем отношения.
После того как будет освоен уровень фонематической информации, теория связи сможет подойти к задаче измерения грамматической информации, поскольку система грамматических и, в частности, морфологических категорий, подобно системе различительных признаков, явно базируется на системе исключающих друг друга двоичных знаков. Таким образом, например, девять двоичных выборов лежат в основе примерно ста простых и сложных спрягаемых форм английского глагола, которые употребляются, скажем, в сочетании с местоимением «я». Количество грамматической информации, которое содержит английский глагол, можно сопоставить с соответствующими данными об английском существительном или о глаголе и существительном в различных языках; соотношение между морфологической и синтаксической информацией в английском языке следует сравнить с аналогичным соотношением в других языках, и все эти сравнительные данные обеспечат важный вспомогательный материал для лингвистической типологии языков, а также для изучения лингвистических универсалий.
Количество грамматической информации, которое потенциально содержится в парадигмах данного языка (статистика кода), следует затем сопоставить с количеством информации в знаках, в действительных употреблениях различных грамматических форм в пределах корпуса сообщения. Любая попытка игнорировать эту двойственность и свести лингвистический анализ и подсчет только к коду или только к корпусу обедняет исследование. Нельзя игнорировать основной вопрос соотношения между типом системы составляющих вербального кода и их относительной частотностью как в коде, так и в реальном употреблении.
Семиотическое определение значения символа как перевод его в другой символ находит эффективное применение в лингвистических опытах, касающихся внутри- и межъязыкового перевода, и такой подход к семантической информации соответствует предложению Шенона определять информацию как «то, что остается инвариантным при всех обратимых операциях кодирования или перевода», короче как «класс эквивалентов при всех таких переводах»[143].
Имея дело со значениями, грамматическими и лексическими, нужно стараться не путать полярно противоположные понятия «регулярность» и «отклонение». Понятие «отклонения» часто возникает из недооценки сложной иерархической структуры языка. Между тем имеется существенное различие между второстепен- ностью и отклонением. Нет оснований рассматривать как отклонения ни «синтаксические деривации» относительно «первичной функции» у Куриловича, ни «трансформации» относительно «ядра» у Хомского, ни «маргинальные» (переносные) значения относительно «центрального» значения слова у Блумфилда. Метафоры являются не отклонениями, а правильными образованиями определенных стилистических видоизменений, представляющих собой субкоды основного кода, и в пределах такого субкода нет, например, никакого отклонения в фигуральном отнесении конкретного эпитета к абстрактному существительному у Марвелла — a green thought in a green shade («зеленая Мысль в зеленой сени»), или у Шекспира при метафорическом перенесении неодушевленного существительного в класс существительных женского рода — the morning opes her golden gates («утренняя заря раскрывает златые врата свои»), или метонимическое употребление sorrow («печаль») вместо sorrowful while («печальное время»), которое Путнам в своей работе берет из Дилана Томаса,— A grief ago I saw him there («Bo времена печали я видел его там»). В отличие от нарушающего грамматику построения girls sleeps («девушки спит») приведенные выше примеры являются осмысленными, а любое осмысленное предложение может быть подвергнуто испытанию на истинность таким же способом, как и утверждение Peter is an old fox («Питер — старая лиса»), которое может привести к ответу: «Это неверно; Питер не лиса, а свинья, вот Джон — лиса». Между прочим, ни эллипсы, ни умолчания или анаколуфы нельзя считать отклонениями от правильных структур; они, как и всякий неправильный стиль речи или брахилогический субкод, к которому они относятся, являются всего лишь законными производными от ядерных форм, воплощенных в языковом стандарте. И опять-таки, эту «изменяемость кода», которая объясняет, почему стандарт не реализуется в некоторых искаженных употреблениях, проглядели лингвисты скорее, чем менее «предубежденные» инженеры-связисты.
Итак, имеется широкий круг вопросов, требующих сотрудничества двух различных дисциплин, о которых мы здесь пишем. Первые шаги в этом направлении были чрезвычайно удачными. Позволю себе закончить примером самого длительного и до последнего времени, вероятно, самого удивительного союза между лингвистикой, особенно при изучении поэтического языка, с одной стороны, и математическим анализом стохастических процессов, с другой стороны. Русская метрическая школа обязана некоторыми из своих всемирно-известных достижений тому факту, что около сорока лет назад такие ученые, как Б. Томашевский, знаток и математики и филологии, весьма искусно использовал цепи Маркова для статистического исследования стиха; эти данные, дополненные лингвистическим анализом структуры стиха, привели в начале 20-х годов к созданию теории стиха, основанной на исчислении условных вероятностей и напряжения между ожидаемым и неожиданным в качестве измеряемых ритмических величин. Исчисление этого напряжения, которое мы назвали «обманутые ожидания», дало удивительный ключ для решения проблем описательной, исторической и сравнительной, а также общей метрики на научной основе[144].
Я убежден, что методы, получившие в последнее время развитие в структурной лингвистике и в теории связи, будучи использованы для анализа стиха, а также во многих других областях науки о языке, способны открыть широкие перспективы для дальнейших координированных усилий обеих дисциплин. Будем же надеяться, что наши ожидания не будут обмануты.
ЛОГИКА КАК СРЕДСТВО ПОЗНАНИЯ СИНТАКСИЧЕСКИХ
ЯВЛЕНИЙ[145]
Математики успешно достигают цели в своей специальной области благодаря отходу от обычного языка. В каждом отдельном случае такое отклонение подсказывается в процессе математического творчества определенными утилитарными соображениями. Можно ожидать, что такие реформы смогут пролить свет на естественный язык, который служит их отправным пунктом, и этот свет является особенно ярким благодаря ' узко утилитарному характеру этих реформ, так как в каждом таком случае специальная функция, выполнявшаяся до этого лишь попутно и незаметно конструкцией естественного языка, теперь отчетливо выступает как единственная и выразительная функция искусственного способа обозначения. И таким образом, как на карри- катуре выступят на первый план незаметные функции обычных идиом.
Рассмотрим использование математиками скобок для указания на операцию группировки. Приняв во внимание этот прием систематизации, мы получаем более ясное представление о назначении или долговечности определенных родственных приемов естественного языка. Например, мы можем осознать, что сочетание двух частиц either—or совсем не является излишним усложнением простого or, но что either выполняет полезную работу левой скобки, отмечая начало сложносочиненного предложения со связующим or. Именно either позволяет нам в устной речи устранить двусмысленность р и q или г. Оно позволяет нам провести различие между либо р и q, либо г (either р and q or г) и р и либо q, либо г (р and either q or г), как раз такое различие, которое было бы изображено скобками в виде (р и q) или г или, наоборот, р и (q или г). Аналогичное назначение выполняет частица both в соединении с and; так (р или q) и г, и р или (q и г) выступают как и р или q и г (both р or q and г) и р или q и г (р or both q and г). Такое понимание синтаксической функции either и both могло бы нас полностью удовлетворить, даже если бы мы не были знакомы с методом заключения в скобки, а скобки, вероятно, вносят большую ясность в этот вопрос для тех, кто привык обращаться со скобками. Вот вам первый грубый пример того, как искусственные приемы математической символики, можно надеяться, будут способствовать пониманию синтаксиса естественного языка.
За более убедительными примерами полезно обратиться к математической логике. Эта область математики особенно богата искусными приемами, позволяющими пролить свет на тот язык, от которого они происходят. Уже мой пример с either—or и both— and взят из логики, но можно привести более серьезные примеры из этой же области. В то время как большинство лингвистических исходных моментов в развитии математики, в отличие от логики, почти не связано с основными приемами языка, в математической логике они касаются самых основных моментов.
Примером разрешения неясности, встречаемой в обычном английском языке, является различение объемов неопределенных сингулярных термов [146], которое с удивительной легкостью объясняется при помощи современной логической символики. Возьмем выражение каждое стихотворение (every poem). Если я говорю: Я не знаю каждое стихотворение (I don’t know every poem), то можно ли сказанное мной истолковать в том смысле, что я говорю о каждом стихотворении, что я его не знаю, или что я просто отрицаю предложение Я знаю каждое стихотворение. В одном случае объемом выражения каждое стихотворение является все предложение Я не знаю каждое стихотворение. В другом случае объемом является Я знаю каждое стихотворение, которое посредством частицы не (not) затем отрицается.
Большинство из вас знакомо с современной логической символикой, которая сводит подобные выражения и местоимения к так называемым кванторам и переменным. Она быстро и недвусмысленно разрешает вопросы объема. Обычный язык также часто решает их, но так неубедительно, что, не обладая преимуществом быстрого перевода на язык современной логики, невозможно понять ни проблему, ни работу, которую выполняют обороты речи обычного языка, разрешая задачу объема. Ясно осознав вопрос объема в свете логической символики, мы можем обратиться к обычному языку и с большей четкостью разобраться в сути дела. Мы обнаруживаем, что здесь имеет место взаимодействие кажущихся синонимов любой (any) и каждый (every), соответственно покрывающих широкий и узкий объем.
Вернемся к нашему примеру. Предложение Я не знаю каждое стихотворение (I do not know every poem) в действительности понимается вполне определенно, как ограничивающее неопределенный сингулярный терм каждое стихотворение (every poem) более узким объемом Я знаю каждое стихотворение и затем присоединяющее отрицание не к этому предложению. Правило, употребляемое бессознательно, но никогда не привлекавшее серьезного внимания, пока не вмешалась современная логика, заключается в том, что каждый (every) требует всегда самого узкого имеющегося объема. К слову любой (any) применяется противоположное правило; из двух имеющихся объемов оно предусматривает более широкий. Так, когда мы говорим Я не знаю любого стихотворения (I do not know any poem), то объемом неопределенного сингулярного терма любое стихотворение (any poem) является все предложение, включая отрицание не (not).
В этой связи полезно сравнить Я — не знающий каждого стихотворения (I am ignorant of every poem). Оно эквивалентно не Я не знаю каждого стихотворения (I do not know every poem), a Я не знаю любого стихотворения (I do not know any poem) как раз потому, что объемом в этом случае является все предложение просто из-за отсутствия какого-либо более короткого; элемент і в слове ignorant (незнающий) в отличие от отрицания не неотделим от самого слова; так что объемом every в I don’t know every poem должно быть все предложение. Различие между любой (any) и каждый (every) в вопросе объема сохраняется не только в связи с отрицаниями, но и вообще. Так, сравним: Если Джон знает любое стихотворение, то он знает «Ворона.» и Если Джон знает каждое стихотворение, то он знает «Ворона». Объемом любое стихотворение (any poem) является целое условное предложение, объемом каждое стихотворение (every poem) является только антецедент условного предложения. Первое условное предложение говорит о любом произвольно выбранном стихотворении, что если Джон знает его, то он знает и «Ворона», а второе условное придаточное предложение говорит только о том, что Джон знает «Ворона», если он знает все стихотворения.
Можно было бы поочередно удивляться тому, почему английский язык допускает эти два кажущихся синонима и почему их так часто нельзя взаимозаменить. Но в этот хаос вносится порядок, как только мы приходим к ясному пониманию объема неопределенных сингулярных термов, благодаря особым образом организованной системе обозначений математической логики. Ретроспективно мы осознаем, что различие в функции между любой (any) и каждый (every) просто сводится к различию широкого и узкого объемов.
Но вопросы объемов возникают также и независимо от неопределенных сингулярных термов. Так, рассмотрим выражение большая европейская бабочка (big European butterfly). Должны ли мы его понимать как относящееся ко всем европейским бабочкам, которые являются большими среди европейских бабочек, или только к европейским бабочкам, которые являются большими среди бабочек вообще? Поучительно сопоставить с этим примером формально аналогичный пример квадратный черный ящик, где не встает вопрос объема. Причина, почему один пример поднимает вопрос объема, а другой нет, заключается в том, что большой (big) выступает в качестве синкатегорематического прилагательного[147], подобно прилагательному плохой в сочетании плохой игрок (poor sport) или прилагательному сущий в сочетании сущий ребенок (mere child), в то время как прилагательное квадратный (square) выступает в качестве категорематического прилагательного. Ключ к объяснению категорематического употребления заключается в том, что квадратный такой-то есть просто нечто, что является квадратным и таким-то; в противоположность этому сущий ребенок не есть сущий и ребенок и точно так же большая бабочка не есть просто большая, в каком-то абсолютном смысле, и бабочка. Этот контраст ясно проявляется в обычном английском языке, тем не менее природа его такова, что его трудно было бы оценить, не прибегая к концепциям, основывающимся на логическом аппарате. В этом случае система обозначений, которая благоприятствовала бы пониманию интересующего нас вопроса, представляет собой такую систему обозначений, которая сводит есть квадратный такой-то к чему-то вроде есть квадратный и есть такой-то; способность к такому сведению является основой различения категорематического употребления прилагательных от синкатегорематического.
Разложение лингвистических сложносочиненных предложений на их непосредственно составляющие является другой лингвистической проблемой, пониманию которой иногда может способствовать современная логика. Так, возьмем выражение дама, с которой я вас видел (the lady I saw you with). Имеем ли мы в данном случае сингулярный терм дама (the lady), управляемый относительным придаточным предложением с которой я вас видел (I saw you with), или мы имеем общий терм дама, с которой я вас видел (lady I saw you with), управляемый артиклем the? Последний вариант определенно является предпочтительным, так как он оправдывает наличие определенного артикля прежде всего объединением всех имеющихся детерминантов единственности в общий терм, с которым и употребляется артикль. Эта точка зрения была бы менее правдоподобной, если бы она не основывалась на результатах теоретических исследований сингулярных дескрипций в современной логике.
Изменение этого примера помогает обнаружить забавную аномалию. Перефразируем пример таким образом: дама такая, что я видел вас с ней (the lady such that I saw you with her). Предыдущий анализ позволяет свести эту фразу к the и общему терму дама такая, что я видел вас с ней (lady such that I saw you with her). Но что тогда в пределах этого общего терма будет грамматическим антецедентом конечного «ей (her)? Очевидно, дама (lady); и аномалией будет положение общего терма в качестве антецедента местоимения. Использование всей конструкции интуитивно подсказывает, конечно, что ней (her) скорее соотносится с сингулярным термом дама (the lady), но этот путь разделения конструкции нарушает наше предыдущее положение о том, что артикль the должен быть взят, в интересах единственности, для управления максимальной дескрипцией. Оставим это затруднение неразрешенным, заметив только, что оно обязано самим своим существованием концепциям математической логики.
Другое разъяснение, которое дает логика, заключается в том, что местоимения лучше сопоставляются с определенными сингулярными термами, такими, как Генри, этот человек (the man) и т. д., нежели с неопределенными сингулярными термами, такими, как какой-то человек (a man) или каждый человек (every man). Действительно, местоимение он может приблизительно заменить этот человек, но не какой-то человек. Сказать, например, «Я видел какого-то человека, и вы видели его» (I saw a man and you saw him) ни в коем случае не эквивалентно предложению Я видел какого-то человека, и вы видели какого-то человека (I saw a man and you saw a man). Первое предполагает тождество, а второе не предполагает его. Предложение Я видел какого-то человека, и вы видели его скорее эквивалентно предложению Я видел какого-то человека, и вы видели этого человека (I saw a man and you saw the man). Укажем на едва заметное различие: в предложении Я видел какого-то человека, и вы видели его грамматическим антецедентом его (him) является какой-то человек (a man), а соответствующим заменителем является этот человек (the man). Местоимения не заменяют своих грамматических антецедентов: в качестве антецедентов они могут иметь неопределенные сингулярные термы, но их можно заменить только определенными сингулярными термами. Они таковыми и являются.
Этот вопрос о местоимениях достаточно ясен, коль скоро он замечен, и без обращения к тонкостям математической логики. Все же организованные системы обозначений логики скорее всего могут подсказать эту точку зрения благодаря замечательному способу, каким эти системы обозначений анализируют работу местоимений и других сингулярных термов, определенных и неопределенных.
Но логика позволяет нам развить эту точку зрения и дальше. Наш пример вскрыл только то, что местоимение в качестве антецедента может иметь неопределенный сингулярный терм и может быть вытеснено только определенным сингулярным термом. Но успехи современной логики позволяют нам сказать далее, что в принципе местоимение употребляетя только с неопределенным сингулярным термом в качестве антецедента и что определенные сингулярные термы, отличающиеся от местоимений, вообще не нужны. Мы можем систематически так перефразировать наши предложения, что в качестве переменных останутся только определенные сингулярные термы, употребляемые прономинально в соединении с неопределенными сингулярными термами, подобно переменной х в предложении «каждая область х содержит область меньшую, чем х». Такая теорема сведения может представлять известный интерес для лингвистики, так как она позволяет несколько иначе взглянуть на функцию местоимений.
Рассмотрим с этой точки зрения основную роль местоимений. Типичное предложение, местоимения которого в качестве своих антецедентов имеют неопределенные сингулярные термы, выглядит следующим образом: Некоторые, которых никто не не любит, не ценят самих себя (Some whom none dislike do not appreciate themselves). Заметим теперь, что в данном случае местоимения представлют собой просто комбинаторные средства для извлечения сложных общих термов из обеих частей предложений. Альтернативным средством, которое выполняет работу местоимения whom (которых) в сложном общем терме которых некоторые не любят (whom some dislike) является окончание причастия в пассивном залоге, т. е. слово нелюбимые. Сходным образом, сложный общий терм которых никто не любит (whom none dislike) соответствует слову ненелюбимые (undisliked). Помимо этого, альтернативным средством, которое выполняет работу местоимения самих себя (themselves), в сложном общем терме ценят самих себя является префикс самих (self-), и мы приходим, следовательно, к слову самоценители (self-appreciators). Все предложение принимает следующий вид Существуют ненелюбимые несамоценители (There are undisliked non-self-appreciators). В результате не остается ни одного сингулярного терма, определенного или неопределенного, и даже ни одного местоимения.
Местоимение, рассматриваемое в его основной роли, понимается, таким образом, как механизм, сходный по своему назначению с окончаниями пассива и рефлексивным префиксом. По отношению к последним его преимущество заключается просто в его склоняемости, которое ограждает нас от таких замысловатых конструкций, как ненелюбимые несамоценители (undisliked non-self-appreciators).
Я продемонстрировал эту точку зрения на обычном словесном примере. Однако ее истоки лежат в математической логике, и именно там существует ее общее доказательство. В математической логике доказывается, что переменные, которые являются местоимениями в логике, можно в принципе опустить в пользу нескольких соответствующим образом выбранных операторов, сравнимых с окончанием пассива и рефлексивным префиксом. Один из путей выполнения этого был предложен Шейнфинкелем, идеи которого были развиты дальше Карри под названием комбинаторной логики. Недостатком этого подхода можно считать то, что он предполагает чрезвычайно сильный математический аппарат, равноценный высшей абстрактной теории множеств. Но это необязательно; можно ввести полдюжины операторов, отличающихся от операторов Шейнфинкеля, которые поддаются определению на уровне элементарной логики предикатов или кванторов. Заметим, что дело не в том, что они более удобны, чем переменные или местоимения, а в том, что они, несмотря на все свои неудобства, достаточны для того, чтобы выполнить ту же самую работу. А знать это — означает лучше понять как раз то, в чем заключается своеобразная работа местоимений.
Еще по теме ТОЧНЫЕ МЕТОДЫ В ЛИНГВИСТИКЕ:
- С. П. КостычевНАТУРФИЛОСОФИЯ И ТОЧНЫЕ НАУКИ
- Точные и приближенные числа
- Основные разделы лингвистики
- НАСУЩНЫЕ ЗАДАЧИ структурной лингвистики
- 1-1. Лингвистика — наука без предписаний
- 1. Проблема элементарных фонологических единиц в истории лингвистики
- 1.1.4. ИСТОРИЯ лингвистики
- IV. Лингвистика
- 1. Понятие «владение языком» в современной лингвистике
- § 1. Из истории лингвистики.
- ИЗ ИСТОРИИ СТРУКТУРНОЙ лингвистики
- 6-9. Теория информации и лингвистика
- В ОБЛАСТИ ЧЕЛОВЕЧЕСКИХ ЯВЛЕНИЙ ТОЧНЫЕ ЗАКОНЫ (ТАК НАЗЫВАЕМЫЕ «ЕСТЕСТВЕННЫЕ ЗАКОНЫ») ДОСТИЖИМЫ ПРИ ТЕХ ЖЕ ФОРМАЛЬНЫХ УСЛОВИЯХ, КАК И В ОБЛАСТИ ЯВЛЕНИЙ ПРИРОДЫ