Методы исследования просодии
Наш критик справедливо указывает на недостаточность субъективных (интроспективных) методов исследования в фонетике. Однако, как кажется, он не осознает одного важного обстоятельства: до сих пор никакие фонетические объекты — ни сегменты, ни просодии — не были открыты на основе объективных методов, т е.
в результате анализа акустических графиков или на основе артикуляционных исследований. Всегда субъективные решения о фонетических сущностях предшествовали анализу их объективных коррелятов. Так по необходимости было в прошлом, когда возможности инструментального исследования речи либо вообще отсутствовали, либо были минимальны, и эта ситуация пока что не изменилась в наш компьютерный век.В частности, начальный этап исследования фонетики любого неописанного языка и ныне начинается не с анализа его акустических образцов, а со слухового анализа живой речи носителей. Только определив на слух состав звуков и фонем и на слух же выявив просодические контрасты, имеет смысл переходить к определению их артикуляционных и акустических коррелятов. При этом, как правило, исследователь опирается на интуицию носителя языка, на его чувство сходства и различия звуков и просодий. Что касается литературных языков типа русского, мы опираемся в основном на традицию, которая, в свою очередь, возникла ранее на основе интроспективного опыта работы с речью.
Каковы же возможности фонетической интроспекции? Они относительно высоки в случае сегментов и некоторых видов просодических контрастов, однако просодия в общем случае плохо поддается интроспекции обычного носителя языка [Кодзасов 1987]. Ситуация с осознанием звучащей речи не отличается от стуа- ции с осознанием говорящим других видов своего речевого поведения. Обычному носителю языка относительно легко проинтерпретировать семантику предметных лексем типа номинаций частей тела, однако он не способен объяснить семантику видовых противопоставлений или мотивацию порядка слов.
Профессиональный лингвист отличается от наивного говорящего в нескольких отношениях. Во-первых, практика вырабатывает у него более развитую интроспективную способность, хотя, вероятно, врожденные способности к рефлексии индивидуальны. Опытный фонетист научается задерживать в памяти звуковую форму отрезка речи, точно повторять и анализировать ее. Во-вторых, лингвист владеет техникой проверки тех или иных языковых различий с помощью диагностических тестов. И, наконец, он опирается на совокупность знаний, накопленных его предшественниками и выработанных им самим. К сожалению, установки анализа, связанные с последним фактором, нередко являются причиной серьезных ошибок в интерпретации материала.
Продемонстрируем специфические проблемы, возникающие при интроспективном анализе просодии, на нескольких примерах. начнем с русской фразовой интонации, поскольку ситуация с ней большинству потенциальных читателей знакома лучше. на протяжении нескольких десятилетий мы пользовались для ее описания системой семи ИК Е. А. Брызгуновой. Между тем исследование С. Оде [Оде 1995] ясно показало трудности применения этой системы к реальному материалу. Оказалось, что к одной и той же ИК автором системы могут быть отнесены сильно отличающиеся просодические образцы, а при этом некоторые образцы, относимые им к разным ИК, перцептивно близки. Такие случаи могут быть объяснены следующим образом: система Е. А. Брызгуновой дает упрощенную картину интонационной реальности, основанную на минимальном числе просодических характеристик (в основном это направление тона), тогда как при интроспективной оценке реальных образцов сам автор использует некоторые другие просодические параметры, причем некоторые из них имеют больший вес, чем направление тона.
Пример иного типа дают знаменитые литовские «тональные» акценты. Их фонетическое описание было сделано еще в середине XIX века и до появления
возможности экспериментальной проверки не подвергалось сомнению. Однако инструментальные исследования последнего времени однозначно показывают, что тон либо совсем не играет роли, либо играет самую незначительную роль в ощущаемых носителями языка просодических контрастах.
В частности, как свидетельствуют результаты недавнего исследования Г. Догила [Dogil 1999], осуществленного на базе современного высокотехнологичного оборудования, для различия «акутовых» и «циркумфлексовых» слов наиболее важными оказываются спектральные характеристики, т. е. такие звуковые различия, которые обусловлены какой-то артикуляционной просодией.Этот пример демонстрирует опасность тональной установки при интерпретации словесных просодических контрастов. Обычно считается, что если носители языка чувствуют не связанное с сегментами и с местом ударения различие в произношении слов (особенно при наличии минимальных пар), то оно обусловлено тональным противопоставлением. Такая установка сыграла отрицательную роль в просодических исследованиях, которые проводили экспедиции кафедры структурной и прикладной лингвистики МГУ в языках Дагестана. После открытия просодических контрастов в ряде языков андийской группы (в случае ахвахского и ча- малинского языков экспериментальные данные подтвердили их тональную основу [Кибрик, Кодзасов, Старостин 1978]) тональная презумпция была принята и при исследовании других языков, и в словарях многих языков на основе слухового анализа и интроспективных оценок самих носителей были проставлены тональные индексы при всех словах. Работа эта потребовала очень больших усилий. Однако когда с появлением компьютерных звуковых редакторов возникла возможность быстрой проверки акустических коррелятов слышимых различий, оказалось, что они в большинстве языков не являются тональными.
Ситуация с дагестанскими языками аналогична ситуации с литовским языком: различия в звучании слов ощущаются носителями языка и исследователями, но не являются тональными, хотя информанты охотно говорят о них в терминах тонов. Аналогичные явления отмечены в африканских языках [Lockwood 1982]. В нашей практике имел место случай, когда носитель одного из африканских языков без труда отождествлял свои словесные «тоны», тогда как графики основной частоты, полученные на компьютере, показывали, что ощущаемые им различия не являются тональными.
нам довелось также столкнуться с ошибочной интерпретацией фонационных различий как тональных исследователями одного из языков Юго-Восточной Азии; такая ошибка не случайна, так как просодические контрасты в этом регионе нередко представлены фонационно-тональными комплексами (см. [Иванов 1975]).Долгий опыт тонально ориентированного транскрибирования словесной просодии в дагестанских языках сказался и на нашем восприятии словесных просодических различий в русском языке. В первой статье, посвященной «скрытой» просодии русского слова [Кодзасов 1989], мы использовали тональные ярлыки, от которых впоследствии отказались.
Механизм тональной проекции нетональных просодических контрастов нуждается в исследовании. Как известно, имеется связь тона и громкости (на ней, в частности, основаны теории возникновения ударения В. А. Дыбо и Т. М. николаевой). Однако наша тональная интерпретация была обусловлена иными ассоциациатив- ными связями тона: с уровнем напряженности артикуляционных органов (увеличение напряженности ощущалось как повышение тона, а уменьшение как понижение) и с вертикальным положением гортани (движение вниз ассоциировалось с восходящим тоном, а вверх с понижением). Вероятно, первая из этих ассоциаций связана с известной зависимостью уровня тона от подъема гласного.
Мы специально подробно остановились на проблеме тональной установки при исследовании просодии слова. Дело в том, что здесь инерция мышления, восходящая к традиции индоевропейского языкознания и мотивированная литовскими «тонами», очень сильна. Между тем, опыт показывает, что следует с большой осторожностью относиться к тональным интерпретациям при исследовании словесных просодических различий.
В целом не вызывает сомнения, что интроспекция может использоваться только как временная эвристическая техника. Проблема, однако, состоит в том, что без предварительной дескриптивной модели, основанной на интроспективно полученных результатах, фонетисты пока что не умеют работать. Опыт западной фонетики ясно показывает, что этап дескриптивной фиксации просодических явлений, основанной на субъективных оценках опытного фонетиста, до сих пор предшествует этапу объективного (инструментального) анализа.
В частности, только недавно началось серьезное инструментальное исследование артикуляи- онных и акустических коррелятов описанных Лейвером голосовых установок. напомним, что для лингвиста возможности объективного наблюдения фонетических характеристик речи были до начала 90-х годов довольно ограниченны. В настоящее время, несомненно, желательно скорейшее объективное исследование интроспективно обнаруживаемых фонетических различий — хотя бы на уровне ограниченного эксперимента, носящего поисковый характер (ср. английский термин pilot study).Здесь уместно остановиться на принципиальном несовпадении установок автора настоящего текста с установками его критика. Оно связано с разными целями их работы и их разным опытом. У нас за плечами работа с носителями многих малоисследованных языков в полевых условиях. Фонетист с таким опытом научается точно имитировать произношение носителей разных языков и транскрибировать свою имитацию. Поэтому у него вырабатываются специфические интроспективные навыки, отсутствующие у обычного специалиста, работающего с речью. Практика показывает достаточную надежность таких записей. Разумеется, при этом используются дескриптивные техники, которые позволяют контролировать адекватность фонематических интерпретаций. Повторим, что инструментальный анализ используется в этом случае уже после выделения звуковых единиц данного языка и направлен на уточнение фонетических коррелятов найденных различий.
Наш поисковый анализ русской словесной просодии первоначально основывался на самонаблюдении и на сравнении своего произношения с произношением других москвичей. При этом прослушивались разнообразные магнитные записи, в том числе записи речи известных лингвистов. Последние годы при такой работе нами постоянно используется компьютер — как для удобства прослушивания релевантных фрагментов текста, так и для текущего просмотра акустических графиков. При этом мы все в большей степени опираемся на записи речи дикторов- профессионалов.
Этот способ работы, конечно, не имеет ничего общего с той техникой психофизического эксперимента, к которой привык А.
В. Венцов. До сих пор эксперименты такого рода и не служили средством выявления элементов просодической системы языка. Их обычной целью было уточнение вклада отдельных параметров сигнала в реализации выделенного лингвистом языкового контраста, но это совершенно иная задача. Поэтому многие критические выпады нашего оппонента направлены просто не по адресу.Обратимся теперь к обсуждению инструментальных методов (артикуляционных и акустических) исследования просодии. С их применением существует немало проблем. Во-первых, артикуляционные исследования в нашей стране, к сожалению, ныне затруднены ввиду их дороговизны. Между тем, они дают наиболее прямой путь к выяснению адекватности некоторых гипотез, выдвигаемых фонетистами. Характерна в этом отношении судьба теории, по-новому объяснявшей артикуляционную базу различия глухих и звонких смычных согласных в русском языке. Эта теория — она в 60-х гг. разрабатывалась А. В. Венцовым (см., например, [Венцов 1966]) — вызвала большой интерес фонетистов. Автор предположил, что положение голосовых связок при произнесении глухих и звонких смычных одинаково, а различие заключается в том, что при произнесении глухих раскрывается шепотной треугольник, через который и проходит воздушная струя из легких, что предотвращает колебания голосовых связок. В 80-х гг. появилась возможность прямого наблюдения работы гортани с помощью эндоскопа. Оказалось, что традиционные представления о механизме оглушения были правильны — оно обусловлено разведением голосовых связок [Кодзасов, Кулиев 1986].
Как было показано выше, возможность получения представительных данных о кривых основной частоты, которую дает ныне компьютер, позволяет с достаточной надежностью судить о тональной или нетональной природе просодических контрастов, ощущаемых носителями языка. В то же время давно известно, что даже этот относительно простой акустический параметр зависит не только от собственно тональной программы произнесения, но также от других переменных: глухости/звон- кости прилегающих согласных, подъема гласных, деклинации и др. Одним из таких факторов является фонационная характеристика произнесения, в частности скрипучий голос «портит» звуковую волну, создавая нерегулярность амплитуды и длительности пар соседних периодов, что приводит к разрывам в графиках основной частоты. Эта фонация весьма часто используется в русской речи, выполняя определенные семантические функции. В этой связи удивление вызывает высказывание А. В. Венцова по поводу графиков тона, представленных в одной из работ с нашим участием [Заппок, Князев, Кодзасов 1996]. Критик указывает на наличие разрывов в кривых тона как на недостаток работы соответствующего алгоритма используемой нами программы WinCecil. Однако выравнивание графика тона в подобных случаях уничтожало бы релевантную информацию о фонации (в тексте статьи она указывается в просодической транскрипции, сопровождающей речевые образцы).
Мы задержались на этом моменте, поскольку он служит индикатором двух разных подходов к фонетической интерпретации акустического сигнала. Для нас очень ценны все отклонения от ожидаемого, все непонятные детали сигнала, поскольку они потенциально несут информацию о том, чего мы пока не знаем. наш оппонент исходит из презумпции полного знания, а в этом знании никакого скрипучего голоса или других скрытых просодий не предполагается. В частности, прямо отвергается существование «редуцированных» слов. но тогда, в добавление к приведенным ранее диагностическим фактам, свидетельствующим об их наличии, требуется объяснение еще одного непонятного явления, связанного с тоном — многочисленных случаев переноса тонального фразового акцента на первый безударный слог редуцированных слов (примеры акустических графиков приведены в [Кодзасов 1999]).
Говоря о проблемах интерпретации акустических данных, мы указали пока лишь на некоторые детали в тональных графиках, которые не могут быть объяснены на основе упрощенных представлений о русской фонетике. Однако тщательный просмотр достаточно большого массива спектрограмм русских слов обнаруживает массу других непонятных явлений. Перечислим некоторые из них: распадение гласного на части, различие которых нельзя объяснить влиянием прилегающих согласных, различие в скорости спектрального изменения в одинаковых сочетаниях гласного с согласным в разных словах, различие в распределении энергии в разных частотных диапозонах для одних и тех же гласных в разных словах и прочее.
Отметим, что эти явления присутствуют в равной степени как на спектрограммах, полученных с помощью программы WinCecil, подвергаемой А. В. Венцовым критике, так и с помощью последней версии высокотехнологичной программы Multi-Speech. Мы убеждены, что попытки объяснить эти отклонения могут впервые заменить обычное направление инструментальных фонетических исследований (от известных объектов к их акустическим коррелятам) на новое (от непонятного в акустическом сигнале к неизвестным ранее объектам). Очень показателен в этом отношении пленарный доклад одного из наиболее авторитетных ныне европейских фонетистов Ф. нолана на открытии последнего фонетического конгресса в Сан-Франциско [Nolan 1999]. Он посвящен необъяснимому с точки зрения существующих представлений артикуляционному варьированию звуков. нолан призывает к выявлению пока неизвестных скрытых факторов, лежащих в основе этих процессов.
Пафос А. В. Венцова прямо противоположен — он категорически отрицает наличие каких-либо скрытых компонентов в речи. При этом в скрытые (от нашего критика) попадают и такие признаки, которые фонетистам давно известны. Так, полное недоумение вызывает его утверждение о принципиальной невозможности извлечь из акустического сигнала информацию о вертикальных смещениях гортани. А как же фонетисты различили признаки «эмфатическая веляризация» и «эмфатическая палатализация» (термины н. С. Трубецкого)? Ведь при общности эпиглоттального компонента эти артикуляции отличаются именно по вертикальному положению гортани (соответственно низкому и высокому). Впрочем, для доказательства слуховой различимости смещения гортани совсем не обязательно обращаться к экзотическим языкам. Любой профессиональный певец умеет контролировать положение гортани при пении, и мы прекрасно слышим, как меняется тембр голоса при опускании гортани.
не меньшее удивление вызывает утверждение критика о бессмысленности введения нами признака «раствор» ввиду того, что нижняя челюсть не может выступать в качестве независимого артикулятора. Однако мы отнюдь не являемся здесь первооткрывателями: положение нижней челюсти рассматривается как независимый артикуляционный параметр уже в работе Б. Линдблома и Й. Сундберга [Lindblom, Sundberg 1971]. С тех пор опубликовано немало исследований, прямо или косвенно опирающихся на этот параметр, но от нашего критика они почему-то скрыты.
Особое возмущение у А. В. Венцова вызывает характеристика «темп завершения гласного» применительно к словесному и слоговому уровню, поскольку темп является интегральной характеристикой высказывания. Однако признак «примыкание» (а он определяет скорость падения энергии в конце гласного, связанную обычно с типом перехода к последующей консонантной артикуляции) был открыт Зиверсом еще в XIX веке, а в середине прошлого века активно исследовался представителями лондонской просодической школы. Из текста наших работ ясно видно, что речь идет именно об этом признаке. Разумеется, отдельной проблемой является интеграция темпов составляющих разных уровней в единую временную программу.
нельзя не остановиться на критике А. В. Венцова по адресу компьютерной программы WinCecil. Эта бесплатная программа (а ныне ее новый вариант — Speech Analyser) широко распространена в России, и мы несем за это значительную долю ответственности. Она рассчитана на лингвистическое, а не технологическое использование. В качестве таковой она очень удобна, таково мнение и тех наших зарубежных коллег, которые с ней знакомы. Она не лишена недостатков, однако отечественные фонетисты-технологи пока не предложили лингвистам общедоступной программы более высокого уровня.
У наших технологов есть еще один долг перед лингвистами: до сих пор не существует никакого учебного пособия, которое помогало бы начинающим фонетистам освоить технику анализа разных акустических параметров речи. За рубежом таких пособий немало. Уместно в этой связи поднять вопрос о характере взаимодействия лингвистов с другими профессионалами, связанными с речью. В своей речи на открытии Международного фонетического конгресса в Таллине в 1987 г. П. Ладефогед говорил о том, что фонетика перестала быть единой наукой — это комплекс взаимодополняющих наук, где каждая составляющая вносит свой особый вклад в целое. Как кажется, наш критик свою роль фонетиста-технолога понимает совершенно иначе.
Обсуждая методы выявления «скрытых» просодий, мы пока не касались лингвистических данных, которые косвенно указывают на наличие неучтенных фонетических факторов. Между тем свидетельств такого рода немало. Их анализ требует специального исследования, и мы ограничимся здесь указанием их типов.
настоящий вызов для лингвистов являет собой система русского ударения. Мы убеждены в том, что в ее основе лежат скрытые просодические свойства слов, и предварительная попытка их выявления уже была нами сделана (см. [Кодзасов 1996а]). В то же время несомненна и частичная морфонологическая мотивация акцентных процессов. Вероятно, для многих носителей языка (в том числе тех, для кого русский язык не является родным) постановка ударения в слове основывается только на знании принадлежности лексемы к тому или иному морфонологическому акцентному классу. Однако в ряде случаев проглядывает семантическая (а через нее — просодическая) мотивация некоторых акцентных групп. Так, среди «минусовых» корней выделяется группа обозначений объектов, которые в дискурсе, как правило, имеют дейктическую актуализацию: дом, земля, небо, вода, река, берег; рука, нога, голова, нос, уго; год, день, ночь, вечер и др. Актуализованность объекта предполагает отсутствие выделительного акцента, вводящего новое в поле зрения, т. е. встроенная безударность корня в этом случае, возможно, имеет прагматикопросодическую мотивацию. Выше мы говорили о семантико-просодической обусловленности префиксального ударения в словах с семантикой «чужого». Поиски семантико-просодической обусловленности ударения, как нам кажется, следовало бы продолжить.
В современном русском языке имеется ряд отклонений от произносительных норм, которые также могут быть обусловлены вторжением «скрытой» фонетики. Таково, например, отсутствие редукции гласного в предударном предлоге для при «неправильной» редукции в падежных словоформах от лексем двадцать, тридцать, лошадь. Также другие лексикализованные и морфологизованные отклонения в произношении в качестве причины, скорее всего, имеют коннотативную просодию.
немало вопросов ставят диалектные факты. Масса зафиксированных здесь процессов не может быть объяснена на основе наблюдаемых фонетических контекстов. Здесь гипотеза скрытой просодической мотивации изменений также может оказаться продуктивной.