17.12.2001 Автоматизированный переводчик-синхронист
Вышедший в эфир две недели назад выпуск радиожурнала «Наука и техника» был посвящён рассказу о трёх проектах, выдвинутых на соискание Немецкой премии будущего, но не получивших её. Что касается проекта, удостоенного премии, то он явно заслуживал отдельной передачи, которую я и предлагаю сейчас вашему вниманию.
Итак, завершая торжественную церемонию, проходившую в Берлине в здании Коммуникационного центра имени Макса Дельбрюка, президент Германии Йоханнес Рау распечатал конверт, вручённый ему председателем жюри, и произнёс:
- Немецкая премия будущего за 2001-й год присуждается профессору доктору Вольфгангу Вальстеру.
Профессор Вольфганг Вальстер, директор Немецкого исследовательского центра искусственного интеллекта при университете города Саарбрюккена, удостоился высокой награды за разработку компьютерной программы, способной выполнять функцию автоматизированного переводчика-синхрониста. Эта удивительная программа, именуемая «VerbMobil», открывает широкие перспективы и во многих других сферах, где необходимо, чтобы компьютер понимал живую человеческую речь.
Британский писатель Даглас Эдамс, знаменитый автор научно-фантастической трилогии «Путешествие автостопом по галактике», придумал в помощь своим героям некое чудо-животное – «вавилонскую рыбку», способную понимать и синхронно переводить все языки Вселенной. Программа, разработанная под руководством профессора Вальстера в Саарбрюккене, вряд ли может облегчить общение с представителями внеземных цивилизаций, но на Земле ей, похоже, уготован триумфальный успех. Сам профессор Вальстер формулирует стоявшую перед ним и его коллегами цель так:
- Необходимо упростить процесс взаимопонимания между человеком и компьютером. Мы не можем изменить человека, но вполне можем попытаться облегчить ему общение с компьютером. Это значит, нужно научить компьютер понимать человеческую речь, причём не нарочито медленно продиктованные фразы, а самую обычную разговорную речь. Мало того, компьютер должен понимать ещё и мимику собеседника, и его жестикуляцию, и, по возможности, правильно толковать все его движения – ведь это, в конечном счёте, тоже компоненты процесса коммуникации.
В том, что этой цели удастся достичь, профессор не сомневался:
- Компьютер должен идти навстречу человеку, а не наоборот. Мы рассчитываем, что уже через несколько лет для общения с компьютером не нужны будут ни мышь, ни клавиатура.
Надо сказать, что попытки научить компьютер подчиняться речевым командам предпринимаются уже давно. Например, существуют программы, призванные обеспечить пользователю возможность надиктовывать текст, а не печатать его на клавиатуре. К сожалению, ошибок при этом получается столько, что их исправление требует порой больше времени, чем набор всего текста вручную. Между тем, профессор Вальстер взялся за решение гораздо более сложной задачи. Она состоит в том, чтобы...
- ...создать мобильный телефон с функцией перевода с одного языка на другой. Причём такой, чтобы не нужно было подключать к нему ещё какие-то приборы. Просто вы набираете определённый сервисный номер, система соединяет вас с нужным вам иностранным абонентом и сама переводит ваш диалог в обе стороны. Вы слышите речь своего собеседника в переводе на ваш родной язык, а то, что говорите вы сами, раздаётся на другом конце провода в переводе на язык вашего собеседника. Сегодня наша программа поддерживает, помимо немецкого, ещё три языка – английский, японский и китайский. Правда, должен сразу отметить, что всё это хорошо функционирует лишь до тех пор, пока разговор не выходит за рамки определённых, заранее выбранных тем.
Планирование и организация поездок, согласование сроков деловых встреч и обсуждение контрактов, а также телефонный сервис и техническая поддержка для пользователей компьютеров – вот те три темы, на которых сосредоточили свои усилия разработчики программы. Они заложили в неё массу самых разных сведений в этих областях знания, так что программа обрела способность очень глубоко анализировать любые фразы, касающиеся выбранных тем. Профессор Вальстер поясняет:
- Глубокий анализ означает, что сначала произнесённая фраза акустически раскладывается на слова-гипотезы, которые получают – или не получают – подтверждение в зависимости от того, какой текст звучал в ходе того же диалога раньше. Надо сказать, что хотя лексика и грамматика – важные критерии анализа, ими дело не исчерпывается. Программа обязана знать реалии быта. Ну, например, то, что обедать принято между полуднем и часом дня, а ужинать – после 6-ти часов вечера. Ведь если немецкий бизнесмен говорит по телефону своему американскому партнёру: «а потом давайте вместе пойдём поедим», то при переводе этой фразы на английский язык программа должна в зависимости от времени суток сказать либо «let’s have lunch together – давайте вместе пообедаем», либо «let’s have dinner together – давайте вместе поужинаем».
Многоуровневая система распознавания и перевода речи сочетает различные критерии с тем, чтобы максимально точно выявить истинный смысл сказанного. Речь, регистрируемая микрофоном, прежде всего дигитализируется, то есть из аналоговой формы переводится в цифровую. Затем программа разбивает эти акустические сигналы на отдельные слова и старается их осмыслить. На этом этапе главная трудность связана с многозначностью слов – например, произнося немецкое слово «Bank», собеседник может иметь в виду и кредитный институт, и скамью, и базу данных. Кроме того, система должна уметь отфильтровывать оговорки и звуки-паразиты вроде «эканья». Анализу подвергается также мелодика фразы – это очень важно, ведь интонацией можно придать своим словам даже прямо противоположный смысл. Когда же фраза расшифрована, программа-переводчик строит соответствующую ей фразу на иностранном языке. Затем эта фраза синтезируется акустически. Сами создатели программы признают, что этот последний этап ещё нуждается в совершенствовании и доработке. А вот распознавание речи и её перевод уже сейчас функционируют безупречно. «VerbMobil» прекрасно понимает любого собеседника, даже если он говорит с иностранным акцентом или на одном из множества существующих в Германии диалектов. Профессор Вальстер поясняет:
- Мы сделали так: от Фленсбурга на севере и до Нижней Баварии на юге набрали дикторов с самыми разными диалектальными окрасками речи – всего 1700 человек – и с их помощью тренировали нашу систему.
Итог 8-летней работы над программой «VerbMobil» – создание 6-ти новых фирм, выделившихся непосредственно из этого проекта, множество перспективных прикладных разработок в области языковых технологий, свыше 900 студентов, избравших эту тематику своей специальностью, а кроме того – более 20-ти наименований изделий, успешно реализуемых сегодня на рынке. Среди них – система речевого управления автомобилем, программа автоматизированной обработки и зачитывания вслух электронной почты, программа поиска музыки в Интернете по ключевым словам, программа, отвечающая по телефону на запросы о биржевых курсах, и программа, дающая – также по телефону – справки о репертуаре кинотеатров.
Когда работа над проектом только начиналась, компьютеры были настолько медленными, что в успех не очень верилось, – признаётся профессор Вальстер:
- Мы, конечно, не могли рассчитывать на то, что весь наш проект действительно увенчается полным успехом. Тем более что мы с самого начала ставили перед собой две цели: не только решить сугубо научную задачу, но и попытаться обеспечить нашей промышленности, работающей в этой сфере, лидирующее положение в Европе. Сегодня можно со всей уверенностью сказать, что в этой области исследований Германия занимает в Европе первое место.
Профессор Вальстер вспоминает:
- Я всегда очень интересовался языками, в том числе вопросами грамматики, в школе был отличником по латыни, но одновременно увлёкся так называемой конкретной поэзией, поэзией, которая делает упор на визуальной, физической природе слова. Это увлечение побудило меня более внимательно присмотреться к структурной лингвистике, к методам формального описания языка как знаковой системы.
Будучи студентом, Вальстер выбрал, на первый взгляд, странное сочетание профилирующих предметов: лингвистика и информатика. В 29 лет он стал профессором.
- Конечно, элемент тщеславия тут тоже сыграл свою роль. Но мне ещё и крупно повезло. К науке я отношусь как к спорту: если уж я ею занимаюсь этим, то хотел бы играть в высшей лиге, а не за дворовую команду.
Вальстер не только сам попал в высшую лигу, но привёл туда и возглавляемый им Немецкий исследовательский центр искусственного интеллекта. Сегодня учёные Центра уже научились моделировать в компьютере такие функции, как зрение, слух и речь. Однако создать робота, способного выполнять функцию полноценного домашнего помощника, пока не удаётся.
- Я проработал в этой области 30 лет и могу определённо сказать, что те виды деятельности, которые люди постигают в школе или в институте, то есть в процессе упорядоченного обучения, гораздо легче и быстрее поддаются компьютеризации, чем, скажем, разного рода бытовые занятия, основанные на нашем повседневном опыте. Прежде всего, такие занятия не формализованы. Не существует никакой теории глажения рубашек или теории езды на велосипеде. А если процесс формально не описан, то его невозможно и запрограммировать. Работая над созданием искусственного интеллекта, я стал гораздо выше ценить бытовой разум и несколько ниже – знания, добытые академическим путём.
Многие немецкие исследователи жалуются на трудности с реализацией своих научных идей на практике. Профессор Вальстер настроен менее скептически:
- С моей точки зрения, за последние годы ситуация значительно изменилась к лучшему. Я бы сказал, что тесное и весьма плодотворное сотрудничество промышленных фирм, высших учебных заведений и исследовательских учреждений как раз в Германии носит сегодня почти образцовый характер. А вот в США, которые принято ставить в пример, сотрудничество между крупными концернами и вузами далеко не всегда протекает гладко.
Для своего Центра профессор Вальстер избрал необычную форму организации научной деятельности:
- Это была новая идея, которая состояла в том, чтобы с самого начала привлечь к нашим исследованиям промышленность. Таким образом, у нас 7 учредителей: это известные концерны («Даймлер-Крайслер» и «SAP»), финансовый институт («Дрезднер банк»), крупное научное объединение («Общество имени Фраунхофера), две федеральные земли (Рейнланд/Пфальц и Саарланд), а также Министерство образования и научных исследований. Главная же новация заключается в том, что у нас нет никакого базового финансирования, которое так часто балует и даже развращает исследователей. То есть каждую марку мы должны зарабатывать заказами на тот или иной проект. Это очень дисциплинирует. Ещё одно важное преимущество нашей формы организации состоит, с моей точки зрения, в том, что мы не привязаны к жёсткой тарифной сетке, обязательной для общественно-правовых учреждений. Это не значит, что мы платим больше, чем там, но это даёт нам возможность оплачивать труд наших исследователей более гибко, то есть в зависимости от их усердия и от результатов. Людям это нравится, и они не спешат от нас уходить. Впрочем, они и не засиживаются, что тоже очень важно. У нас 170 сотрудников, их средний возраст – всего 33 года, да я ещё, к сожалению, изрядно порчу этот показатель. Так что работа в нашем центре – это важный, но промежуточный этап в карьере исследователя. Мы и не хотим, чтобы они сидели у нас вечно, и радуемся за них, когда они либо уходят в академическую науку и становятся профессорами в вузах, либо основывают собственные фирмы, либо переходят на работу в промышленность, к нашим партнёрам.
Очевидно, такая форма организации годится учёным не всех специальностей. Основывать коммерческие фирмы вряд ли могут, скажем, германисты...
- Ну, если говорить о германистах, то они-то как раз у нас работают. Я думаю, именно перед представителями гуманитарных наук сегодня открывается всё больше новых сфер деятельности. Во всяком случае, нам, тем, кто работает в области искусственного интеллекта, очень нужны и психологи, и лингвисты. Достаточно вспомнить современные мультимедийные и обучающие программы, чтобы стало ясно: без помощи специалистов-гуманитариев тут не обойтись. Я вовсе не утверждаю, что наша модель годится всегда и всюду, но уверен, что она обогащает исследовательский ландшафт в Германии. Нам нужны разные формы организации научной деятельности.
Итак, Центр в Саарбрюккене – бесспорный лидер в европейском масштабе. А в мировом? Профессор Вальстер говорит:
- Давать самому себе оценку всегда трудно, но есть один аргумент, который облегчает задачу: совсем недавно мы проводили тут у себя научную конференцию на тему «Коммуникация между человеком и машиной», и на неё приехал лично главный программист компании «Microsoft», причём за собственный счёт, мы его не приглашали. Из США прибыли и многие другие видные специалисты-компьютерщики, а также профессора таких престижных вузов как Стэнфордский университет или Массачусетский технологический институт, и все за свой собственный счёт. Это о многом говорит. Раньше только мы летали туда, а теперь и они прилетают к нам, чтобы ознакомиться с нашими разработками. Иными словами, мы занимаем вполне достойное положение в мире и не уступаем признанным лидерам – США и Японии.
Впрочем, несмотря на успехи в создании искусственного интеллекта, никакой эйфории профессор Вальстер не испытывает:
- Трезво оценивая возможности современных систем, можно смело сказать, что никакая конкуренция с их стороны человечеству в ближайшие сто лет не грозит.
Более того, по собственному признанию профессора Вальстера, его «VerbMobil» пока не в состоянии понять и перевести с одного языка на другой, скажем, философский диспут или беседу двух влюблённых. Но это – дело не столь уж отдалённого будущего.