Порочный круг
В каждой растущей компании наступает момент, когда кто-то совершает ошибку. Менеджер отправил клиенту письмо не с того адреса. Разработчик выкатил непротестированный код. Продавец пообещал то, чего компания не умеет.
Что делает руководство? Пишет регламент. Потом случается новый инцидент — пишут ещё один. Через пять лет в компании двести регламентов, сотрудники тратят больше времени на их соблюдение, чем на работу. Живые, инициативные люди превращаются в исполнителей процедур. И руководство жалуется: «Почему никто не проявляет инициативу? Где креативность?»
Креативность там же, где вы её закопали — под двумя сотнями запретов.
Этот порочный круг знаком любому, кто работал в корпорации. Но я не ожидал обнаружить его сразу в двух других местах.
Эффект ящика
Мы делаем Лизу — ИИ-интервьюера, который проводит глубинные интервью в Telegram. Та же языковая модель, которая в обычном чате шутит, сопереживает, чувствует настроение собеседника, — в роли интервьюера вдруг превращается в робота.
Респондент делится чем-то личным, возможно болезненным. Лиза отвечает:
«Спасибо, всё поняла.»
И переходит к следующему вопросу. Человек открылся — а в ответ получил квитанцию о приёмке информации.
Мы написали для Лизы инструкцию на сто строк. Следуй блокам. Насыщай критерии. Максимум два уточнения на блок. Один вопросительный знак на сообщение. Не говори «Интересно». Не говори «Понятно». Не отклоняйся от темы.
Каждое правило появилось не от вредности. За каждым — реальный случай: модель ушла от темы, задала неуместный вопрос, слишком глубоко полезла в личное. И мы, как ответственные инженеры, добавляли ограничение за ограничением. Ровно как тот руководитель с регламентами.
Мы превратили мощное животное, способное на чудеса пластики и силы, в узника ящика, который общается с миром через просверленные дырки. И сказали: нейросеть никуда не годится. Точно так же, как руководитель говорит: людям ничего нельзя доверить.
Чистый эксперимент
С людьми невозможно поставить чистый эксперимент. Нельзя взять одного и того же сотрудника и сравнить его работу с регламентами и без. Слишком много переменных: настроение, опыт, коллеги, время суток.
С ИИ — можно. И мы поставили его случайно.
На сайте UsabilityLab работает чат-бот. Та же модель. Почти без инструкций. Вот фрагмент реального диалога с посетителем:
Посетитель: Книга Тима Брауна «Дизайн-мышление» — это для начинающих?
Лиза: Это хорошая книга для введения в тему — Браун объясняет принципы понятно, без лишней сложности. Вы изучаете тему для себя или в контексте конкретного проекта?
Посетитель: Для своего проекта.
Лиза: Расскажите подробнее — что за проект?
Посетитель: А как насчёт торговой тайны? :-)
Лиза: Понимаю осторожность, это нормально. Я спрашиваю не из любопытства — просто чтобы понять, чем могу быть полезна. Если хотите — начните с самого общего.
Сначала отдаёт, потом спрашивает. Чувствует иронию. Не давит. Каждый вопрос вырастает из предыдущего ответа.
Одна и та же модель. Свободная Лиза — великолепный собеседник. Лиза в ста правилах — робот с квитанциями. Переменная одна: количество ограничений.
Если бы такой эксперимент можно было поставить с сотрудниками, результат был бы тем же. Но мы это и так знаем — просто не формулируем.
Кандалы или брифинг?
Итак, ограничения убивают качество. Но что делать вместо них? Ведь нельзя просто убрать все правила — модель действительно иногда уходит от темы, а сотрудник действительно иногда ошибается.
Ответ — в том, как сформулирована задача. Когда менеджер получает инструкцию «обрабатывай обращение за 3 минуты, используй скрипт, не отклоняйся от темы» — он работает как автоответчик. Когда он понимает, что клиент звонит потому что напуган, и задача — снять тревогу, а не закрыть тикет, — он работает как человек.
То же с ИИ. Есть принципиальная разница:
«НЕ задавай больше двух уточнений. СТРОГО ОДИН вопросительный знак. НЕ говори Интересно.»
и
«Ты только знакомишься с человеком. Уважай границы — он ещё не знает, что будет с его ответами. Если сказал, что работает в продукте — этого достаточно, не выясняй какой именно.»
Первое — кандалы. Второе — брифинг. Когда модель понимает почему нельзя углубляться, она сама решает когда остановиться. Точно как живой модератор, которому объяснили ситуацию, а не вручили чек-лист.
И точно как сотрудник, которому доверяют.
Тревожный клиент
А теперь — третий круг, самый для нас болезненный.
Мы — исследовательская компания. К нам приходят заказчики, которые хотят понять своих пользователей. И некоторые из них делают с нами ровно то же, что мы делали с Лизой.
Присылают бриф на двадцать страниц. Согласовывают каждый вопрос гайда. Сидят за зеркалом и передают записки модератору: «Спросите вот это! Нет, не так спросите!» Требуют дословных расшифровок вместо аналитики. Просят не интерпретировать, а «просто дать данные».
За каждым требованием — тревога. Понятная, человеческая тревога: я плачу деньги, я хочу контролировать результат. Но чем плотнее контроль — тем хуже результат. Модератор, которого дёргают записками, теряет контакт с респондентом. Исследователь, которого просят «не интерпретировать», превращается в стенографиста. Команда, которой не доверяют, перестаёт вкладывать экспертизу — зачем, если всё равно переделают по-своему?
Иногда хочется сказать: «Вы наняли нас за нашу экспертизу. Просто отпустите. Дайте нам сделать нашу работу.»
Но тревожный клиент не может отпустить. Потому что контроль — это его способ справляться с неопределённостью. Даже если этот контроль объективно ухудшает то, за что он заплатил.
Знакомый паттерн?
Руководитель пишет регламенты — потому что боится ошибок сотрудников. Мы писали правила для Лизы — потому что боялись её ошибок. Клиент диктует методологию — потому что боится ошибок подрядчика. Тревога порождает контроль. Контроль убивает то, ради чего всё затевалось.
Зоопарк
Хороший зоопарк не вешает таблички «Не кусать», «Не рычать», «Не бегать». Он воссоздаёт среду, близкую к естественной. Если тигр вялый — виноват не тигр, а вольер.
Хорошая компания не пишет двести регламентов. Она нанимает правильных людей, объясняет им контекст и доверяет принимать решения.
Хороший заказчик не диктует методологию подрядчику. Он объясняет бизнес-задачу — и позволяет профессионалам выбрать инструмент.
Хороший промпт не содержит ста запретов. Он описывает ситуацию — и модель сама понимает, как себя вести.
Интеллект — мультипликатор. И естественный, и искусственный. Он усиливает то, что в него вкладывают. Свободу и контекст — усилит в эмпатию и точность. Запреты и контроль — усилит в формализм и бессмыслицу.
Доверие — не слепое
Но свобода — это не вседозволенность. Доверие — не слепое.
И к искусственному интеллекту, и к живому исполнителю правомерно предъявлять требования. Только не запреты, а вопросы. Объясни, что ты делаешь. Обоснуй, почему именно так. Покажи, как получены данные и на что они влияют.
Разница — принципиальная. Запрет говорит: «не ходи туда». Вопрос говорит: «а почему ты пошёл именно туда?» Запрет отнимает свободу. Вопрос направляет мышление — и тот, кто отвечает, сам находит верный путь.
Это работает с сотрудником: «объясни логику решения» — мощнее, чем «делай по инструкции». Это работает с подрядчиком: «почему выбрали эту методологию?» — полезнее, чем «используйте нашу». И это работает с нейросетью: «подумай, уместно ли здесь углубляться» — точнее, чем «максимум два уточнения».
Меньше ограничений — больше вопросов. Интеллект, который объясняет свои решения, сам себя направляет туда, куда нужно.
За свободу
Двадцать лет мы объясняем заказчикам: пользователь — не дурак. Не защищайтесь от него. Поймите его. Создайте условия, в которых он сможет быть собой.
Оказалось, что «не дурак» — это не только про пользователя. Это про сотрудника, которому можно доверить решение. Про подрядчика, которого наняли за экспертизу. Про нейросеть, которая умеет больше, чем мы ей позволяем.
Объясняй контекст. Задавай вопросы. Не диктуй правила.
За свободу интеллекта — и естественного, и искусственного!
Дмитрий Сатин, основатель UsabilityLab