GOMS: первая модель взаимодействия человека с компьютером (1983)

Что произошло

Пало-Альто, Калифорния, исследовательский центр Xerox PARC — место, где в начале 1970-х были изобретены графический интерфейс, компьютерная мышь в её рабочей форме, лазерный принтер и сеть Ethernet. К началу 1980-х PARC стал легендой — и это создавало парадоксальную ситуацию: компания Xerox не умела превращать изобретения своей лаборатории в продукты, зато исследователи PARC могли заниматься фундаментальной наукой с невиданной свободой.

Трое из них решили ответить на вопрос, который казался невозможным: можно ли предсказать, сколько времени займёт выполнение задачи на компьютере, не проводя эксперимент?

Стюарт Кард — экспериментальный психолог, пришедший в PARC после защиты диссертации в Carnegie Mellon University. Томас Моран — специалист по когнитивной науке, сотрудник PARC с 1974 года. Аллен Ньюэлл — профессор Carnegie Mellon, один из основателей искусственного интеллекта, соавтор (вместе с Гербертом Саймоном) программ Logic Theorist и General Problem Solver. Ньюэлл не работал в PARC постоянно, но был наставником Карда и ключевым теоретиком проекта.

В 1983 году они опубликовали книгу «The Psychology of Human-Computer Interaction» — 469 страниц текста, формул, диаграмм и экспериментальных данных. Книга предлагала совершенно новый взгляд на человека за компьютером: не как на объект субъективных впечатлений и предпочтений, а как на информационную систему, поведение которой можно описать математически и предсказать количественно.

Центральная идея книги — модель GOMS: Goals, Operators, Methods, Selection Rules.

Goals — цели. У пользователя есть задача: «отредактировать слово в тексте», «скопировать файл», «отправить письмо». Цель может быть иерархической: крупная задача разбивается на подзадачи.

Operators — операторы. Элементарные действия, которые пользователь выполняет: нажать клавишу, переместить руку к мыши, щёлкнуть кнопкой, прочитать надпись на экране, вспомнить команду. Каждый оператор имеет измеримую длительность.

Methods — методы. Последовательности операторов для достижения цели. Чтобы удалить слово в текстовом редакторе, пользователь может: (a) выделить слово мышью и нажать Delete, или (b) поставить курсор перед словом и нажать Delete пять раз, или (c) использовать команду поиска и замены. Три метода — одна цель.

Selection Rules — правила выбора. Когда доступно несколько методов, по какому принципу пользователь выбирает? Опытный пользователь применяет быстрый метод. Новичок — тот, который помнит. Правила выбора зависят от навыка, контекста и привычки.

Самой практичной частью книги стала Keystroke-Level Model (KLM) — упрощённая версия GOMS. KLM разлагала задачу на шесть типов элементарных операций, каждой из которых было присвоено эмпирическое среднее время:

  • K (keystroke) — нажатие клавиши: ~0,2 с для опытного машиниста
  • P (pointing) — наведение курсора мыши на цель: ~1,1 с (по закону Фиттса)
  • H (homing) — перемещение руки между клавиатурой и мышью: ~0,4 с
  • M (mental) — мысленная подготовка к действию: ~1,35 с
  • R (response) — ожидание отклика системы: зависит от системы

Чтобы предсказать время выполнения задачи, достаточно разложить её на последовательность KPHMR и просуммировать. Результат — оценка в секундах, совпадающая с экспериментальными данными с точностью до 20%.

Контекст эпохи

Авторы GOMS стояли на плечах тех, кого они щедро цитировали. Связь была прямой и задокументированной.

Фредерик Тейлор и Фрэнк Гилбрет в начале XX века разложили физический труд на элементарные движения (терблиги) и засекли время каждого. GOMS делала то же самое с когнитивным трудом за компьютером: разложила работу на элементарные операции и засекла время каждой. KLM — это буквально хронометраж по Тейлору, применённый к клавиатуре.

Закон Фиттса дал KLM формулу для оператора P (наведение курсора). Время наведения мыши на объект зависит от расстояния до объекта и его размера — именно так, как предсказал Пол Фиттс в 1954 году. Кард, Моран и Ньюэлл не просто процитировали Фиттса — они экспериментально подтвердили его формулу для компьютерной мыши и встроили её в свою модель.

Закон Хика — время выбора из N альтернатив пропорционально log₂(N) — был встроен в GOMS через оператор M (мысленная подготовка) и правила выбора. Когда пользователь решает, какой метод применить, он тратит время, описываемое законом Хика.

Книга Карда, Морана и Ньюэлла вышла в момент, когда персональные компьютеры переходили от командной строки к графическому интерфейсу. Apple Lisa появилась в январе 1983 года — первый коммерческий компьютер с GUI. Macintosh выйдет через год. Вопрос «какой интерфейс лучше — текстовый или графический?» был не академическим — от ответа зависели миллиарды долларов инвестиций. GOMS давала инструмент для количественного сравнения: разложить одну и ту же задачу на операторы в двух интерфейсах, подсчитать время, сравнить цифры.

Именно Кард провёл в PARC одно из первых количественных сравнений устройств ввода: мышь, трекбол, джойстик, клавиши-стрелки. Его эксперименты показали, что мышь — самое быстрое и точное устройство для наведения на экранные объекты. Эти данные повлияли на решение Apple сделать мышь центральным устройством ввода Macintosh.

Значение для UX

GOMS стала первой попыткой превратить проектирование интерфейсов из искусства в инженерную дисциплину. До GOMS вопрос «какой дизайн лучше?» решался субъективно: мнением эксперта, голосованием в команде, интуицией дизайнера. После GOMS появился хотя бы один объективный критерий: время выполнения задачи, которое можно вычислить на бумаге.

Сравнение интерфейсов без пользователей. KLM позволяет сравнить два варианта дизайна, не проводя эксперимент. Достаточно разложить типичную задачу на операторы в каждом варианте и подсчитать суммарное время. Если вариант А требует 15 секунд, а вариант Б — 22 секунды, выбор очевиден. Это не заменяет юзабилити-тестирование, но позволяет отсеять заведомо проигрышные решения до тестирования.

Язык для обсуждения и обоснования. GOMS дала UX-специалистам точный язык. Вместо «этот интерфейс кажется неуклюжим» — «этот сценарий требует четыре переключения между клавиатурой и мышью (4H = 1,6 секунды потерь)». Горячая клавиша (K = 0,2 с) против наведения мыши на пункт меню (P + K = 1,3 с) экономит более секунды на каждую операцию. При 50 операциях в день — минута. При 250 рабочих днях — 4 часа в год. На тысячу пользователей — 4000 часов.

Предшественник предиктивных UX-метрик. Современные инструменты предсказания юзабилити — от моделей прогнозирования времени до ИИ-анализа макетов — концептуально восходят к GOMS. Идея о том, что качество интерфейса можно вычислить, а не только измерить, родилась в книге 1983 года.

Однако GOMS имеет фундаментальное ограничение, о котором сами авторы писали честно: модель описывает идеального пользователя. Человека, который не ошибается, не отвлекается, не забывает команды, не учится и не устаёт. В реальности такого пользователя не существует. GOMS предсказывает нижнюю границу времени — теоретический минимум для эксперта. Новичок будет работать значительно медленнее: ему нужно вспоминать команды, исправлять ошибки, искать нужные пункты меню.

Эта критика не обесценивает GOMS — она определяет область её применимости. Модель лучше всего работает для рутинных задач опытных пользователей: операторов call-центров, бухгалтеров, диспетчеров, кассиров — всех, кто выполняет одни и те же операции сотни раз в день. Для таких сценариев экономия 0,5 секунды на операцию — реальная бизнес-ценность.

Связанные статьи

Модель GOMS опирается на фундаментальные законы и вписывается в историю UX:

  • Закон Фиттса — формула Фиттса определяет время оператора P (наведение курсора) в модели KLM. GOMS буквально построена на законе Фиттса как на одном из кирпичей.
  • Закон Хика — время выбора из альтернатив, описанное Хиком, определяет когнитивную составляющую GOMS: сколько времени пользователь тратит на решение, какой метод применить.
  • Что такое юзабилити — продуктивность (время выполнения задачи) — одна из трёх метрик юзабилити по стандарту ISO 9241-11. GOMS предсказывает именно эту метрику.
  • Что такое UX — GOMS покрывает лишь один аспект UX — производительность. Удовлетворённость, эмоции, эстетика остаются за рамками модели.

Из других статей серии «История UX»:

  • Тейлор и Гилбреты: научная организация труда (1911) — хронометраж движений рабочего, изобретённый Тейлором и Гилбретами, — прямой предшественник KLM. GOMS перенесла идею хронометража из цеха в офис, с лопаты на клавиатуру.
  • Закон Фиттса (1954) — Кард, Моран и Ньюэлл экспериментально подтвердили закон Фиттса для компьютерной мыши и встроили его формулу в свою модель.
  • Закон Хика (1952) — информационно-теоретический подход Хика к скорости принятия решений стал одной из теоретических основ GOMS.

Вопросы и ответы

Что такое GOMS и как расшифровывается аббревиатура?

GOMS — модель взаимодействия человека с компьютером, описывающая выполнение задачи через четыре компонента: Goals (цели пользователя), Operators (элементарные действия — нажатие клавиши, перемещение мыши), Methods (последовательности действий для достижения цели) и Selection Rules (правила выбора метода, когда их несколько). Модель предложена Стюартом Кардом, Томасом Мораном и Алленом Ньюэллом в книге 1983 года «The Psychology of Human-Computer Interaction».

Что такое Keystroke-Level Model и чем она отличается от GOMS?

Keystroke-Level Model (KLM) — упрощённая версия GOMS, позволяющая предсказать время выполнения задачи по сумме элементарных операций: нажатие клавиши (K), наведение курсора (P), переключение внимания с экрана на клавиатуру (H), мысленная подготовка (M) и отклик системы (R). Каждой операции присвоено эмпирическое среднее время. KLM не требует глубокого анализа когнитивных процессов — достаточно разложить задачу на физические действия и подставить значения в формулу.

Какие ограничения у модели GOMS?

GOMS моделирует поведение опытного пользователя, выполняющего задачу без ошибок. Она не учитывает процесс обучения, ошибки и их исправление, усталость, мотивацию, эмоции и контекст использования. В реальности пользователи ошибаются, отвлекаются и решают задачи неоптимальным способом. GOMS описывает теоретический минимум времени — нижнюю границу, к которой стремится производительность по мере обретения навыка.