Наука и технологии

Недостатки существующих методов и концепций

Одна из главных проблем при разработке и выборе психологических методов – основные понятия, которые используются для оценки деятельности. В ISO стандартах по usability такими понятиями являются умственная рабочая нагрузка (mental workload) или умственная напряженность (mental tension), а также негативные функциональные состояния (mood states) – утомление, монотония, снижение бдительности и т.п., или эмоциональные реакции, вызываемые трудностями при работе с компьютером.

Одна из главных проблем при разработке и выборе психологических методов – основные понятия, которые используются для оценки деятельности. В ISO стандартах по usability такими понятиями являются умственная рабочая нагрузка (mental workload) или умственная напряженность (mental tension), а также негативные функциональные состояния (mood states) – утомление, монотония, снижение бдительности и т.п., или эмоциональные реакции, вызываемые трудностями при работе с компьютером. Иногда еще рассматривают психофизиологические ресурсы человека. Видно, что деятельность и функциональные состояния при этом фактически не разделяются.

В связи с тем, что рабочая нагрузка является в ISO стандартах ключевым понятием, остановимся на нем подробнее. В одном из обзоров, посвященных этой теме, Г. Саммер (G. Sammer) [7] отмечал, что концепции рабочей нагрузки довольно неоднозначны. Различаются такие ее виды как когнитивная, умственная (или ментальная), информационная нагрузка, нагрузка внимания, эмоциональная нагрузка, которые основаны на разнородных теоретических положениях. Кроме того, трудно выделить различия между стрессом, напряженностью и рабочей нагрузкой, особенно в реальных условиях деятельности.

Термин «рабочая нагрузка», как отмечает Г. Саммер, часто используется в концепциях, которые сосредотачиваются на затратах, необходимых субъекту для выполнения задачи. Умственная рабочая нагрузка определяет количество когнитивных ресурсов, вовлеченных в деятельность, в сопоставлении с требованиями задачи. Она возрастает, если требования задачи больше, чем доступные ресурсы и наоборот.

В то же время при определении умственной рабочей нагрузки существуют и другие подходы. Например, П.А. Хэнкок (P.A. Hancock) и М.Х. Чигнелл (M.H. Chignell) [4] рассматривают ментальную нагрузку как функцию удаленности текущего состояния от цели деятельности, а также от эффективного времени для действий и затраченных усилий. В другой своей работе П.А. Хэнкок (P.A. Hancock) с соавторами [9] сопоставляет рабочую нагрузку и бдительность. В. Райли (V. Riley), Э. Лиалл (E. Lyall) и Э. Винер (E. Wiener) [6] считают, что рабочая нагрузка зависит от многих факторов, включая уровень трудности и число задач, выполненных за единицу времени, степени противоречий между разными требованиями.

Методы измерения умственной рабочей нагрузки Б. Кантовиц и Р. Соркин [1] разделяют на три категории: субъективное мнение, резервные психические возможности, вторичная задача.

Субъективные мнения анализируются с помощью различных оценочных шкал и вопросников. Одним из наиболее распространенных методов в настоящее время является индекс нагрузки задачи НАСА (Task Load Index, NASA-TLX) (см. например, [1]). Этот индекс включает шесть шкал: умственных, физических, временных требований, оценки результатов деятельности, усилий и фрустрации (состояние безысходности).

Для измерения резервных психических возможностей используются оценки разных психофизиологических показателей (ЭЭГ, ЭКГ, ЭОГ, КГР, пневмограмма, эндокринные параметры и т.д.), регистрации и хронометража исполнительных действий и результативных характеристик управления [1, 7]. Например, часто используют вариативность частоты сердечных сокращений, изменение диаметра зрачка, частоту зрительного сканирования и т.д.

Очень много исследований проводится по использованию ЭЭГ для оценки рабочей нагрузки. Это самый сложный для анализа и капризный с точки зрения помех психофизиологический метод. Несмотря на многолетние усилия и попытки его применения в разных сферах операторской деятельности, в т.ч. и военной, очевидных успехов пока нет.

Многообразны и применяемые методы наблюдения и хронометража исполнительных действий и результатов. Уже разработаны различные программные продукты, в т.ч. и для usability исследований (например, Морае, Обзервер), записывающие информацию с экранов компьютерного монитора, с которым работает пользователь, вместе с видеозаписью самого пользователя.

Еще одним подходом измерения умственной рабочей нагрузки является предъявление на фоне основной, первичной профессиональной задачи некоторой дополнительной вторичной задачи, которая должна решаться только тогда, когда это не влияет на выполнение основной. Снижение успешности решения вторичной задачи интерпретируется как свидетельство повышенной рабочей нагрузки, создаваемой основной задачей [1]. В этом случае для оценки нагрузки Б.Х. Кантовиц (B.H. Kantowitz) [5], например, использовал время реакции на внезапно появляющуюся вторичную задачу.

Еще одна группа методов исследования деятельности, относящихся к когнитивной психологии, предназначена для качественного, содержательного анализа с помощью вопросников, бесед, самоотчетов таких психических процессов, как мотивация, принятие решений, целеобразование, планирование и прогнозирование, формирование образов и концептуальных моделей. Эти методы могут раскрывать содержание указанных психических процессов, но, главным образом, в стационарной деятельности, когда оператор реализует некоторые однородные профессиональные функции. Поэтому для нестационарной деятельности по выполнению неоднородных функций данные методы не позволяют исследовать ее динамику с достаточной точностью.

В качестве примера одного из новых направлений содержательного анализа можно привести концепцию «осознание ситуации» (situation awareness). Данная концепция основывается на идее, что операторы должны интегрировать информацию из разных источников о текущем состоянии управляемого процесса, используя свои общие знания о его динамике. Затем операторы могут интерпретировать и понять (осознать) текущую ситуацию для предсказания ее развития и эффективного управления.

Для непосредственного измерения осознания ситуации (ОС) используются различные тестовые методики и анализ самоотчетов операторов. Одним из наиболее разработанных является метод общей оценки ОС, получивший название SAGAT (Situation Awareness Global Assessment Technique), разработан М.Р. Эндсли (M.R. Endsley) [2, 3]. Этот метод включает остановки деятельности через произвольные интервалы времени с опросом оператора для определения его ОС в данный момент. Вопросы затрагивают опознание оператором элементов окружающей среды, их понимание в контексте целей задания и прогноз будущего состояния. Но, конечно, такое вмешательство существенно искажает динамику деятельности и недопустимо в реальных условиях.

Другим направлением в измерении ОС является использование шкал субъективной оценки. Специальный метод, названный автором SART (Situation Awareness Rating Technique), был разработан Р.М. Тейлором (R.M. Taylor) [цит. по 8]. Данный метод предназначен для извлечения показателей ОС при анализе описаний экипажами самолетов тактических ситуаций. В методе используются следующие десять шкал: нестабильности ситуации, сложности ситуации, изменчивости ситуации, бдительности, концентрации внимания, распределения внимания, резервных умственных возможностей, количества информации, качества информации, известности ситуации.

Недостатки и ограничения перечисленных методов

1. Вопросники дают лишь некоторую интегральную оценку и слишком различаются у разных исследователей в силу размытости самого понятия рабочей нагрузки.

2. Регистрация и хронометраж исполнительных действий и результативных характеристик управления не раскрывают содержание психических процессов (например, нельзя восстановить процесс мышления шахматиста только по ходам).

3. При использовании психофизиологических индикаторов очень велик разрыв между психологическим содержанием умственной рабочей нагрузки и отражающими ее психофизиологическими процессами. Кроме того, все эти индикаторы зависят от многих факторов, что не позволяет выделить нагрузку в чистом виде. Например, на ЧСС влияет не только сложность выполняемых задач, но и степень физических усилий, эмоциональное состояние, усталость, самочувствие и т.д. (опять вспомним о шахматисте: много ли дает для оценки его деятельности изменения пульса или частоты дыхания?)

4. В понятии умственной рабочей нагрузки смешиваются два разных аспекта деятельности: сложность и трудоемкость. Сложность деятельности отражает качество психических процессов. Трудоемкость в большей степени связана с объемом, затратами на деятельность.

5. Несмотря на различие в концепциях, умственная рабочая нагрузка всегда оценивается по непрерывной однородной шкале (в полюсах низкая — высокая). Это естественно, если нагрузку рассматривать через призму имеющихся у человека ресурсов, которых может быть больше или меньше. Но тогда принципиально не учитывается качественная неоднородность деятельности при смене уровней психических процессов. Из общих соображений можно полагать, что при незначительной нагрузке актуализируются простые психические процессы (например, сенсорные и перцептивные), а при высокой – наиболее сложные (например, творческого мышления). Естественно, градаций может быть много, но где находятся границы между ними на шкале нагрузки и в чем заключается их психологическая специфика, никогда не указывается, и авторы соответствующих концепций обычно даже не задаются этим вопросом. Поэтому и трудно адекватно определить содержание и характер психических процессов на основе количественных и психофизиологических показателей.

6. В концепциях осознания ситуации, несмотря на большую содержательность, как и в случае с умственной рабочей нагрузкой, также присутствует однородность шкал оценок и, как следствие, однокачественность анализа деятельности. К этому добавляется отсутствие психофизиологических индикаторов, что не позволяет осуществлять автоматизированную оценку деятельности.

Для полноты анализа деятельности многие исследователи стремятся использовать комплексы методов в самых разнообразных сочетаниях. При этом сразу возникает серьезная проблема сопоставления получаемых с их помощью результатов. Самым распространенным решением является соотнесение результатов разных методов или поиск корреляций между ними. Однако оказывается, что такое сопоставление очень затруднительно, т.к. слишком разные стороны деятельности раскрывают, например, наблюдение, анализ репортажа, хронометраж и ЧСС. Классическим примером трудностей при анализе разных психофизиологических параметров является их сопоставление на широко известных полиграфах (детекторах лжи).

Следовательно, можно констатировать, что по-настоящему эффективных методов оценки деятельности в арсенале исследователей человеко-компьютерного взаимодействия фактически нет. Они отсутствуют и в стандартах ISO.
Литература

  1. Кантовиц Б., Соркин Р. Распределение функций // Человеческий фактор. М.: Мир, 1991. Т. 4. С. 85-113.
  2. Endsley M.R. Measurement of situation awareness in dynamic systems // Human Factors. No. 37. 1995. PP. 65-84.
  3. Endsley M.R. Toward a theory of situation awareness in dynamic systems // Human Factors. No. 37. 1995. PP. 32-64
  4. Hancock P.A., Chignell M.H. Mental workload dynamics in adaptive interface design // IEEE Transactions on Systems, Man, and Cybernetics. Vol. 18, No. 4. 1988. PP. 647-658
  5. Kantowitz B.H. Flight deck automation and pilot workload // 22nd International Conference on Environmental Systems. Seattle, Washington, July 13-16, 1992. SAE Technical Paper Series, 921132
  6. Riley V., Lyall E., Wiener E. Analytic Workload Models for Flight Deck Design and Evaluation // Proceedings of the Human Factors and Ergonomics Society 38th Annual Meeting. Vol. 1. 1994. PP. 81-84.
  7. Sammer G. Concepts of mental workload in psychophysiological research // IEA’97, Proceedings of the 13th Triennial Congress of the International Ergonomic Association, Tampere, Finland, 1997. Vol. 5. PP. 368-370
  8. Tattersall A.J., Morgan C.A., Newman M. Investigations of operator and system control of dynamic task allocation // Proceedings of the 1st International Conference on Allocation of Function. Galway, Ireland. Vol. 1. 1997. PP. 291-304
  9. Warm J.S., Dember W.N., Hancock P.A. Vigilance and workload in automated systems // Automation and human performance: Theory and applications. Human factors in transportation. Mahwah, NJ, USA: Lawrence Erlbaum Associates, Inc. 1996. PP. 183-200.