Статьи

Анатолий Костин. О регистрации движений глаз

После конференции UserExperience Russia 2007 стало ясно — в Россию приходят технологии eye tracking. В связи с этим корреспондент ЮБ задал несколько вопросов ведущему научному сотруднику Института психологии РАН и научному руководителю UsabilityLab – Анатолию Костину.

Анатолий Костин. О регистрации движений глаз


После конференции UserExperience Russia 2007 стало ясно — в Россию приходят технологии eye tracking. В связи с этим корреспондент ЮБ задал несколько вопросов ведущему научному сотруднику Института психологии РАН и научному руководителю UsabilityLab Анатолию Костину.


Итак, что же такое eye tracking и как это работает?


– Eye tracking – это система регистрации движения глаз, которую еще иначе называют видеоокулографией, и бывает она двух типов. Первый тип – это так называемые «носимые» системы, которые надеваются на голову в виде больших очков или специальных оптических устройств. На голове человека монтируется некая система – видеокамера, направленная вперед, фиксирует обстановку перед ним, глаз подсвечивается слабым или инфракрасным источником света, отраженный от глаз блик образует световую метку, которая через оптические световоды микшируется в видеосигнал от камеры.


Так можно проследить, куда в тот или иной момент направлен взгляд и как он перемещается по внешней обстановке. Такая видеоокулография развивается с 1970-х годов. Первыми видеоокулографические устройства начали делать японцы для анализа деятельности операторов сложных технических систем, летчиков, водителей и проч. При этом чуть раньше даже использовали не видео, а простую киносъемку (в том числе и наши авиационные психологи).

Системы второго типа появились около 10 лет назад. Это дистанционные системы, такие как Tobii, в которых видеокамеры стоят под монитором или располагаются автономно. При этом используются разные принципы регистрации движения глаз. В первом варианте одна камера следит за головой, вторая направлена на глаза, а программа распознавания определяет движения того и другого, которые затем складываются. Во втором вариант, как в системе Tobii, используется инфракрасная подсветка глаз, световой блик от которых фиксируется видеокамерами и таким образом устанавливается та точка, куда смотрит человек.


 


Есть ли отечественный аналог у этой технологии?


– Отечественных аналогов систем видеоокулографии нет. Но дело в том, что это не единственный метод регистрации движений глаз, да и появился он относительно недавно. С 1930-х годов использовался так называемый оптический метод, когда прямо на глаз человека присоской крепилось маленькое зеркальце, отраженный блик от которого фиксировался на фотобумаге. В начале 1960-х годов наш соотечественник А.Л. Ярбус с помощью этого метода провел исследования движения глаз при рассматривании человеком различных картин, результаты которых стали классическими и вошли во многие книги, учебники, научно-популярную литературу. Наиболее распространенным примером этих результатов является профиль египетской царицы Нефертити, с которым совмещены траектории движения взгляда при его осмотре.



Это метод очень точный, но дискомфортный. Прикрепленное на глаз инородное тело, естественно,  очень мешает.


Есть и другие методы регистрации движений глаз, один из которых используем и мы в своих исследованиях – это электроокулография, сокращенно ЭОГ. Суть его в том, что глаз человека, который можно рассматривать как оптический прибор, с помощью которого мы видим, имеет интересную особенность уже электрического характера. Заключается она в том, что роговица, т.е. передняя часть глаза всегда имеет положительный заряд, а сетчатка – отрицательный. Получается, что глаз – это электрический диполь, и тогда, согласно учебнику физики за 6-ой класс, поворот глаз сопровождается поворотом зарядов, который вызывает изменение разности потенциалов в окрестности глаз. При этом изменение потенциала пропорционально углу поворота глаза. Следовательно, если с помощью обычного лейкопластыря на лице человека закрепить несколько электродов и подсоединить их к усилителю, то можно совершенно спокойно регистрировать движения глаз.


Эта технология уже вышла на рынок? В каких проектах она обычно используется?

– Как я уже сказал, электроокулография – это более старая технология, чем видеоокулография, ее традиционно используют в психологических исследованиях. Мы в своих инженерно-психологических исследованиях используем данный метод более 20 лет. Поэтому одна из наших задач в UsabilityLab – реализация электроокулографии на новом аппаратном и программном уровне и применение ее для юзабилити тестирований.


Итак, существует несколько методов регистрации движений глаз. Какие между ними различия?


По сути, они отличаются точностью, комфортностью и подходами к анализу движений глаз. В методах видео- и электроокулографии точность примерно одинакова и находится в районе 0.5– 1 угловых градуса. Комфортность видеоокулографии, конечно, выше, но зато она накладывает ограничения на перемещения и повороты головы, от которых свободна электроокулография.


С точки зрения методической или теоретической видеоокулография основывается на выделении зрительных маршрутов, т.е. анализе перемещения взгляда по какому-то объекту или экрану монитора. Дальше идет некоторый статистический или фактурный анализ этих движений:  оценивается время и частота фиксаций взгляда на различных объектах или выделяются зоны внимания, так называемые hot spots – тепловые пятна, интенсивность окраски которых соответствует относительному времени фиксаций на тех или иных областях монитора.


Известно, что eye tracking успешно применяется по всему миру, а есть ли у этой технологии слабые стороны?


– Дело в том, что эта технология, когда ее применяют к анализу деятельности,  базируется на таком достаточно понятном положении, что процессы мышления человека связаны с направлением его взгляда. Т.е. если человек смотрит на какой-то объект, то его мыслительные процессы, внимание связаны именно с этим объектом. И анализируя зрительные маршруты, мы можем в определенной степени судить о происходящих мыслительных процессах. На самом деле это не всегда так. Почему? Когда человек занимается достаточно простой деятельностью, связанной, скажем, с рассматриванием объектов или картинок, такая непосредственная связь действительно существует. Но как только человек сталкивается с какими-то существенными трудностями, он начинает абстрагироваться от внешней информации, от ситуации. Дело в том, что если человек, восприняв некоторую ситуацию и столкнувшись с трудностями в ее понимании, получит еще одну порцию информации, то она просто-напросто станет помехой его мыслительным процессам. Соответственно возникают такие всем известные эффекты как эффект погружения в себя, эффект отрешения от окружающей обстановки, эффект пустого взора и т.д., которые можно выразить словами «смотрит, но не видит». Тогда анализ направления взгляда теряет всякий смысл. Именно поэтому наш подход к использованию движений глаз для анализа деятельности базируется на совершенно других положениях.

Расскажите подробнее об этом подходе.


– Подробное его описание есть у нас на сайте. Ну, а в двух словах… Мы берем иной параметр в движениях глаз, который и используем для анализа. Дело в том, что движения глаз бывают двух типов: это медленные – дрейфовые движения, когда глаз плавно перемещается по объекту, и скачки – быстрые движения глаза или саккады.


Оказывается, что интервал между саккадами отражает сложность той деятельности, которую выполняет человек. Иначе говоря, он выражает степень тех затруднений, которые испытывает человек при решении задачи. Но тогда получается, что для оценки сложности деятельности совершенно не обязательно фиксировать перемещения взгляда. Выделяя в движениях глаз моменты возникновения саккад и оценивая межсаккадические интервалы, можно анализировать  динамику изменения сложности деятельности во времени. Например, выделить участки относительно простой деятельности, когда у человека не возникает заметных трудностей, участки, когда трудности достаточно существенны, ну и участки, когда они очень велики. Далее мы применяем анализ проблемностей, т.е. выясняем содержание и причины тех неопределенностей, неоднозначностей и затруднений, которые возникают у человека. В итоге мы имеем динамику сложности деятельности, которую можно сопоставлять с происходившими событиями, действиями человека и с теми задачами, которые он решал.


Что удобно? Результат получается прямо в ходе тестирования, в реальном масштабе времени, тем самым у модератора есть возможность сразу увидеть, что человек столкнулся с серьезными трудностями, хотя внешне это может быть незаметно. Соответственно модератор может обратить на это внимания прямо в ходе эксперимента, а после окончания тестирования выяснить с помощью уточняющих вопросов причины и характер затруднений. Такой подход полярен классическому eye tracking, т.к. вместо того, чтобы анализировать, как глаз гуляет по экрану и каким-то образом сопоставлять это с мыслительной деятельностью, мы четко оцениваем степень тех сложностей, с которыми сталкивается человек.


Что произойдет, если для тестирования использовать как eye tracking, так и метод анализа межсакаддических интервалов?


– Если говорить о комбинировании этих двух методов, то, с одной стороны, используя классический eye tracking, можно рассчитывать на уточнение каких-то визуальных форм, структуры представления информации и т.п., а использование межсаккадических интервалов обеспечивает точность результатов по оценке сложности и степени затруднений, с которыми сталкивается человек.

Классический вопрос тестирования, которым заканчивается каждая сессия: «Какие у Вас были трудности в процессе выполнения задачи?» В этот момент человек пытается отрефлексировать, осознать те затруднения, которые у него были. Если, конечно же, он их запомнил, не старается скрыть и т.д. Если мы используем метод, основанный на анализе межсаккадических интервалов, то качественный анализ  дополняется количественным, имеющим при этом высокую точность. Кроме того, такой метод позволяет оценить те затруднения, которые невозможно выявить с помощью обычного наблюдения. Соответственно вы лучше видите тонкие места, требующие изменения.


Т.е. мы понимаем, где пользователь сталкивался с проблемами, насколько сложными они были, и результаты не зависят от самого пользователя?


– Совершенно верно.