Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Критерии качества и методы оценки




Лукиной Татьяны Михайловны

Научный руководитель

к.ф.-м.н. Конушин Антон Сергеевич

Москва, 2011

Алгоритм классификации человека по фотографии лица

Татьяна Лукина

Данная дипломная работа посвящена автоматической классификации людей по фотографиям лиц. В настоящее время существует множество методов, довольно успешно справляющихся с этой задачей, но они классифицируют все атрибуты (пол, возраст, наличие очков, усов или бороды) по отдельности. В действительности же эти атрибуты влияют друг на друга. В данной работе предложен алгоритм, позволяющий автоматически учитывать взаимосвязи различных атрибутов и за счет этого повышающий точность классификации.

Содержание

1 Введение. 4

2 Постановка задачи. 6

2.1 Формальная постановка задачи. 6

2.2 Критерии качества и методы оценки. 6

2.3 Цели дипломной работы.. 7

3 Обзор существующих методов. 8

3.1 Предобработка фотографий. 8

3.2 Признаки. 8

3.3 Методы обучения. 10

3.4 Выводы.. 11

4 Предложенный метод. 12

4.1 Предобработка фотографий. 12

4.2 BIF. 13

4.3 Рандомизированные решающие деревья. 14

5 Экспериментальные результаты.. 16

6 Описание практической части. 19

7 Заключение. 20

8 Литература. 21

 


Введение

В последнее время быстрое развитие компьютерной техники позволяет решать всё новые и новые сложные задачи за приемлемое для практического применения время. Всё более широкое распространение получают миниатюрные фото- и видеокамеры, которые располагаются повсюду – от систем видеонаблюдения до телефонов в руках обычных людей. Накапливается огромное количество информации, которую невозможно проанализировать вручную. Тут на помощь приходят методы компьютерного зрения, позволяющие извлекать информацию из изображений и видео.

Одним из основных объектов интереса на фото- и видеоматериалах является человек. Большое количество информации о человеке можно узнать по лицу: пол, примерный возраст, эмоциональное состояние и т.п. Автоматическая система, позволяющая получать информацию о людях по фотографиям лиц, могла бы найти много практических применений.

Одно из таких практических приложений – «умный» интерфейс взаимодействия человека и компьютера. Используя характеристики пользователя, полученные по его фотографии, заснятой с помощью встроенной камеры, компьютер сможет подстроить интерфейс так, чтобы взаимодействие было более удобным для человека. Например, можно увеличить размер шрифта для пожилого человека в очках, использовать больше картинок вместо слов для ребенка или вывести на первый план ту информацию, которую чаще всего запрашивают люди из определенной социальной группы. Такой интерфейс очень хорошо подходит для общественно доступных компьютеров типа информационных терминалов.

Автоматическая классификация людей была бы очень полезна маркетологам, позволяя собирать статистику о том, какие люди больше всего интересовались данным товаром или смотрели о нем рекламу. Возможен и обратный сценарий – «умный» рекламный экран, который показывает разные рекламные ролики в зависимости от того, кто на него смотрит.

Системы видеонаблюдения также можно усовершенствовать, используя автоматический классификатор людей. Сейчас, чтобы найти какого-то человека на видеозаписи по приметам, приходится просматривать огромные объемы видео, что отнимает много времени. Система со встроенным модулем автоматической классификации позволила бы составлять поисковые запросы с приметами человека и осуществлять поиск гораздо быстрее.

Автоматическая классификация людей по лицу может использоваться и для решения других задач компьютерного зрения, например, в задаче верификации людей, то есть проверки, изображен ли на двух фотографиях один и тот же человек. Авторы статьи [1] предлагают следующий подход: результаты классификации людей по большому числу признаков (пол, возраст, цвет волос, форма лица, наличие очков, усов, улыбки и т.п.) подаются на вход алгоритму верификации в качестве вектора признаков.

Постановка задачи

Формальная постановка задачи

Требуется разработать алгоритм, который бы по фотографии лица человека определял его принадлежность к различным классам. Назовем атрибутами человека такие признаки, как пол, возраст, наличие усов или бороды и тому подобные. Тогда формальная задача для алгоритма будет выглядеть следующим образом:

· Входные данные:

o Фотография лица человека

o Координаты зрачков на фотографии

· Выход алгоритма:

o Набор значений атрибутов

Фотографии, подаваемые на вход, могут быть как цветными, так и черно-белыми. Предполагается, что лица на фотографиях будут расположены фронтально, но небольшие отклонения допустимы. Координаты зрачков получаются предварительно либо с использованием ручной разметки, либо некоторым автоматическим методом.

Для разрабатываемого алгоритма предлагается использование метода машинного обучения, поэтому на этапе обучения на вход дополнительно потребуется база размеченных фотографий лиц, для которых известны значения атрибутов.

Критерии качества и методы оценки

Критерием качества алгоритма классификации людей по фотографиям лиц является процент правильно классифицированных людей из тестовой выборки, т.е. процент людей, для которых значение атрибута, предсказанное алгоритмом, совпало с истинным. Этот процент вычисляется отдельно для каждого атрибута. Дополнительным критерием, позволяющим более точно оценить качество работы алгоритма в случае существенного неравенства классов по объему, является процент правильно классифицированных людей, принадлежащих определенному классу. Например, для атрибута «пол» и класса «женщины» этот критерий вычисляется следующим образом:

, (1)

где - количество женщин в тестовой выборке, для которых алгоритм правильно определил значение атрибута «пол», - количество всех женщин в тестовой выборке.

Для оценки качества работы алгоритма используется метод скользящего контроля. Вся база фотографий разбивается на несколько частей, процесс тестирования происходит в несколько шагов, число которых равно числу частей. На каждом шаге одна часть базы используется в качестве тестовой выборки, а все остальные – в качестве обучающей. Следует отметить, что в базе могут присутствовать несколько различных фотографий одного и того же человека. В этом случае разбиение базы производится таким образом, чтобы все фотографии одного человека попали в одну и ту же часть. Такой способ позволяет оценивать способность алгоритма классифицировать атрибуты, а не запоминать индивидуальные особенности лица конкретного человека.

Цели дипломной работы

Целями данной дипломной работы являются:

· Проведение обзора существующих алгоритмов классификации людей по фотографии лица и выявление их недостатков

· Разработка и реализация собственного алгоритма классификации, лишенного некоторых найденных по итогам обзора недостатков

· Тестирование и оценка качества работы разработанного алгоритма

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...