Технология распознавания лиц — новая эра в видеоаналитике, системах видеонаблюдения и контроля доступа. Против технологии распознавания лиц

21.08.2019

Колонка

Она ставит под угрозу безопасность и гражданские права человека, поэтому частичное её регулирование должно быть заменено полным запретом. Пока весь мир увлечён преимуществами технологии распознавания лиц, некоторые специалисты по безопасности считают, что она таит в себе большое зло для человечества. Преподаватель права и информатики Вудроу Хартцог и преподаватель философии Эван Селинджер изложили свою точку зрения на методы контроля технологии в статье на Medium.

Жители Трои были бы в восторге

Очень легко поддаться внешне заманчивому, но в действительности ошибочному мнению о том, каким будет будущее человечества в мире, раскрывшем весь скрытый потенциал технологии распознавания лиц. Люди смогут мгновенно получать информацию о незнакомцах, им больше не придётся запоминать массу паролей или бояться забыть кошелёк. Можно будет запросто находить события с определённым человеком в архивах фотографий и видео, оперативно разыскивать пропавших людей или преступников, сделать безопасными общественные места.

Казалось бы, технология несёт одни только плюсы, в мире воцарится абсолютная справедливость, реализуются самые невероятные идеи человечества. Но ни один из изобретённых человечеством механизмов наблюдения не несёт в себе такой опасности, как технология распознавания лиц.

Соблазняясь этим утопическим видением, люди будут впускать технологию распознавания лиц в своё жилище и открывать доступ к своим устройствам, позволяя ей занять центральное место во всё новых аспектах жизни. Это будет означать, что ловушка захлопнулась, а после придёт неприятное осознание того, что технология была своего рода троянским конём. Этот идеальный инструмент притеснения слишком хорош, чтобы им не воспользовались правительства для установления авторитарного контроля и всеобъемлющих режимов, которые уничтожат понятие личной жизни.

Этот троянский конь не должен проникнуть в город.

Текущие обсуждения

Американский союз защиты гражданских свобод совместно с 70 другими правозащитными организациями потребовал от Amazon прекратить предоставлять технологию распознавания лиц правительству, а также призвал Конгресс ввести мораторий на её использование правительством. К ним подключились и СМИ, выразили свою обеспокоенность. Например, редколлегия Washington Post считает , что Конгресс обязан немедленно вмешаться в ситуацию. У парламентариев тоже есть веский повод задуматься: некоторых из них программа по распознаванию лиц Amazon с преступниками.

Не остались в стороне и редакторы The Guardian. Президент Microsoft Брэд Смит обратился в своём блоге к правительству США с просьбой ввести регулирование технологии распознавания лиц:

«Единственный надёжный способ контролировать использование технологии правительством - это чтобы оно самостоятельно и с учётом возможных обстоятельств контролировало её использование. Мы считаем, что сегодня существует острая необходимость в правительственной инициативе по контролю за правомерным применением технологии распознавания лиц, основанной на решении двухпартийной комиссии экспертов»

Мнение лидеров компаний имеет немаловажное значение, как и законодательные акты, ограничивающие использование технологии. Но лишь частичной поддержки и тщательно прописанных инструкций никогда не будет достаточно. Законы могли бы принести большую пользу, но их, скорее всего, начнут вводить тогда, когда технология станет в разы дешевле и проще в использовании. Смит подчёркивает, что Microsoft призывала к созданию национального закона в этой области ещё в 2005 году. Прошло более десяти лет, но подобный закон Конгресс так и не принял.

Если технологию распознавания лиц продолжат разрабатывать и внедрять в жизни, возникнет гигантская инфраструктура, которая поглотит человечество. Как показывает история, широкое внимание к успехам, страх не обеспечить должного уровня безопасности и пьянящее чувство власти могут приводить к обману, сдвигу корпоративных ценностей и в конечном счёте систематическом злоупотреблению технологией.

Благополучие человечества в будущем возможно только в том случае, если технология распознавания лиц будет запрещена, прежде чем слишком прочно укрепится в жизни человека.

Почему нужен запрет

Необходимость полного запрета систем распознавания лиц - чрезвычайна. Но некоторые талантливые учёные, вроде Джудит Донат , считают эту позицию неверной. Они предлагают более нейтральную с технологической точки зрения тактику: запрет на конкретные действия, а также обозначение ценностей и прав, которые нужно защитить. Этот подход вполне разумен почти для всех цифровых технологий.

Но ни один из изобретённых человечеством механизмов наблюдения не несёт в себе такой опасности, как технология распознавания лиц. Это недостающий элемент уже опасной инфраструктуры наблюдения за людьми, разработанный потому, что эта инфраструктура нужна правительствам и частному бизнесу. И если технологии становятся опасными в такой степени, а соотношение пользы и вреда - настолько искажённым, пришло время задуматься о категорических запретах. На законодательном уровне уже запрещены некоторые виды опасных цифровых технологий, например шпионского ПО . Технология распознавания лиц несёт в себе гораздо большие риски, и её не мешало бы удостоить особого юридического внимания. Нужен конкретный запрет на основе надежной, целостной, основанной на ценностях и в значительной степени нейтральной с точки зрения технологий нормативной базы. Такая система поможет избежать нормативных ситуаций, когда законодатели пытаются догонять технические тенденции.

Наблюдение с использованием систем распознавания лиц по своей сути деспотично. Существование таких систем, которые сами часто скрыты от глаз человека, - нарушение гражданских свобод, потому что люди ведут себя иначе, если подозревают, что за ними наблюдают. Даже законы, которые гарантируют строгие защитные меры, не предотвратят гнетущее ощущение того, что будут ущемлены возможности самовыражения человека.

Вот примеры злоупотребления и разрушительных действий технологии распознавания лиц:

  • непропорциональное внимание к людям небелого цвета кожи , другим меньшинствам и незащищённым народам ;
  • замена презумпции невиновности на принцип «люди, чья вина пока что не доказана»;
  • распространение насилия и жестокости;
  • отрицание фундаментальных прав и возможностей, например защиты от произвольного отслеживания правительствами передвижения, привычек, отношений, интересов и мыслей человека;
  • беспрерывная «работа» закона - как постоянная мера пресечения;
  • уничтожение концепции хранения информации «practically obscure », когда данные находятся в открытом доступе, но хранятся в различных источниках и найти их чрезвычайно сложно;
  • распространение «капитализма надзора ».

Как отмечает исследователь технологии распознавания лиц Клэр Гарви, ошибки в ней могут иметь фатальные последствия:

«Что произойдёт, если подобная система даст сбой? В случае ошибки системы видеонаблюдения будут преследовать, допрашивать или могут даже арестовать и обвинить в преступлении невинного человека. Или портативные камеры с системой распознавания лиц у полицейских: если система укажет на человека, который якобы может представлять опасность для общества, полицейский должен будет мгновенно решить, применять ли ему оружие. В результате ложного оповещения могут пострадать невинные люди».

В числе прочих есть два доклада, которые подробно затрагивают многие из этих проблем: весьма ценная работа об использовании правоохранителями распознавания лиц, опубликованная старшим юристом Electronic Frontier Foundation Дженнифер Линч, а также исследование специалистов Center on Privacy & Technology университета Джорджтауна.

Несмотря на описанные в докладах проблемы, не все убеждены, что запрет действительно необходим. Ведь другие технологии представляют не меньшую угрозу: геолокационные данные, информация из профилей в соцсетях, результаты поисковых запросов и многие другие источники информации о пользователях можно использовать, чтобы составить их детальный портрет. Но распознавание лиц всё же несёт опасность иного характера и стоит особняком даже по сравнению с биометрическими данными: отпечатками пальцев, образцами ДНК или сканированием сетчатки глаза.

Системы, обрабатывающие изображения лиц, имеют пять отличительных особенностей, которые дают все основания для их запрета. Во-первых, лицо трудно скрыть или изменить. Лица нельзя зашифровать, как данные на цифровых носителях, в электронных или текстовых сообщениях. Их можно снимать с помощью удалённых камер, а стоимость самой технологии и хранения изображений в облаке постоянно снижается, что приводит к всё более широкому применению таких систем мониторинга.

Во-вторых, существуют базы данных имён и лиц, например для водительских удостоверений, или аккаунты в соцсетях, к которым можно очень легко получить доступ.

В-третьих, в отличие от типичных систем наблюдения, которые часто требуют дорогостоящее оборудование или новые источников данных, входные данные для распознавания лиц находятся повсюду и поступают непосредственно в момент съёмки камерами.

В-четвёртых, переломный момент. Любая база данных лиц для идентификации арестованных или попавших в поле зрения камер личностей с помощью нескольких строчек кода может «сравниваться» с любой другой базой в режиме реального времени, подключаясь к портативным камерам полицейских или системам видеонаблюдения. Губернатор штата Нью-Йорк Эндрю Куомо точно подметил причины распространения технологии распознавания лиц, утверждая, что простое сканирование номерных знаков автомобилей покажется мелочью по сравнению с возможностями применения камер со встроенной технологией: «Система считывает номерной знак, чтобы вычислить нарушителя, но штрафы - далеко не самая большая польза от этой аппаратуры. Мы переходим на технологию распознавания лиц, и теперь система сможет сканировать лицо водителя и проверять его по базам данных, что открывает абсолютно новые перспективы».

В-пятых, лицо, в отличие от отпечатков пальцев, походки или снимков сетчатки, - центральный элемент идентичности человека. Лицо - это посредник между виртуальной и реальной жизнью человека, связующее звено между действиями, которые человек выполняет анонимно, под своим или чужим именем. Может легко показаться, что обеспечивать конфиденциальность лиц, как любой другой частной информации, не нужно, потому что в жизни люди обычно не закрывают лица. За исключением стран, где женщины обязаны носить паранджу, люди со скрытым лицом вызывают подозрения.


Обеспечивать конфиденциальность лица человека действительно необходимо, потому что в прошлом люди вырабатывали институты и ценности, связанные с защитой частной информации в те периоды, когда опознать незнакомых людей в основном было достаточно сложно. По причине биологических особенностей память человека ограничена, и без технологической надстройки он может запомнить лишь небольшое количество лиц. А с учётом численности и распределения населения за свою жизнь человек встретит не так уж много новых людей. Эти ограничения создают своего рода «белые пятна», благодаря чему у людей были хорошие шансы затеряться в толпе.

Недавние решения Верховного суда США касательно четвёртой поправки (которая запрещает необоснованные обыски и задержания, а также требует выдачи ордеров на обыск судом при наличии достаточных оснований) свидетельствуют о том, что борьба за защиту конфиденциальности в общественных местах по-прежнему актуальна. Этим летом в одном из процессов суд решил, что геолокационные данные с мобильных телефонов подпадают под действие Конституции, а информация, которую человек желает сохранить в тайне, даже если она оказывается доступна публично, может охраняться Конституцией.

Почему технология распознавания лиц не поддаётся правовому регулированию

В связи с тем, что технология распознавания лиц представляет огромную угрозу, общество не может пустить её регулирование на самотёк. Потенциальная прибыльность подтолкнёт к появлению идей по реализации максимальных возможностей технологии, и отдельные компании будут продвигать свои интересы в этом направлении.

Общество также не может ждать подъёма популистов. Технологию распознавания лиц продолжат «продавать» как часть самых новых и продвинутых приложений и устройств. Apple уже называет Face ID лучшей функцией последнего iPhone. То же самое касается новостных репортажей с идеологической подоплёкой, в которых технологию распознавания лиц провозглашают решением всех проблем.

Наконец, обществу не следует излишне рассчитывать на традиционные методы регулирования. Особенности технологии распознавания лиц не позволяют удержать её в рамках мер, которые определяют законные и незаконные способы применения и пытаются уместить в ней потенциальную полезность для общества и устрашающий фактор для злоумышленников. Это - один их немногих примеров, когда необходимо ввести полный запрет.

На данный момент существует очень немного проектов по контролю технологии распознавания лиц и ещё меньше - по её ограничению. Есть достойные законы о биометрических данных в штатах Иллинойс и Техас, но они придерживаются общепринятой стратегии регулирования, согласно которой субъекты, собирающие и использующие эти данные, должны выполнять ряд базовых информационных практик и протоколов конфиденциальности. Сюда относятся требование получать информированное согласие на сбор биометрических данных, их обязательная защита и ограничение на срок хранения, запрет на их использование с целью получения прибыли, ограничение прав передачи третьим лицам и частные основания для подачи иска в случае нарушения этих норм.

Предлагаемые законы в области распознавания лиц похожи на них. Федеральная комиссия по торговле США рекомендует ввести такой же механизм в отношении технологии: предупреждать человека о её применении, давать ему выбор и честно ограничивать использование его данных. Доклад Electronic Frontier Foundation, в котором упор сделан на проведение этих законов в жизнь, содержит аналогичные, хотя и более глубокие предложения. Например, создать чёткие правила использования, распространения и обеспечения безопасности данных; ввести ограничения на сбор и хранение данных; запрет на включение нескольких видов биометрических данных в одну базу; обязательное уведомление, проведение проверок и независимого надзора. В своём проекте закона о распознавании лиц Center on Privacy & Technology университета Джорджтауна предлагает значительно ограничить доступ правительства к базам лиц, а также использование технологии распознавания лиц в реальном времени.


К сожалению, большинство действующих и предлагаемых требований носят процедурный характер. И в конечном счёте не остановят распространение самой технологии и развитие соответствующей инфраструктуры. Прежде всего нужно отметить ложность некоторых исходных допущений относительно согласия, уведомления и выбора, которые присутствуют в существующих законах. Информированное согласие как механизм регулирования наблюдения и обработки данных полностью бесполезно. Даже если бы людям всецело принадлежало право контролировать свои данные, они бы всё равно не смогли им воспользоваться в полной мере.

И всё же законодатели и сама отрасль пытаются сдвинуться с мёртвой точки. Но в этих нормах, как и в большинстве норм конфиденциальности цифровой эры, есть много пробелов. Одни законы касаются только сбора или хранения данных и не затрагивают то, как они используются. Другие применимы лишь к компаниям или правительству и настолько неоднозначны, что позволяют избежать последствий за различные противоправные действия. И чтобы прочувствовать преимущества технологии распознавания лиц, которую так расхваливают, потребуется больше камер, лучшая инфраструктура и необъятные базы данных.

Будущее технологии распознавания лиц

Технология распознавания лиц открывает безграничные возможности отслеживать информацию о личности и перемещениях человека. А также практически мгновенно сохранять, распространять и анализировать её. Развитие этой технологии в будущем может привести к тому, что конфиденциальность частной информации человека будет постоянно нарушаться. Благополучие человечества возможно лишь в том случае, если будет введён запрет на технологии распознавания лиц, прежде чем эти системы слишком прочно войдут в повседневную жизнь. Иначе людям будет знаком только мир, в котором при каждом появлении в общественном месте их будут автоматически идентифицировать, заносить информацию в профиль и, возможно, использовать её. В таком мире те, кто выступает против технологии распознавания лиц, будут дискредитированы, вынуждены замолчать или устранены.

Первым шагом на нашем конвейере является обнаружение лиц . Совершенно очевидно, что необходимо выделить все лица на фотографии, прежде чем пытаться распознавать их!

Если вы использовали в последние 10 лет какую-либо фотографию, то вы, вероятно, видели, как действует обнаружение лиц:

Обнаружение лиц - великое дело для фотокамер. Если камера может автоматически обнаруживать лица, то можно быть уверенным, что все лица окажутся в фокусе, прежде чем будет сделан снимок. Но мы будем использовать это для другой цели - нахождение областей изображения, которые надо передать на следующий этап нашего конвейера.

Обнаружение лица стало господствующей тенденцией в начале 2000-х годов, когда Пол Виола и Майкл Джонс изобрели способ обнаруживать лица , который был достаточно быстрым, чтобы работать на дешёвых камерах. Однако сейчас существуют намного более надёжные решения. Мы собираемся использовать метод, открытый в 2005 году , - гистограмма направленных градиентов (коротко, HOG ).

Для обнаружения лиц на изображении мы сделаем наше изображение чёрно-белым, т.к. данные о цвете не нужны для обнаружения лиц:

Затем мы рассмотрим каждый отдельный пиксель на нашем изображении последовательно. Для каждого отдельного пикселя следует рассмотреть его непосредственное окружение:

Нашей целью является выделить, насколько тёмным является текущий пиксель по сравнению с пикселями, прямо примыкающими к нему. Затем проведём стрелку, показывающую направление, в котором изображение становится темнее:


При рассмотрении этого одного пикселя и его ближайших соседей видно, что изображение темнеет вверх вправо.

Если повторить этот процесс для каждого отдельного пикселя на изображении, то, в конечном итоге, каждый пиксель будет заменён стрелкой. Эти стрелки называют градиентом , и они показывают поток от света к темноте по всему изображению:

Может показаться, что результатом является нечто случайное, но есть очень хорошая причина для замены пикселей градиентами. Когда мы анализируем пиксели непосредственно, то у тёмных и светлых изображений одного и того же человека будут сильно различающиеся значения интенсивности пикселей. Но если рассматривать только направление изменения яркости, то как тёмное, так и светлое изображения будут иметь совершенно одинаковое представление. Это значительно облегчает решение проблемы!

Но сохранение градиента для каждого отдельного пикселя даёт нам способ, несущий слишком много подробностей. Мы, в конечном счёте, не видим леса из-за деревьев . Было бы лучше, если бы мы могли просто видеть основной поток светлого/тёмного на более высоком уровне, рассматривая таким образом базовую структуру изображения.

Для этого разбиваем изображение на небольшие квадраты 16х16 пикселей в каждом. В каждом квадрате следует подсчитать, сколько градиентных стрелок показывает в каждом главном направлении (т.е. сколько стрелок направлено вверх, вверх-вправо, вправо и т.д.). Затем рассматриваемый квадрат на изображении заменяют стрелкой с направлением, преобладающим в этом квадрате.

В конечном результате мы превращаем исходное изображение в очень простое представление, которое показывает базовую структуру лица в простой форме:


Исходное изображение преобразовано в HOG-представление, демонстрирующее основные характеристики изображения независимо от его яркости.

Чтобы обнаружить лица на этом HOG-изображении, всё, что требуется от нас, это найти такой участок изображения, который наиболее похож на известную HOG-структуру, полученную из группы лиц, использованной для обучения:

Используя этот метод, можно легко находить лица на любом изображении:

Если есть желание выполнить этот этап самостоятельно, используя Python и dlib, то имеется программа , показывающая, как создавать и просматривать HOG-представления изображений.

Шаг 2. Расположение и отображение лиц

Итак, мы выделили лица на нашем изображении. Но теперь появляется проблема: одно и то же лицо, рассматриваемое с разных направлений, выглядит для компьютера совершенно по-разному:


Люди могут легко увидеть, что оба изображения относятся к актёру Уиллу Ферреллу, но компьютеры будут рассматривать их как лица двух разных людей.

Чтобы учесть это, попробуем преобразовывать каждое изображение так, чтобы глаза и губы всегда находились на одном и том же месте изображения. Сравнение лиц на дальнейших шагах будет значительно упрощено.

Для этого используем алгоритм, называемый «оценка антропометрических точек» . Есть много способов сделать это, но мы собираемся использовать подход, предложенный в 2014 году Вахидом Кэземи и Джозефином Салливаном .

Основная идея в том, что выделяется 68 специфических точек (меток ), имеющихся на каждом лице, - выступающая часть подбородка, внешний край каждого глаза, внутренний край каждой брови и т.п. Затем происходит настройка алгоритма обучения машины на поиск этих 68 специфических точек на каждом лице:


68 антропометрических точек мы располагаем на каждом лице

Ниже показан результат расположения 68 антропометрических точек на нашем тестовом изображении:


СОВЕТ ПРОФЕССИОНАЛА НОВИЧКУ: этот же метод можно использовать для ввода вашей собственной версии 3D-фильтров лица реального времени в Snapchat!

Теперь, когда мы знаем, где находятся глаза и рот, мы будем просто вращать, масштабировать и сдвигать изображение так, чтобы глаза и рот оказались отцентрованы как можно лучше. Мы не будем вводить какие-либо необычные 3D-деформации, поскольку они могут исказить изображение. Мы будет делать только базовые преобразования изображения, такие как вращение и масштабирование, которые сохраняют параллельность линий (т.н. аффинные преобразования):

Теперь независимо от того, как повёрнуто лицо, мы можем отцентровать глаза и рот так, чтобы они были примерно в одном положении на изображении. Это сделает точность нашего следующего шага намного выше.

Если у вас есть желание попытаться выполнить этот шаг самостоятельно, используя Python и dlib, то имеется программа для нахождения антропометрических точек и программа для преобразования изображения на основе этих точек .

Шаг 3. Кодирование лиц

Теперь мы подошли к сути проблемы - само различение лиц. Здесь-то и начинается самое интересное!

Простейшим подходом к распознаванию лиц является прямое сравнение неизвестного лица, обнаруженного на шаге 2, со всеми уже отмаркированными лицами. Если мы найдём уже отмаркированное лицо, очень похожее на наше неизвестное, то это будет означать, что мы имеем дело с одним и тем же человеком. Похоже, очень хорошая идея, не так ли?

На самом деле при таком подходе возникает огромная проблема. Такой сайт как Фейсбук с миллиардами пользователей и триллионами фотографий не может достаточно циклично просматривать каждое ранее отмаркированное лицо, сравнивая его с каждой новой загруженной картинкой. Это потребовало бы слишком много времени. Необходимо распознавать лица за миллисекунды, а не за часы.

Нам требуется научиться извлекать некоторые базовые характеристики из каждого лица. Затем мы могли бы получить такие характеристики с неизвестного лица и сравнить с характеристиками известными лиц. Например, можно обмерить каждое ухо, определить расстояние между глазами, длину носа и т.д. Если вы когда-либо смотрели телесериал о работе сотрудников криминалистической лаборатории Лас-Вегаса («C.S.I.: место преступления»), то вы знаете, о чём идёт речь:


Как в кино! Так похоже на правду!

Самый надёжный метод обмерить лицо

Хорошо, но какие характеристики надо получить с каждого лица, чтобы построить базу данных известных лиц? Размеры уха? Длина носа? Цвет глаз? Что-нибудь ещё?

Оказывается, что характеристики, представляющиеся очевидными для нас, людей, (например, цвет глаз) не имеют смысла для компьютера, анализирующего отдельные пиксели на изображении. Исследователи обнаружили, что наиболее адекватным подходом является дать возможность компьютеру самому определить характеристики, которые надо собрать. Глубинное обучение позволяет лучше, чем это могут сделать люди, определить части лица, важные для его распознавания.

Решение состоит в том, чтобы обучить глубокую свёрточную нейронную сеть (именно это мы делали в выпуске 3). Но вместо обучения сети распознаванию графических объектов, как мы это делали последний раз, мы теперь собираемся научить её создавать 128 характеристик для каждого лица.

Процесс обучения действует при рассмотрении 3-х изображений лица одновременно:

1. Загрузите обучающее изображение лица известного человека

2. Загрузите другое изображение лица того же человека

3. Загрузите изображение лица какого-то другого человека

Затем алгоритм рассматривает характеристики, которые он в данный момент создаёт для каждого из указанных трёх изображений. Он слегка корректирует нейронную сеть так, чтобы характеристики, созданные ею для изображений 1 и 2, оказались немного ближе друг к другу, а для изображений 2 и 3 - немного дальше.

Единый «строенный» шаг обучения:

После повтора этого шага миллионы раз для миллионов изображений тысяч разных людей нейронная сеть оказывается в состоянии надёжно создавать 128 характеристик для каждого человека. Любые десять различных изображений одного и того же человека дадут примерно одинаковые характеристики.

Специалисты по обучению машин называют эти 128 характеристик каждого лица набором характеристик (признаков) . Идея сведения сложных исходных данных, таких как, например, изображение, к списку генерируемых компьютером чисел оказалась чрезвычайно перспективной в обучении машин (в частности, для переводов). Такой подход для лиц, который мы используем, был предложен в 2015 году исследователями из Гугл , но существует много аналогичных подходов.

Кодировка нашего изображения лица

Процесс обучения свёрточной нейронной сети с целью вывода наборов характеристик лица требует большого объёма данных и большой производительности компьютера. Даже на дорогой видеокарте NVidia Telsa требуется примерно 24 часа непрерывного обучения для получения хорошей точности.

Но если сеть обучена, то можно создавать характеристики для любого лица, даже для того, которое ни разу не видели раньше! Таким образом, этот шаг требуется сделать лишь один раз. К счастью для нас, добрые люди на OpenFace уже сделали это и предоставили доступ к нескольким прошедшим обучение сетям , которые мы можем сразу же использовать. Спасибо Брендону Амосу и команде!

В результате всё, что требуется от нас самих, это провести наши изображения лиц через их предварительно обученную сеть и получить 128 характеристик для каждого лица. Ниже представлены характеристики для нашего тестового изображения:

Но какие конкретно части лица эти 128 чисел описывают? Оказывается, что мы не имеем ни малейшего представления об этом. Однако на самом деле это не имеет значения для нас. Нас должно заботить лишь то, чтобы сеть выдавала примерно одни и те же числа, анализируя два различных изображения одного и того же человека.

Если есть желание попробовать выполнить этот шаг самостоятельно, то OpenFace предоставляет Lua-скрипт , создающий наборы характеристик всех изображений в папке и записывающий их в csv-файл. Можно запустить его так, как показано .

Шаг 4. Нахождение имени человека после кодировки лица

Последний шаг является фактически самым лёгким во всём этом процессе. От нас требуется лишь найти человека в нашей базе данных известных лиц, имеющего характеристики, наиболее близкие к характеристикам нашего тестового изображения.

Это можно сделать, используя любой базовый алгоритм классификации обучения машин. Какие-либо особые приёмы глубинного обучения не требуются. Мы будем использовать простой линейный SVM-классификатор , но могут быть применены и многие другие алгоритмы классификации.

От нас потребуется только обучить классификатор, который сможет взять характеристики нового тестового изображения и сообщить, какое известное лицо имеет наилучшее соответствие. Работа такого классификатора занимает миллисекунды. Результатом работы классификатора является имя человека!

Опробуем нашу систему. Прежде всего я обучил классификатор, используя наборы характеристики от примерно 20 изображений Уилла Феррелла, Чеда Смита и Джимми Фэлона:


О, эти восхитительные картинки для обучения!

Затем я прогнал классификатор на каждом кадре знаменитого видеоролика на Youtube, где на шоу Джимми Фэлона Уилл Феррелл и Чед Смит прикидываются друг другом :

Сработало! И смотрите, как великолепно это сработало для лиц с самых разных направлений - даже в профиль!

Самостоятельное выполнение всего процесса

Рассмотрим требуемые шаги:

1. Обработайте картинку, используя HOG-алгоритм, чтобы создать упрощённую версию изображения. На этом упрощённом изображении найдите тот участок, который более всего похож на созданное HOG-представление лица.

2. Определите положение лица, установив главные антропометрические точки на нём. После позиционирования этих антропометрических точек используйте их для преобразования изображения с целью центровки глаз и рта.

3. Пропустите отцентрованное изображение лица через нейронную сеть, обученную определению характеристик лица. Сохраните полученные 128 характеристик.

4. Просмотрев все лица, характеристики которых были сняты раньше, определите человека, характеристики лица которого наиболее близки к полученным. Дело сделано!

Теперь, когда вы знаете, как всё это работает, просмотрите инструкции с самого начала до конца, как провести весь процесс распознавания лица на вашем собственном компьютере, используя OpenFace :

Прежде чем начать

Убедитесь, что Python, OpenFace и dlib у вас установлены. Их можно установить вручную или использовать предварительно сконфигурированное контейнерное изображение, в котором это всё уже установлено:

Docker pull bamos/openface docker run -p 9000:9000 -p 8000:8000 -t -i bamos/openface /bin/bash cd /root/openface

Совет профессионала новичку: если вы используете Docker на OSX, то можно сделать папку OSX/Users/ видимой внутри контейнерного изображения, как показано ниже:

Docker run -v /Users:/host/Users -p 9000:9000 -p 8000:8000 -t -i bamos/openface /bin/bash cd /root/openface

Затем можно выйти на все ваши OSX-файлы внутри контейнерного изображения на /host/Users/…

Ls /host/Users/

Шаг 1

Создайте папку с названием./training-images/ в папке openface.

Mkdir training-images

Шаг 2

Создайте подпапку для каждого человека, которого надо распознать. Например:

Mkdir ./training-images/will-ferrell/ mkdir ./training-images/chad-smith/ mkdir ./training-images/jimmy-fallon/

Шаг 3

Скопируйте все изображения каждого человека в соответствующие подпапки. Убедитесь, что на каждом изображении имеется только одно лицо. Не требуется обрезать изображение вокруг лица. OpenFace сделает это автоматически.

Шаг 4

Выполните скрипты openface из корневого директория openface:

Сначала должны быть выполнены обнаружение положения и выравнивание:

./util/align-dlib.py ./training-images/ align outerEyesAndNose ./aligned-images/ --size 96

В результате будет создана новая подпапка./aligned-images/ с обрезанной и выровненной версией каждого из ваших тестовых изображений.

Затем создайте представления из выровненных изображений:

./batch-represent/main.lua -outDir ./generated-embeddings/ -data ./aligned-images/

Подпапка./generated-embeddings/ будет содержать csv-файл с наборами характеристик для каждого изображения.

Проведите обучение вашей модели обнаружения лица:

./demos/classifier.py train ./generated-embeddings/

Будет создан новый файл с именем./generated-embeddings/classifier.pk . Этот файл содержит SVM-модель, которая будет использоваться для распознавания новых лиц.

С этого момента у вас появляется работающий распознаватель лиц!

Шаг 5. Распознаём лица!

Возьмите новую картинку с неизвестным лицом. Пропустите её через скрипт классификатора, типа нижеследующего:

./demos/classifier.py infer ./generated-embeddings/classifier.pkl your_test_image.jpg

Вы должны получить примерно такое предупреждение:

=== /test-images/will-ferrel-1.jpg === Predict will-ferrell with 0.73 confidence.

Здесь, если пожелаете, можете настроить python-скрипт./demos/classifier.py .

Важные замечания:

Если результаты неудовлетворительные, то попытайтесь добавить ещё несколько изображений для каждого человека на шаге 3 (особенно изображения с разных направлений).

Данный скрипт будет всегда выдавать предупреждение, даже если он не знает это лицо. При реальном использовании необходимо проверить степень уверенности и убрать предупреждения с низким значением степени уверенности, поскольку они, скорее всего, неправильные.

Добавить метки

Мировой рынок распознавания лиц вырастет с 4,05 млрд. долларов в 2017 году до 7,76 млрд. долларов США к 2022 году .




Как работает система распознавания лиц?

В принципе, система распознавания лиц может быть описана как процесс сопоставления лиц, попавших в объектив камеры с базой данных ранее сохраненных и идентифицированных изображений лиц эталонов.
По структурной реализации системы распознавания лиц можно выделить три распространенные схемы.

Анализ видеопотока на сервере

Наиболее распространенная схема реализации - IP-камера передает видеопоток на сервер, на сервере специализированное программное обеспечение для выполняет анализ видеопотока и сравнение полученных из видеопотока изображений лиц, с базой лиц эталонов.

Недостатками такой схемы будут, высокая нагрузка на сеть, высокая стоимость сервера, даже к самому мощному серверу можно подключить ограниченное количество IP-камер, т.е. чем больше система тем больше серверов.
Преимуществом является возможность использовать уже существующую систему видеонаблюдения.

Анализ видеопотока на IP-камере

В данном случае анализ изображения будет производится на самой камере, а на сервер будут передаваться обработанные метаданные.

Недостатки - нужны специальные камеры, выбор которых в данный момент крайне мал, стоимость камер выше чем обычных. Также в системах разных производителей будет по разному решаться вопрос хранения и размера базы данных распознанных лиц эталонов, а также вопросов взаимодействия софта на камере и софта на сервере.
Преимущества - подключение практически неограниченного количества камер к одному серверу

Анализ видеопотока на устройстве контроля доступа

В отличии от первых двух схем где используются IP-камеры, в данном случае камера встроена в устройство контроля доступа, которое кроме распознавания лица которое естественно происходит на устройстве, выполняет функции управления доступом как правило через турникет или электрозамок установленный на дверь. База данных лиц эталонов хранится на устройстве, и как правило уже не в виде фотоизображений.

Недостатки - как правило все такие устройства выпускаются для использования в помещениях.
Преимущества - низкая стоимость систем по сравнению с системами видеонаблюдения используемыми для распознавания лиц.

В любом случае успех реализации проектов по распознаванию лиц зависит от трех важных факторов:
Алгоритм распознавания
Базы данных распознанных лиц (эталонов)
Быстродействие алгоритма

Технология распознавания лиц

Как правило система состоит из камеры видеонаблюдения и программного обеспечения которое выполняет анализ изображений. Программное обеспечение для распознавания лиц основано на обработке изображений и вычислениях сложных математических алгоритмов, которые требуют более мощный сервер, чем обычно требуется для систем видеонаблюдения.

Нас будет в первую очередь интересовать качественные показатели программного обеспечения. Во вторую, какие серверные мощности понадобятся для анализа изображения и обработки базы данных с изображениями, ну и в третьи мы рассмотрим вопрос применимости IP-камер для целей распознавания лиц. Отдельного внимания заслуживают так называемые «stand alone» устройства, которые выполняют обработку изображений непосредственно на самом устройстве а не на сервере, также на таких устройствах может быть в память база данных лиц эталонов.


2D-распознавание лиц
В основе технологии 2D (двумерного) распознавания лиц, лежат плоские двухмерные изображения. Алгоритмы распознавания лиц используют: антропометрические параметры лица, графы - модели лиц или эластичные 2D-модели лиц, а также изображения с лицами представленные некоторым набором физических или математических признаков. Рейтинг популярности алгоритмов распознавания лиц мы рассмотрим ниже.

Распознавание 2D изображений одна из наиболее востребованных технологий на данный момент. Так как основные базы данных идентифицированных лиц накопленные в мире - именно двухмерные. И основное оборудование, уже установленное, по всему миру тоже 2D - по данным на 2016 год - 350 миллионов камер видеонаблюдения. Собственно поэтому основной спрос приходится именно на 2D системы распознавания лиц.

А спрос как известно стимулирует предложение, заставляя разработчиков максимизировать усилия на совершенствовании именно 2D технологии. Эти усилия приносят иногда неожиданно интересные результаты, например в виде создания трехмерной модели лица на основе 2D изображения. Исследователи из университетов Ноттингема и Кингстона представили проект по 3D-реконструкции лиц на основе одного одного единственного изображения. Нейросеть, через которую пропустили множество объёмных 3D-моделей людей и обычных портретов воссоздает объемные лица людей на основе всего одного двумерного изображения лица.




Преимущества
Огромным преимуществом 2D распознавания лиц является наличие готовых баз данных лиц эталонов, и готовой инфраструктуры. Максимальный спрос придется именно на этот сегмент, а спрос будет стимулировать разработчиков совершенствовать технологии.

Недостатки
Более высокие коэффициенты ошибок FAR и FRR по сравнению с 3D распознаванием лиц.


3D-распознавание лиц
3D распознавание (Three-dimensional face recognition - англ.) производится как правило по реконструированным трехмерным образам. Технология 3D распознавания лиц имеет более высокие качественные характеристики. Хотя конечно и она не является идеальной.

Существует несколько разнообразных технологиях 3D сканирования. Это могут быть лазерные сканеры с оценкой дальности от сканера до элементов поверхности объекта, специальные сканеры со структурированной подсветкой поверхности объекта и математической обработкой изгибов полос, либо это могут быть сканеры, обрабатывающие фотограмметрическим методом синхронные стереопары изображений лиц.

Одним из наиболее исследованных потребителями и экспертами 3D сканеров является знаменитый Face ID, от компании Apple. Опыт использования Face ID крайне интересен и показателен, потому что по сути это единственное устройство с технологией 3D распознавания лиц выпущенное на масс маркет, если конечно можно считать телефон за сотку устройством для масс маркета.

3D технология от Apple единственная в мире использует - вертикально-излучающие лазеры (VCSEL), по слухам суммарно потратив на разработку Face ID от 1,5 до 2 миллиардов долларов. Поставщиком VCSEL для Apple выступают две компании Finisar Corp (инвестиции Apple - 390 млн. долларов) и Lumentum Holdings . И судя по тому что другие 3D технологии, не показывают такой эффективности как Face ID, разблокировка по лицу на смартфонах на Android, появится не скоро.

Естественно с задачами идентификации близнецов Face ID не справляется, хотя этого никто и не ожидал, но даже с близкими родственниками случаются фейлы .
Ну и скорее комичный момент, но по началу Face ID не различал азиатов , но проблему настолько быстро пофиксили, что Apple даже не успели вчинить ни одного иска за расизм.

Преимущества 3D
Большая точность и меньшее количество ошибок пока недостижимое для 2D систем распознавания лиц.


Недостатки 3D
Достаточно легко подделать для профессионалов
Даже Face ID несмотря на всю крутость был взломан вьетнамской компанией Bkav сразу после поступления в продажу. Маска была создана с помощью 3D принтера. Себестоимость создания маски всего $150. Создание маски достаточно сложно для обычного человека, и ваша мама вряд ли сможет это повторить, но для профессионалов это как два пальца об асфальт.

Не используйте 3D распознавания лиц для защиты от несанкционированного доступа к ноутбукам, смартфонам, помещениям с особым уровнем секретности, все они могут быть с легкостью взломаны профессионалами.

3D распознавание требует специальных камер для сканирования, которые в несколько раз дороже обычных камер видеонаблюдения которые используется в 2D распознавании.
Отсутствие готовых баз данных идентифицированных лиц, по сравнению с 2D распознаванием
Распознавание близнецов, остается сложной задачей для алгоритмов распознавания лиц. В среднем в мире рождается 13.1 близнецов на 1000 новорожденных , и эта цифра сильно колеблется в зависимости от географического региона.

Распознавание лица по текстуре кожи лица
Изображения с высоким разрешением еще один фактор в совершенствовании технологии распознавания лиц, именно благодаря высокому разрешению стал возможен очень подробный анализ текстуры кожи.

При таком анализе определенная область кожи лица, может быть захвачена как изображение, а затем разбита на более мелкие блоки, которые превращаются в математические измеримые пространства, в которых записываются линии, поры и фактическая текстура кожи.

Технология может идентифицировать различия между близнецами, что пока невозможно использовать с помощью программного обеспечения для распознавания лиц». В случае объединения распознавание лица с анализом поверхностной текстуры, точность идентификация может сильно увеличиться.

Распознавание лица по тепловизионному изображению
Использование тепловизионных камер, для целей распознавания лиц на данный момент считается перспективным направлением для разработки, но готовых для внедрения коммерческих решений пока нет.


Технология достаточно перспективная так как позволяет нивелировать болевые точки 2D-распознавания.

Распознавания лиц в полной темноте и в условиях недостаточного освещения
Макияж, прическа, борода, шляпа, очки - не являются проблемой для тепловизионных камер
Позволяют распознавать близнецов


Можно выделить два направления, в которых ведется разработка:
Идентификация по заранее созданным термограммам идентифицированных лиц. Здесь проблемы те же что и с 3D-распознавание, готовых баз данных эталонов нет, оборудование дорогое.
Идентификация человека по изображениям полученным с тепловизионной камеры, а в качестве лиц эталонов используются база данных обычных двумерных изображений. Решается задача как вы наверное уже догадались использованием глубоких нейронных сетей.

Распознавание лиц по текстуре кожи и по тепловизионному изображению. работает, только в лаборатории, и то не идеально. Но мы внимательно наблюдаем, и если что сразу дадим вам знать.

Качество программного обеспечения

Существует несколько важных метрик для оценки качества программного обеспечения.

Наиболее важные из них FRR и FAR
False Reject Rate - FRR (Уровень ошибочных отказов) - вероятность того, что система не идентифицирует зарегистрированного пользователя или не подтверждает его подлинности.

Как рассчитывается FRR:
Пусть Nt - количество эталонов изображений в базе данных. FR - количество ложных нераспознаваний (False Reject - Иванов, не распознан как Иванов),

False Acceptance Rate - FAR (Уровень ошибочных подтверждений) - вероятность того, что система распознавания лиц ошибочно идентифицирует незарегистрированного пользователя или подтверждает его подлинность.

Как рассчитывается FAR:
Пусть Nt - количество эталонов изображений в базе данных. FA - количество ложных распознаваний (False Acceptation - Иванов распознан как Петров),

Первое и самое важное что вам нужно знать про эти два показателя, это то что они не абсолютные, а относительные, т.е. они могут меняться в зависимости от настроек алгоритма распознавания лиц.

Второе это то, что эти показатели взаимосвязаны - чем меньше FAR тем больше FRR.

Ориентировочные значения FRR и FAR для систем распознавания лиц и их взаимосвязь представлены в таблице:


Сравнение FAR и FRR различных методов биометрической идентификации:

Разработчики алгоритмов распознавания лиц

Алгоритм распознавания, это как правило не готовый программный продукт, а программный алгоритм который еще предстоит упаковать в программный продукт и в оборудование.

Производителей алгоритмов распознавания в мире достаточно много, благо есть независимые организации которые проводят тестирование эффективности алгоритмов. Самые известные: NIST - Национальный институт стандартов технологий США и MegaFace - Вашингтонский университет, Labeled Faces in the Wild , есть и другие. Результаты конкурсов постоянно обновляются. Любая компания в любой момент может обновить свой результат, заново пройдя тестирование. Еще недавно NtechLab заявила о себе как о победителе, а сегодня они лишь на 4 месте.

Мы опубликуем тестирование NIST с результатами на 13.05.2018. Так как NIST с моей точки зрения более интересен так как тестирование алгоритмов происходит на закрытой базе данных лиц, что исключает подготовку разработчика к тестированию.

  1. Алгоритм - megvii-000 от Megvii , Китай
    Китайская компания Megvii со своим основным продуктов Face++. По оценкам Коммерсанта оборот компании составил порядка $100 млн.
  2. Алгоритмы: 2 место - visionlabs-003, 7 место - visionlabs-002, VisionLabs , Россия
  3. Алгоритмы: 3 место - morpho-002, 17 место - morpho-000. OT-Morpho , Франция
    Первый тяжеловес, в рейтинге с оборотом почти 3 млрд. евро за 2017 год. Совместное предприятие Oberthur Technologies (OT) и Safran Identity & Security (Morpho)
  4. Алгоритмы: 4 место - ntechlab-003, 13 место - ntechlab-002 от NtechLab , Россия
    Московская компания, получившая известность как разработчик решения для поиска порно актеров .
    Получил инвестиции от «РТ – развитие бизнеса» («дочка» «Ростеха»), и фонда компании VB Partners. Сумма инвестиций не раскрывается. В результате «дочка» «Ростеха», получила 12,5% компании, фонд New Dimension Fund Variable Capital Investment, им управляет VB Partners, – 25% компании. NtechLab планирует выйти на рынок систем национальной безопасности и усилить развитие в коммерческом секторе.
  5. Алгоритм - cogent-000 от Gemalto Cogent , США
    Разрабатывает полный спектр биометрических решений с акцентом на правоохранительную деятельность, пограничный контроль и гражданскую идентификацию. Ежегодные глобальные продажи составляют около 205 миллионов долларов.
  6. Алгоритм - vocord-002 от Vocord , Россия
    Компания «Вокорд» основана в 1999 году выпускниками МФТИ Дмитрием Заварикиным и Алексеем Кадейшвили. По данным «СПАРК-Интерфакс», в 2014 году выручка компании составила 302 млн рублей, более свежих данных на момент написания статьи получить не удалось.
  7. Алгоритмы: - fdu-000, 9 место - fdu-001. Fudan University , Китай
  8. Алгоритм - neurotechnology-003. Neurotechnology , Литва
    С сайта компании можно скачать демо версию программного обеспечения для ПК и для смартфона на Android, демо версию SDK. У компании информативный канал на YouTube. Цены опубликованы на сайте. Так же компания предлагает собственный облачный сервис www.skybiometry.com
  9. Алгоритм - itmo-003. Университет ИТМО , Россия
  10. Алгоритм - 3divi-001. Тридиви (3DiVi Inc.) , Россия
  11. Алгоритм - yitu-000. Yitu Technologies , Китай
    Главный продукт Yitu - система распознавания лиц Dragonfly Eye, которую используют государственные системы безопасности в разных городах Китая. В первые три месяца использования системы в Шанхае с помощью Dragonfly Eye задержали 567 нарушителей закона. Система хранит 1,8 миллиарда фотографий, причём в базу попадают фото не только граждан Китая, но и всех туристов, пересекающих границу страны. Систему разворачивают и на массовых событиях: во время фестиваля пива в Циндао камеры помогли задержать 22 разыскиваемых. Власти на местах рапортуют об успехах : в одном городе система Yitu помогла сократить карманные кражи на 30%, в другом - за два года раскрыть 500 преступлений. Каким-то невероятным образом система даже помогла опознать жертву убийства по черепу спустя пять лет после преступления.
  12. Алгоритм - gorilla-000, Gorilla Technology , Тайвань
  13. Алгоритм - cyberextruder-002, CyberExtruder , США
  14. Алгоритм - tongyitrans-002, TongYi Transportation Technology , Китай
  15. Алгоритм - yisheng-001, Zhuhai Yisheng Electronics Technology , Китай

  16. Итого: 5 представителей из России, что не может не радовать, 5 от Китая, что даже не удивляет.

    На самом деле производителей алгоритмов распознавания гораздо больше, многих отсутствующих здесь вы можете найти в рейтинге MegaFace. Но если даже составить единый список, он все равно будет не полон. Почти все гиганты IT индустрии разрабатывают собственные алгоритмы распознавания лиц - Facebook, Google (считает свою систему распознавания самой точной), Baidu, Microsoft , Яндекс (тестирует авторизацию водителей по лицу и голосу), Вконтакте, Toshiba и многие другие.

    Существуют даже .

    Из всего это разнообразия, можно сделать несколько несложных выводов:

    Конкуренция на этом рынке будет усиливаться, ее следствием уже стало многократное снижение цен. Для примера - Macroscop еще в 2017 году снизил свои цены модуль распознавания в 18 раз, о чем радостно сообщают на своем же сайте, как бы передавая «большой привет» всем своим клиентам которым посчастливилось купить модуль распознавания до 2017 года.

    Очевидно что цены и дальше будут снижаться. Качественные показатели алгоритмов распознавания постоянно растут, и во многих случаях отличаются друг от друга незначительно, значительно же отличается цена, как вы сможете увидеть ниже, еще более значительно отличается быстродействие, естественно такой параметр как быстродействие нужно тестировать на базе данных максимального объема.

    Еще нетрудно заметить, что в рейтингах практически нет производителей оборудования для систем видеонаблюдения , а без видеокамер и устройств хранения, вся эта история с алгоритмами лишь игры на компьютере. Но то, что их нет, это не означает что они не видят этого рынка, и не понимают его значимость. Вот - распознавание лиц от Panasonic , от NEC , Amazon и многих других. В общем на этом рынке скоро станет очень жарко. Кроме софтверных решений (это когда непосредственно распознавание происходит на сервере), есть еще Stand Alone решения - это когда распознавание происходит на устройстве считывания.


    Программное обеспечение для распознавания лиц для систем видеонаблюдения

    Тестирование эффективности алгоритмов распознавания лиц это конечно интересно, как и любое соревнование, но больше похоже на выставку достижений народного хозяйства. Вроде впечатляет, но как конкретно начать использовать и сколько будет стоить непонятно. Результатом работы алгоритмов для распознавания лиц, будет совпадение или несовпадение с базой эталонов. А далее в зависимости от специфики вашей системы должно произойти заранее запрограммированное действие. Например при входе VIP клиента старший менеджер получает уведомление со всеми данными по клиенту из вашей базы данных.

    Или наоборот при входе человека из черного списка, уведомление получает охрана. Или при попытке прохода человека из черного списка через проходную, система контроля доступа блокирует проход - это уже интеграция системы распознавания лиц с системой контроля доступа.

    Работа системы распознавания лиц в реальных условиях это целый комплекс программно аппаратного взаимодействия. Для организации таких взаимодействий существует куча интегрированных платформ, позволяющей настраивать взаимодействия с системами контроля доступа, системами видеонаблюдения, охранными системами, системами пожарной безопасности, CRM системами, системами управления предприятием, и многими другими.

    Так если вам не шашечки, а везти, следующие пара разделов для вас просто «Must Have».
    Интеграционные платформы - громкое название, к перечисленным ниже разработчикам оно относится в разной степени, поэтому выбирая решения для распознавания лиц необходимо ознакомиться со всеми возможностями софта (платформы). Учитывая как текущие потребности предприятия, так и возможности развития, как качественные характеристики алгоритма распознавания лиц, так возможности интеграции.

    Разработчики программного обеспечения для системы распознавания лиц и цены на их модули

    ISS , Россия, Программное обеспечение «SecurOS® Face»


    Лицензия модуля захвата лиц - цена 41 275 рублей
    На канал. Устанавливается на сервере распознавания лиц или на сервере захвата лиц

    Лицензия модуля распознавания лиц (до 1000 чел. в базе) - цена 665 760 рублей.
    На сервер распознавания лиц.

    Сервера для программного обеспечения для целей распознавания лиц

    Распознавание лиц как и любая другая видеоаналитика задачи процессорно емкие, поэтому для развертывания даже небольшой системы распознавания лиц вам потребуется достаточно мощные и совсем не дешевые сервера. Характеристики сервера подбираются индивидуально и зависят от множества факторов - от количества каналов распознавания, до предполагаемого размера базы данных лиц эталонов, и длительности хранения видеоархива.

    Сервера для программного обеспечения систем распознавания лиц - цена от 101 567 рублей
    Выбор серверов не ограничивается представленными в этом каталоге, в большинстве случаев мы собираем сервер в зависимости от заявленных вами требований.


    Лучшие IP-камеры для распознавания лиц

    Программное обеспечение и сервера, мы рассмотрели выше, но чтобы система заработала, нужны IP-камеры. Именно от качественных характеристик камер будет сильно зависеть, то насколько качественно система будет работать система распознавания лиц.

    При выборе IP-камеры для распознавания лиц мы рекомендуем обращать внимание на следующие характеристики.

    WDR (Широкий динамический диапазон)
    Несмотря на то что последнее время появляются камеры с WDR за 5000 рублей, качество изображения таких камер сильно уступает камерам с из более высокого ценового сегмента. Камеры с лучшим WDR по нашему опыту не может стоить дешевле 80000 рублей.

    Частота кадров не менее 60 кадров с секунду
    Чем больше частота кадров в секунду тем больше вероятность того что вы получите снимок с наилучшей ориентацией лица человека относительно камеры, что напрямую будет влиять на качество распознавания лиц.

    Вариофокальный объектив
    Чем больше будет приходится пикселей на лицо человека, тем более будет изображение.

    Тесты показали, что для успешного распознавания лица требуется, чтобы лицо было представлено не менее 160 пикселями приходящимися на овал лица, и в идеале не менее 50 пикселей приходилось на расстояние между глазами. Как бы тщательно вы не выбирали месторасположение камеры, чтобы добиться этих значений ее придется подстраивать по месту в зависимости от множества факторов. Именно для этого вам и понадобится вариофокальный объектив.

    Камеры видеонаблюдения с установленными рекомендуемыми характеристиками для распознавания лиц - цена от 10 000 рублей

    Дальше как говорится, выбор за вами. Если вы строите систему распознавания с нуля, то стоит задуматься о выборе действительно лучших протестированных моделей IP-камер.


    Достаточно распространенный и недорогой функционал, как правило он всегда присутствует в основном программном обеспечении для распознавания лиц, но может и приобретаться отдельно. Если вы никогда в жизни не интересовались системами видеонаблюдения. Посмотрите видео там максимально коротко рассказано в чем суть.


    ITV , Россия, Программное обеспечение «Интеллект»
    Поиск лиц в архиве (за 1 видеоканал) - цена 6 200 рублей

    Trassir , Россия, Программное обеспечение «Trassir Face Search»
    Модуль поиска определенного лица в архиве Trassir Face Search - цена 36 990 рублей

    В том или ином виде данный функционал присутствует у большинства разработчиков, поэтому мы пожалуй не станем растягивать и без того ни короткую статью.


    Производители оборудования с интегрированными алгоритмами распознавания лиц

    Если раздел выше с разработчиками программного обеспечения это настоящее, т.е. именно там сосредоточены основные решения показывающее максимальную эффективность на данный момент. То этот раздел про будущее которое уже наступает.

    В первом случае видеопоток от камеры по сети передается на сервер с установленным софтом, и именно там происходит распознавание лиц, поток от одной IP-камер примерно равен 5 Мбит/с, и этот поток нужно передать по сети на сервер и там обработать. В случае с одной камерой все выглядит приемлемо, а если камер сотни - это проблема которую нужно отдельно решать. Решать ее можно в основном десятками серверов для обработки данных, любая видеоаналитика это процессорно емкая задача. Так что сервера будут немалой статьей расходов.

    Гораздо эффективнее произвести распознавание на борту устройства , а по сети передать уже обработанные результаты, что уменьшит нагрузку на сети и сервера на порядки.

    Кроме того что такие устройства уже есть, они уже показывают потрясающую эффективность и быстродействие. Все оборудование я бы поделил на две большие группы «Камеры видеонаблюдения со встроенным распознаванием лиц» и «Оборудование для систем контроля доступа со встроенным распознаванием лиц».

    Камеры видеонаблюдения со встроенным распознаванием лиц

    Умные камеры со встроенными алгоритмами распознавания лиц являются одним из самых передовых в отрасли. Они позволяют обрабатывать видеопоток на непосредственно на самой камере, а на сервер отправлять обработанные метаданные. 2Мп камера iDS-2CD8426G0/F-I c двумя объективами - цена 135 550 рублей

    HikVision , Китай, крупнейший китайский производитель систем видеонаблюдения.
    Матрица - 1/2.8’’ Progressive Scan CMOS
    Чувствительность - Цвет: 0.005 лк @ (F1.2, AGC ВКЛ), 0.0089 лк @ (F1.6, AGC ВКЛ), 0 лк с ИК
    Скорость электронного затвора - 1с ~ 1/100000с
    Разрешение 2МпАппаратный WDR 120дБ, частота кадров 25к/с@2Мп, слот для microSD до 128Гб, ИК-подсветка до 10м

    Камера для распознавания лица, с двумя объективами, представляет собой компактное устройство с алгоритмами глубокого обучения DeepinViewс системой распознавания лиц на борту.

    Камера поддерживает несколько кодеков сжатия видео (H.265, H.264, MPEG-4 и MJPEG) и может обрабатывать до пяти видеопотоков. Размер видеокамеры - 180,4 х 147 х 117,9 мм, вес устройства - 1500 грамм. Конструктивно представляет собой двухлинзовую камеру с бинокулярной стереофонической технологией, которая считывает большое количество характеристик лица для более точного распознавания.

    Она оснащена объективом с фиксированным фокусным расстоянием 4 мм, угол обзора равен 86°. Камера автоматически захватывает выбирает и выводит оптимальное изображение лица человека.

    Выполняет распознавание лиц, мгновенное сравнение захваченных лиц с библиотеками на борту, поддерживается настройка активации тревоги по идентифицированному лицу.

    HikVision заявляет о рабочих температурах в диапазоне от -10 °C до 40 °C и уровне влажности до 95 процентов.

    Камера автоматически переключается между режимами дневной и ночной съемки. Инфракрасная подсветка действует на расстояние до 10 метров.

    Видеорегистратор iDS-96128NXI-I16 с системой распознавания лиц - цена 3 299 990 рублей

    Запись видео с разрешением до 12Мп, Вывод видео с разрешением до 4K
    128 каналов, Синхронное воспроизведение 4 канала@4К
    16 SATA HDD до 10ТБ каждый
    1/2 аудио вход/выходов, 16/8 тревожных входов/выходов
    Сетевой интерфейс 4 RJ-45 10M/100M/1000M Ethernet

    Память видеорегистратора рассчитана на 16 библиотек снимков людей (всего до 100 000 фото)

    Видеорегистратор поддерживает Smart-функции по поиску похожих людей, анализу поведения, обнаружения лиц и автомобилей.
    Есть возможность работы с тепловизорами, обнаружение огня, морских судов, измерение температуры, ведение статистики камер тепловых карт и подсчета посетителей.
    iDS-96128NXI-I16 способен обнаруживать людей на 32 каналах, и моделировать лица со скоростью 64 фото в секунду.

    Регистратор имеет интерфейсы 1 RS-232, 1 RS-485, RS-485 для клавиатуры, и по два разъема USB 2.0 и USB 3.0, а так же 16 тревожных входов и 8 выходов.

    IDS-96128NXI-I16 поддерживает использование рейд-массивов RAID0, RAID1, RAID5, RAID6 и RAID10.

    Камера видеонаблюдения DH-IPC-HF8242F-FR с системой распознавания лиц на борту - цена 100 000 рублей
    Dahua Technology , Китай
    1/1.9", 2 Мп progressive scan CMOSSmart кодек 265+/H.264+, кодирование в 3х потоках
    Starlight, true WDR 120дБ, 3DNR, День/ночь (ICR), AWB, AGC, BLC
    Множественный мониторинг сети: веб-просмотрщик, CMS (DSS / PSS) & DMSS
    Автоматическая задняя фокусировка (ABF)

    Face capture - это программное приложение, которое автоматически захватывает лица из цифрового изображения или видеофрагмента из видеоисточника. Камеры Dahua используют усовершенствованные алгоритмы Deep Learning, что позволяет камере быстро и точно распознавать и сопоставлять лица.

    Видеокамера для распознавания лиц DH-IPC-HF8242FP-FR использует технологию Deep Learning, что позволяет эффективно распознавать и сопоставлять лица. Аналитические функции устройства позволяют определять возраст, пол, настроение, наличие или отсутствие маски/очков/бороды или усов.

    Видеокамера обладает функцией подсчета людей и генерирует тепловую карту.
    Память камеры вмещает до 10 000 лиц, которые могут быть разделены на 5 категорий, что позволяет обеспечить захват и сравнение лиц в реальном времени.

    Благодаря Starlight технологии от компании Dahua, камера идеально подходит для работы в сложных условиях c ограниченным освещением.
    Ее низкая светочувствительность обеспечивает производительность цветной картинки с минимальным окружающим освещением. Даже в экстремальных условиях низкой освещенности, практически в полной темноте, Starlight технология способна отобразить цветное изображение.

    Камера видеонаблюдения IPC2255-Gi4N с системой распознавания лиц на борту - цена 100 000 рублей

    Kedacom, Китай
    1/1.9" КМОП Starlight матрица, 0.001 лк при цветном изображении 1080@30 к/с в H.265 / H.264 / MJPEG
    Распознавание до 18 целей одновременно (образ, лицо)
    Аппартный WDR, Адаптированная ИК-подсветка до 100м
    2 тревожных входа / 1 выход, Класс защиты IP66, Диапазон температур -40°C +60°C

    Видеокамера Axis P1367 со встроенным алгоритмом Ayonix - цена 68 448 рублей

    Ayonix, Япония
    Матрица 1/2,9” с прогрессивной разверткой
    Переменное фокусное расстояние 2,8–8,5 мм
    Превосходное качество видеоизображения с разрешением 5 Мп
    Технологии Lightfinder и Forensic WDR, Технология Zipstream
    Расширенные возможности для анализа изображений

    Японский разработчик программного обеспечения для распознавания лиц Ayonix, разработала программное обеспечение для работы на борту камеры Axis P1367.

    Благодаря платформе ACAP, сторонние разработчики могут разрабатывать приложения для установки их непосредственно на камеры Axis.

    Терминалы для систем учета рабочего времени со встроенным распознаванием лиц

    Терминал учета рабочего времени FacePass Pro - цена 23 000 рублей

    Anviz , Китай
    Объем памяти на 400 пользователей
    Время идентификации < 0,1 сек
    Расстояние для идентификации пользователя: от 30 см. до 80 см
    Процент распознавания: > 99%
    Чувствительный 2,8” сенсорный TFT дисплей
    Встроенный Web Server для удобства настройки терминала

    Две сканирующие камеры обеспечивают максимально точную идентификацию, а высокоскоростной процессор Samsung ARM сводит к минимуму время распознавания лиц сотрудников

    На точность и скорость идентификации не влияют даже такие факторы, как: цвет кожи, выражение лица, пол, прическа, а так же наличие или отсутствие на лице растительности.

    Anviz FacePass Pro - система учета рабочего времени сотрудников с распознаванием по лицу, бесконтактным RFID картам или паролю.

    Сочетание нового алгоритма BioNANO с высокопроизводительной аппаратной частью, гарантирует идентификацию пользователей менее чем за 0,1 (!) секунды.

    Уникальная инфракрасная подсветка, обеспечивает стабильную работу устройства как в помещениях с меняющейся освещенностью, так и в полной темноте.
    На скорость и качество идентификации не влияют даже такие факторы, как: цвет кожи, выражение лица, пол, прическа, а так же наличие или отсутствие на лице бороды или усов.

    Динамическая цифровая клавиатура и чувствительный 2,8” сенсорный TFT дисплей гарантируют комфортную эксплуатацию.

    Мультибиометрический терминал учёта рабочего времени ZKTeco Pface202-ID - цена 26 500 рублей

    ZKTeco, Китай

    Память на 600 шаблонов вен ладони, 1200 лиц (до 3000 при верификации 1:1), 2000 пальцев и 10000 карт
    Емкость журнала 100000 на событий
    Сенсорный ЖК дисплей 4.3’’
    Встроенный считыватель карт Em-Marin

    Сетевой биометрический терминал для систем учета рабочего времени и контроля доступа с идентификацией по лицам, венам ладони, отпечаткам пальцев, считывателем RFID-карт и подключением по ethernet.

    Мультибиометрический терминал учёта рабочего времени ZKTeco uFace302-ID - цена 27 405 рублей

    Память рассчитана на 1 200 шаблонов лиц, 2 000 отпечатков пальцев и 10 000 карт
    Журнал событий на 100 000 записей
    Высокая скорость распознавания
    Интерфейсы TCP/IP, RS232/485, USB Host, Wiegand выход
    Выходы для подключения элеткрозамка, датчика состояния двери, кнопки выхода, тревожный выход
    Использование аппаратного шифрования для защиты прошивки

    Биометрический терминал для учёта рабочего времени и контроля доступа UFace302-ID осуществляет идентификацию по лицу, отпечатку пальца, карте и коду. Face302-ID способен отличить лицо реального человека от фотоизображения. Продвинутый и дружелюбный пользовательский интерфейс обеспечивает 4-дюймовый сенсорный дисплей (Touch Screen).

    Биометрический терминал учёта рабочего времени ZKTeco uFace800 - цена 27 405 рублей

    Встроенная двойная камера высокого разрешения для сканирования лиц с инфракрасной подсветкой
    Память до 3000 лиц, 5000 пальцев, 10000 карт и 100000 событий
    Платформа ZMM220_TFT, алгоритмы ZK Face 7.0, ZK Finger 10.0
    6 статусов событий при регистрации
    Сканер отпечатков пальцев, Встроенный считыватель карт
    Интерфейсы TCP/IP, USB Host, WiFi (optional), Wiegand выход

    Сетевой биометрический терминал для систем учета рабочего времени и контроля доступа с идентификацией по лицам, сканером отпечатков пальцев, считывателем RFID-карт и подключением по ethernet.
    uFace800 поддерживает управление замком, контроль датчика двери, звонок, датчик взлома, подключение кнопки выхода.

    Оборудование для систем контроля доступа со встроенным распознаванием лиц

    Терминал распознавания лиц FaceStation 2 - цена 80 856 рублей

    Suprema , Корея. Крупнейший мировой производитель биометрии, входит в топ 50 крупнейших мировых производителей систем безопасности.
    Микропроцессорная система: 1.4 GHz Quard Core, Память: 8 GB Flash + 1 GB RAM
    Автономная память на 30 000 пользователей, 5 000 000 событий, 50 000 фото
    Быстрая идентификация – сравнение 1:3 000 шаблонов в секунду
    Сенсорный дисплей 4" LCD Touchscreen, Подсветка до 25000 лк
    Стабильная работа при любом освещении благодаря подсветке 25 000 лк

    FaceStation 2 - высокопроизводительная платформа для распознавания лиц. Распознавание лиц может быть использовано как в режиме идентификации так и в режиме верификации. Кроме идентификации по лицу, поддерживается идентификация по смартфону и бесконтактным картам.

    Для решения конкретных задач СКУД на реальном объекте пользователь может подобрать различные режимы идентификации (1:N) или верификации (1:1) из широкого перечня, предлагаемого FaceStation 2.
    Таким образом, появляется возможность выбрать оптимальное соотношение уровня безопасности и скорости работы в каждом конкретном случае.

    В зависимости от выбранного режима в работе будут задействованы различные сочетания биометрических сенсоров, встроенного считывателя Smart карт и сенсорной клавиатуры для ввода PIN кода.
    Бесконтактная идентификация по лицу и возможность использования смартфона вместо карты доступа делает FaceStation 2 исключительно удобным для пользователей.

    Терминал распознавания лиц высокой производительности, со встроенным мультичастотным считывателем карт (125kHz EM & 13.56Mhz MIFARE, DESFire/EV1, FeliCa, NFC, ISO14443A/B, ISO15693).

    Благодаря расширенной области распознавания, установленное согласно инструкции устройство «видит» лица людей ростом от 145 см до 210 см.
    Терминал оснащен расширенным функциями безопасности, такими как инфракрасная технология блокировки поддельных лиц и многополосная технология RF-считывания, поддерживающая новейшие стандарты RFID.

    Так же имеется модификация терминала FaceStation 2 (модель FS2-AWB) - цена 93 850 рублей , отличающаяся встроенным считывателем MultiCLASS SE (125kHz EM, HID Prox & 13.56Mhz MIFARE, DESFire/EV1, FeliCa, iCLASS SE/SR, NFC, ISO14443A/B, ISO15693).

    Ну и конечно решения от наших китайских партнеров, которые не были бы китайскими партнерами, если бы не предлагали современные технологии в 3-4 раза дешевле. Дешевизна безусловно не достигается без последствий, одно из основных отличий это размер базы данных, который у китайцев меньше раз в 5 минимум, ну и скорость и точность тоже немного страдают. Но в принципе это вполне рабочие, локальные решения для малых предприятий.

    Устройство мультифакторной биометрической идентификации ZKTeco VF680 - цена 13 410 рублей

    ZKTeco® , Китай, крупнейший китайский производитель биометрических, самостоятельно разрабатывает алгоритмы распознавания.
    Платформа ZEM810, алгоритм ZK Face 7.0
    Встроенная двойная камера высокого разрешения для сканирования лиц с инфракрасной подсветкой
    Память на 800 лиц, до 10 000 и 100 000 событий
    Скорость верификации не более 1 секунды
    Подключение по TCP/IP

    VF680 может работать автономно или подключаться к сетевым системам контроля доступа. Терминал оснащен платформой ZEM810, сенсорным экраном 3.0 дюймов и алгоритмом ZK Face 7.0, поддерживающим 800 лиц.
    Считыватель может программироваться с встроенной клавиатуры или с помощью программного обеспечения.

    Устройство мультифакторной биометрической идентификации ZKTeco MultiBio700id - цена 28 530 рублей

    Версия алгоритма: ZK Face v7.0 и ZK Finger v10.0


    100 000 событий в журнале
    Распознавание не более 1 секунды

    Мульти биометрический терминал ZKTeco Multibio700 осуществляет доступ по лицу, отпечатку пальца, бесконтактной карте и коду.
    Устройство захватывает относительную позицию, размер, и форму глаз, носа, скул, челюстей и формирует из этих данных биометрический шаблон для последующего сравнения.
    Распознавание пользователя проходит точно и быстро в пределах 1 секунды. Инфракрасная подсветка помогает удачно проводить идентификацию в условиях недостаточной освещенности.

    Для прямого управления замком терминал может использоваться автономно, или подключаться в роли считывателя в сетевые системы доступа с использованием Wiegand интерфейса.

    Биометрический считыватель ZKTeco SpeedFace V5

    Процессор Quad-Core A17 1.8Ghz, Память 2G RAM / 16G ROM
    Двойная камера: IR камера + Visible Light камера
    Работа при освещении 0~40,000Lux
    5 дюймовый сенсорный экран
    Память на 6 000 ~ 10 000 (1:N) лиц
    Скорость верификации менее 1 секунды
    Считыватель поддерживает распознавание по лицу, отпечатку пальца и RFID картам EM-Marine или Mifare.

    Распознавание лиц Visible light в разы превосходит распознавание лиц IR и дистанция распознавания увеличена до 2 метров, что значительно упрощает ситуацию в час-пик. Нет необходимости долго стоять перед камерой устройства. Пользователь может быстро пройти в нужном направлении рядом с устройством, чтобы лицо попало в поле видимости камеры.

    Благодаря использованию CNN и созданию 3D модели лица стало возможным распознавания с разных углов обзора. С применением интеллектуального алгоритма CNN, функция анти-спуффинга эффективно предотвращает проход по маскам, фото и видео.

    Биометрический терминал доступа HikVision DS-K1T606M - цена 49 990 рублей

    HikVision , Китай
    Память на 3 000 шаблонов лиц, 5 000 карт формата Mifare и 100 000 событий в журнале
    2 тревожных входа и 1 выход
    Интерфейсы связи TCP/IP; Wi-Fi; EHome протокол; RS-485; Wiegand 26/34
    Рабочие условия от -20 °C до +50 °C , влажность 10% - 90%
    Подходит для уличной установки

    Считыватель со встроенным контроллером и алгоритмом распознавания лиц ST-FR040EM - цена 26 824 рублей
    Smartec , Россия, зонтичный российский бренд, размещает заказы на куче китайских фабриках и продает в России под единым брендом Smartec.
    Версия алгоритма: ZK Face v7.0 и ZK Finger v10.0
    Инфракрасная камера высокого разрешения, Сенсорный дисплей 3 дюйма
    Объем памяти на 400 шаблонов лиц, 2000 отпечатков пальцев и 1000 бесконтактных карт
    Распознавание не более 1 секунды
    Встроенный RFID ридер Em-Marine 125kHz

    Если вам показалось что он похож на ZKTeco MultiBio700ID , то вы правы для Smartec этот считыватель производит ZKTeco, и это полная копия MultiBio700ID.

    Домофон со встроенной системой распознавания лиц DS06M - цена 14 300 рублей

    Бевард , Россия
    1,3 Мп сенсор SONY Exmor, с чувствительностью 0.01Лк
    Эксплуатация в диапазоне температур от -40 до +50°С, класс защиты IP54
    Установленная карта microSDHC на 4 ГБ, запись на карту памяти
    Двухсторонняя аудиосвязь
    Поддержка облачного сервиса Camdrive

    Не спешите радоваться низкой цене, база данных максимум на 30 лиц. Но если у вас небольшое предприятие и вы хотите произвести ВАУ эффект на ваших посетителей - это то, что может подойти.

    К слову, системой распознавания лиц, может быть оборудован любой IP домофон , желательно с нормальной IP камерой.
    И даже больше, IP домофон устанавливается именно на уровне лица или чуть ниже, что идеально подходит для качественного распознавания лиц.

    Тот же домофон Бевард, но подключенный к системе распознавания лиц Макроскоп, в данном случае программное обеспечение Макроскоп устанавливается на сервер . В такой конфигурации размер базы данных ограничен только, простите, вашими финансовыми возможностями.

    Очки с системой распознавания лиц уже использует полиция города Чжэнчжоу

    LLVision Technology , Китай

    Подключенные к базе данных полиции, очки выдают имя и адрес человека за 2-3 минуты. За полторы недели с помощью очков на железнодорожном вокзале в Чжэнчжоу было задержано семь человек числящихся в розыске, и 26 с поддельными ID-картами .

    Кроме хакеров, есть еще вездесущий товарищ майор, который к биометрическим данным проявляет не меньший интерес. WikiLeaks опубликовала сообщение (url предусмотрительно заблокирована РосКомНадзором) о возможной краже базы данных Aadhaar ЦРУ, с помощью оборудования которое используется для сканирования отпечатков пальцев и радужной оболочки глаза от компании Cross Match (Запомните эту американскую компанию она до сих пор активно продвигает свое оборудование, в том числе на международных рынках)

    Естественно Aadhaar сам предоставляет доступ коммерческим компаниям, например компания Microsoft использует Aadhaar для подтверждения личности пользователей специальной версии Skype для Индии.

    В предоставлении доступа коммерческим компаниям к государственным базам биометрических данных есть большой смысл. Как правило сами биометрические данные не передаются, передаются лишь результат идентификации. Кроме того что эти услуги платные, именно на эти поступления создаются и обслуживаются государственные биметрические базы данных.

    Свой Aadhaar появился и в России, очевидно что российская базе данных вряд ли удастся избежать, всех тех проблем через которые прошла Aadhaar.

    Доступ к российской базе данных планируется предоставлять банкам.

    Есть и примеры другого подхода, Бельгия первая страна запретившая использование систем распознавания лиц коммерческими организациями.

    Базы данных при надлежащие коммерческим компаниям
    Государство даже обладая монополией на принудительный сбор данных, как правило не является самым эффективным их собирателем.

    Поэтому мы имеем гигантское количество коммерческих баз данных биометрической информации. Крупнейшие - База данных Вконтакте (более 97 000 000 человек ежемесячно пользуются ВКонтакте), именно ей например пользуется NtechLab для своего сайта FindFace , также большой базой данных обладает Facebook и другие социальные сети и сайты знакомств.

    Коммерческие базы данных для того и создаются что за скромные деньги их могли использовать другие коммерческие компании.

    Например Битрикс24 в своих продуктах Face-трекер, Face-карт для 1С, Bitrix24.Time и визит-трекер использует базу данных вконтакте.

    Лучшая база данных
    У всех выше перечисленных баз данных, есть один существенный недостаток, они не имеют никакого отношения к вашему бизнесу. И содержат лишь определенные наборы данных, зачастую крайне полезные наборы, но без учета специфики вашего бизнеса, применение их сильно ограничено.

    Одним из самых важных показателей качества вашей базы данных - будет качество изображений лица, эталонов.
    Самые важные показатели качества базы данных эталонных изображений:
    Количество пикселей
    Контраст и прорисовка деталей лица
    Фон, на котором находится основная часть лица
    Отсутствие мешающих деталей на области лица и т. д.

    Важно при этом еще и соблюдать более или менее одинаковые условия получения образов лиц (освещенность, размер самого лица на фоне всего образа).

    Эти показатели важно учесть еще на этапе проектирования системы в целом, отдельно уделяя большое внимание системе получения распознанных лиц эталонов.
    Начните создавать вашу базу данных уже сегодня!

    Использование биометрических баз данных
    Многие проявляют разумные опасения как по использованию биометрических данных государством так и еще большие опасения по поводу использования этих данных коммерческими структурами.

    И действительно эти опасения не лишены смысла, но они не должны останавливать внедрение технологии. В нашем недалеком будущем именно наша биологическая идентичность позволит отличить человека от искусственного интеллекта .

    Скрин с данными о количестве ботов и реальных людей посещающих веб сайты, исследование проведено компанией Imperva Incapsula


    Даже на данный момент количество ботов и реальных людей посещающих сайты примерно одинаково. С развитием интернета вещей и искусственного интеллекта количество ботов будет расти в математической прогрессии как и их возможности, уже существуют решения способные позвонить от вашего имени например в парикмахерскую или пиццерию.

    Области применения систем распознавания лиц

    Специфика применения технологии распознавания лиц отличается разной критичностью к ошибкам в зависимости от сферы применения.

    Системы контроля доступа

    Одно из наилучших применений систем распознавания лиц на данный момент именно в системах контроля доступа. Во первых сотрудник сам заинтересован в предоставлении ему доступа и не будет сознательно саботировать работу системы распознавания лиц. Во вторых вы контролируете, все внешние факторы влияющие на качество распознавания - освещение, фон, схема движения сотрудников. Использую все это вы можете создать идеальные условия.


    Системы распознавания лиц могут использоваться в системах контроля доступа в двух режимах:

    Режим идентификации - решение о допуске принимается на основе только данных от системы распознавания лиц. То есть, например база данных из ваших сотрудников 100 человек, и задача системы распознавания сравнить лицо текущего человека с базой данных в 100 человек. То есть сравнение происходит 100:1. Если человек будет идентифицирован как сотрудник, то ему будет предоставлен доступ.

    Терминалы распознавания лиц от HikVision

    Данный режим, эффективнее всего использовать в задачах обнаружения посторонних на контролируемой территории. Как правило есть смысл использовать в особо охраняемых зонах предприятия, куда доступ разрешен ограниченному кругу лиц. К системе распознавания подключаются все камеры установленные на данной территории в случае обнаружения любого лица, которое не содержится в базе данных происходит информирование службы безопасности.

    Режим верификации - идентификация в данном случае проводится с помощью другой технологии, например RFID (если вы консерватор), или может использоваться мобильные идентификаторы, или отпечатки пальца или венозный рисунок руки или пальца , если вы сечете куда ветер дует в современных тенденциях СКУД, и не хотите выкидывать деньги на ветер.
    Человек подносит карту к считывателю система его идентифицирует, то есть устанавливает что это Иванов, и Иванову разрешен доступ в данное время. Система распознавания лиц в данном случае уже знает, что это Иванов, и используя только фото Иванова из базы данных сравнивает, предъявителя RFID карты с фотографией Иванова в базе данных. То есть сравнение происходит 1:1.

    В режиме верификации работает вообще идеально, так как задача верификации очень простая даже для средних по качеству систем распознавания лиц.

    Данный режим целесообразно использовать на любых проходных - бизнес центры, производственные предприятия, институты, школы.

    Задача системы распознавания лиц - верифицировать держателя карты. Обычно эту задачу выполняет охранник или вахтер . И это не лучшая идея, если только вы не фольклорист, и не преследуете цели составить «энциклопедию современной культуры»


    У охранника на мониторе отображается фото человека при поднесении бесконтактной карты к считывателю, задача охранника сравнить фото и предъявителя карты (по науке это называется верификация). Охранником выполняется эта работа плохо - как и любая другая однообразная, рутинная, повторяющаяся работа.

    Система распознавания лиц не только гораздо эффективней выполнит эту работу, но и еще предотвратить злоупотребления со стороны охраны.

    Распознавание лиц в транспорте

    В транспорте распознавание лиц может применяться для нескольких целей:

    Поиск пропавших людей
    Поиск преступников находящихся в розыске
    Извлечение демографической информации людей для лучшего обслуживания
    Измерение удовлетворенности людей от их лиц
    Подсчет количества пассажиров, использующих общественный транспорт

    Данные о количестве пассажиров поступающие в режиме онлайн помогут быстрее, более гибко и эффективно управлять сетями общественного городского транспорта.

    Также подсчет количества пассажиров при сопоставлении этих данных с количеством оплат, позволит устанавливать нарушения правил оплаты проезда.

    Идентификация по лицу для целей оплаты проезда

    Распознавание лица для целей оплаты проезда может на данный момент вестись в режиме верификации, и позволит избегать несанкционированного использования многоразовых проездных билетов, например использованию одного проездного абонемента несколькими лицами.

    Использование распознанного лица как единственного идентификатора пассажира для автоматизированной оплаты проезда, на данном уровне развития технологий представляется возможным только в небольших корпоративных транспортных сетях, и никак не подойдет для массового общественного городского транспорта.

    Учет рабочего времени

    Еще недавно учет рабочего времени без использования преграждающих устройств, было недостижимой мечтой. Сегодня это реальность.
    Учет рабочего времени это конечно одна из функций системы контроля доступа, но учет рабочего времени может вестись и отдельно, только с помощью систем распознавания лиц.

    Одно из основных преимуществ, использования систем распознавания лиц для учета отработанного времени - это отсутствие требований к чистоте лица. В пределах разумного конечно - смотрите раздел «Саботаж».

    Также преимуществами учета рабочего времени с помощью системы распознавания лиц будут:

    Отсутствие преграждающих устройств, что конечно повышает комфортность
    Возможность использовать учет рабочего времени скрытно, без информирования сотрудников

    Учет рабочего времени всего лишь одна из метрик, и вообщем то сама по себе в отрыве от других данных по работе предприятия, мало, что говорящая. Но обладая всем объемом знаний она отлично встраивается в анализ эффективности работы компании.

    Особенно внимательно стоит следить за посещаемости в кризис, на это нам сам PricewaterhouseCoopers прямо указывает . Не будете следить за посещаемостью получите 2 дополнительных дня отсутствия на работе, о которых вы не узнаете, но которые вы оплатите. Что в 1,3 раза увеличит ваши финансовые потери от отсутствия сотрудников на рабочем месте.

    Распознавание лиц для целей учета рабочего может быть реализовано в двух видах.

    Сервер + софт + хорошие IP-камеры и все это за много денег. Царский вариант - когда учет рабочего времени может вестись без информирования сотрудников.

    Специализированные терминалы - это тот вариант когда сотруднику нужно подойти к терминалу, тем самым пройдя процедуру идентификации. Это работает только если вы объявили о том, что любому, кто не отметится в устройстве распознавания лиц - рабочий день оплачен не будет. Это простая административная мера как по волшебству сокращает количество ошибок FAR и FRR до абсолютного нуля.

    Распознавание лиц в толпе

    Говоря о системе распознавания лиц, как правило наше воображение рисует именно сценарии идентификации преступников на улицах города. Эта самая желанная самая востребованная, и самая сложная на данный момент задача.

    Поиск пропавших людей в Китае с помощью системы распознавания лиц

    Сложности
    Неравномерное освещение (день, ночь, светящее солнце, все это разные условия которые будут сильно влиять на процент распознавания лиц)
    Большое количество людей в кадре

    Плюсы
    Эффект неожиданности
    Распознавание лиц хоть и перспективная технология о которой очень много пишут, но пишут в специализированных «гиковских» изданиях. Следовательно количество людей которые вкурсе - микроскопическое, в масштабе общего количество населения. Большинство преступников просто не будут совершать действия препятствующие идентификации.

    Сеть покрытия
    Камер видеонаблюдения в большинстве больших городов очень много. Именно этот аспект будет вносить свою коррективу в работу системы распознавания лиц. Например в Великобритании человек за день попадает в объектив видеокамеры около 300 раз. И это не рекорд, и не предел при текущей низкой стоимости IP-камер.

    Определение возраста

    От задач безопасности переходим к задачам маркетинга. Когда говорят об присоединении отрасли «Систем безопасности» к большой отрасли IT имеют ввиду именно это - с помощью оборудования которое раньше считалось способным решать только проблемы безопасности. Сегодня решаю гигантский спектр разных задач, не имеющих отношения к «Системам безопасности» как таковым.

    Возрастной состав посетителей бесценная информация для любого маркетолога, и если верить нашему министру здравоохранения, которая заявила , что средняя продолжительность жизни может вырасти до 120 лет, правда госпожа Скворцова не уточнила в какой стране это произойдет, что очевидно выдает в ней умного человека. (я лично верю, что в России), так или иначе актуальность задачи определения возраста точно будет возрастать.

    Онлайн сервисы для определения возраста
    Насколько точным будет определение возраста, вы можете протестировать на нескольких онлайн сервисах. Загружайте свои фото и тестируйте.

    Для целей определения возраста вам подойдет:

    Программное обеспечение для распознавания лиц www.axis.com/products/axis-demographic-identifier/

    Определение пола

    Если вы не собираетесь анализировать пол участников Евровидения, для современных систем распознавания лиц это достаточно простая задача.

    Не нужно быть великим маркетологом, чтобы понимать, что разный гендерный состав ваших покупателей требует разной маркетинговой, рекламной, PR и любых других стратегий связанных с взаимодействием с клиентами.

    Сети кинотеатров «Синема парк» и «Формула кино» уже запустили сбор возраста и пола своих посетителей.

    Насколько точным будет определение пола вы можете протестировать по уже знакомым вам онлайн сервисам. Загружайте свои фото и тестируйте.

    www.skybiometry.com/demo/face-detect/
    www.how-old.net

    Для целей определения возраста вы можете использовать:
    Программное обеспечение для распознавания лиц, во многих случаях это одна из его функций.

    Готовые решения от Axis, HikVision - Смарт видеорегистратор + IP-камеры

    Швеция
    AXIS Demographic Identifier
    https://www.axis.com/products/axis-demographic-identifier/


    Подсчет уникальных посетителей

    Классическую задачу подсчета количества посетителей, всегда решали инфракрасными или лазерными датчиками, которые просто показывают количество пересечений виртуальной линии. Например тележка будет давать отдельное пересечение, пользы от них, как от показателя средней температуры по больнице .

    Есть современные комплексы видеоаналитики, как правило совмещенные с дополнительными датчиками. Они уже умеют считать конкретно людей, но вас же охранник, или местный городской сумасшедший, 50 раз прошедший туда - обратно, может свести данные практически к полной бесполезности.

    Впервые, благодаря современным системам распознавания лиц маркетологи могут получать по настоящему полезные данные - количество уникальных посетителей . А в купе с показателями пола и возраста - это Яндекс метрика для вашего магазина.

    Trassir Face Analytics модуль анализа лиц - цена 36 990 рублей
    Интеллектуальный модуль анализа лиц. Функционал:
    1. подсчёт уникальных лиц
    2. демографический анализ лиц (пол, возраст)
    3. идентификация расы
    4. распознавание атрибутов лица (очки, головной убор, усы, цвет волос). Стоимость за обработку 1 видеоканала.

    Скоро в нашем блоге выйдет статья с обзором современный систем видеаналитики для магазинов, это будет бомба, подписывайтесь чтобы не пропустить - мы доступны на всех платформах -

В NtechLab в мае этого года вложился фонд Impulse, связанный с Романом Абрамовичем. А в VisionLabs инвестировал в 2016 г. венчурный фонд АФК «Система» Sistema VC.

По данным исследовательской компании MarketsandMarkets, которые приводит Bloomberg, к 2021 г. объем рынка распознавания лиц достигнет $6,84 млрд. В 2016 г. он был вдвое меньше – $3,35 млрд.

Мошенники не пройдут

Григорий Бакунов, занимающий в «Яндексе» должность директора по распространению технологий, создал сервис, проектирующий уникальный случайный макияж, позволяющий избежать идентификации. Об этом он сообщал в своем telegram-канале. Проект команды основывался на алгоритме, который на основе оригинальной фотографии подбирал новый образ по принципу «антисходства». Затем на основе полученного результата визажист составлял план макияжа, после чего он наносился на лицо модели. Но затем разработчик решил свернуть проект. Объяснил он этот шаг соображениями совести: «Слишком уж велик шанс использовать продукт не для добра, а вовсе с другими целями». Алгоритмы, которые тестировали этот макияж, уже устарели, а современные алгоритмы распознают лицо даже с таким макияжем, уверяет представитель VisionLabs.

Самое масштабное внедрение технологии распознавания лиц среди российских банков произошло у «Почта банка» (создан ВТБ и «Почтой России»), рассказывает генеральный директор компании VisionLabs Александр Ханин. Сейчас 50 000 рабочих мест сотрудников банка оборудованы специальными камерами, которые умеют распознавать лицо, рассказывает советник предправления «Почта банка» Павел Гурин. В банке есть три базы изображений – фотографии сотрудников, клиентов банка и мошенников. Каждая фотография хранится в зашифрованном виде, как набор символов. Перед началом работы с клиентами сотрудник должен войти в систему банка. Для подтверждения личности он не только вводит пароль, но и фотографирует себя. После этого специальная программа преобразует фотографию в код и сравнивает его с кодом, хранящимся в базе. Если они совпадают, сотрудник начинает работу. Систему распознавания лиц используют и для внутренней аттестации, чтобы один не проходил тесты за другого и чтобы никто не мог зайти под чужим паролем и провести незаконную транзакцию.

Когда приходит клиент, камера верифицирует его аналогичным образом. Кроме того, программное обеспечение сравнивает изображение клиента с базой мошенников. Она пополняется и собственными усилиями банка, и с помощью межбанковского взаимодействия.

Деньги по фотографии

У «Тинькофф банка» нет отделений. Но по закону представитель банка обязан провести личную встречу с клиентом, поэтому работники «Тинькофф» фотографируют его с помощью специального мобильного приложения, которое преобразует изображение в обезличенный код, рассказывает директор по коммуникациям «Тинькофф банка» Дарья Ермолина. Дальше система сравнивает код с базой данных. Это позволяет убедиться, что перед представителем именно тот человек, который подавал документы, и что он не мошенник, а также сократить время обработки заявки.

«Открытие» внедрило денежные переводы по фотографии с помощью технологии распознавания лиц, рассказал директор по инновациям банка «Открытие» Алексей Благирев. Для этого достаточно сфотографировать получателя в мобильном приложении или загрузить его фотографию – система сама найдет данные человека в базе, чтобы отправить ему деньги.

Распознавание в цифрах

1,5 млрд руб.
общая сумма кредитов, которую «Почта банк» не выдал мошенникам благодаря использованию технологии распознавания лиц
70%
правонарушений (включая нарушения на дорогах) раскрывается с помощью систем видеонаблюдения в Москве
1 млрд фотографий из базы способен в режиме реального времени распознавать алгоритм российского стартапа NtechLab
117 млн человек – их фотографии есть в полицейской базе распознавания лиц США, это примерно половина взрослых американцев

Сбербанк в июле установил в Москве тестовый банкомат, где для совершения операций со счетом нужно только сфотографироваться, а не прикладывать пластиковую карту, рассказал представитель банка. Эксперимент продлится до конца 2017 г., после чего банк решит, внедрять ли технологию дальше. «Тинькофф банк» также сообщил о тестировании идентификации клиентов в банках.

Сбербанк использует технологию распознавания лиц при выдаче кредитов с 2014 г.

Прививка от очередей

В ритейле распознавание лиц используется, чтобы мотивировать покупателей, говорит генеральный директор компании NtechLab Михаил Иванов. Если человека узнают на входе в магазин и видят его историю покупок, то сотрудники магазина лучше знают, что ему предложить, объясняет Иванов. Например, если он покупал в магазине электроники телевизор, сотрудник его узнает, обратится по имени и предложит приобрести новый пульт.

В «Дикси» тестировали распознавание лиц клиентов для определения гендерного состава клиентов и для таргетированной рекламы в кассовой зоне и торговом зале, говорит директор IT-департамента ГК «Дикси» Владимир Муравьев. В X5 Retail Group технологию распознавания лиц используют пока в тестовом режиме – чтобы уменьшать длину очередей на кассах и для оптимизации торгового пространства. Система распознавания лиц может определить, сколько человек стоит в очереди, и отправить сигнал о том, что необходимо открыть дополнительную кассу. Видеоаналитика помогает проследить, где в магазине проходит больше людей, на что они обращают внимание, чтобы потом правильно расположить товары и промоматериалы.

Зона повышенной безопасности

Самый развитой мировой рынок технологии распознавания лиц – в сфере безопасности, говорит Иванов. В США лицевая биометрия широко внедрена на государственном уровне и используется сотрудниками полиции – в том числе и для проверки при выдаче водительских прав, рассказывает он. Кроме того, США и Европа используют идентификацию по лицу на паспортном контроле при пересечении границы.

Российские компании также предлагают использовать технологию распознавания лиц в сфере безопасности. Так, среди основных клиентов отечественной компании «Центр речевых технологий» – крупные стадионы. Когда болельщик приходит на стадион и прикладывает к валидатору именной абонемент, камера над валидатором подтверждает, что войти на стадион пытается именно владелец абонемента. Система не позволяет войти на спортивный объект людям из черного списка фанатов. Также «Центр речевых технологий» внедрил технологию распознавания лиц в аэропорту Южно-Сахалинска: когда туда заходят люди, которые находятся в розыске, система отправляет уведомление полиции и службе безопасности аэропорта.

Компания Magic Ашота Габрелянова запустила игру, в которой для управления используется мимика пользователя, рассказал сам Габрелянов на своей странице в Facebook. В первой версии игры пользователю нужно уничтожать злых персонажей четырех разных цветов с помощью оружия, которое управляется мимикой – она распознается с помощью нейросетей. Например, для использования желтой пушки нужно изобразить радость, для красной – сделать рассерженное лицо.

NtechLab также разрабатывает продукт в области безопасности, который нужен госструктурам и спецслужбам: это софт, который находит людей по доступным базам, работает с их документами.

Большое будущее

В ближайшие годы технологии анализа лиц будут развиваться в двух направлениях, считает Ханин. Первое – переход к пониманию поведения человека: сейчас уже мало понимать, кто изображен на фотографии, важно знать, как человек себя ведет в разных ситуациях, например на собеседовании или при посадке на рейс. Второе направление – это встраивание чипов с компьютерным зрением в устройства, чтобы они смогли не только идентифицировать пользователя, но и проанализировать потоковое видео. Например, показать, когда конкретный человек заходил в помещение, или построить 3D-аватар прямо в телефоне.

Благодаря технологии распознавания многие удивительные вещи станут реальными: человек только посмотрит на чайник – и он автоматически нагреет воду, говорит Иванов.

Видеть - значит понимать увиденное. Мы слепы, если в нашем мозгу не работают зрительные зоны неокортекса - своеобразного биокомпьютера, ответственного за распознавание образов. Сейчас подобные анализаторы, способные узнавать лица и понимать их выражение, появляются у искусственных систем.

Итак, вещи обретают зрение, а у зрения есть собственный разум. Сначала мне кажется, что он туповат: только что включенная система распознавания лиц LUNA не торопится войти в штатный режим и запомнить меня. Но вот наконец она рапортует, что запомнила, и просит ввести имя. Пол и возраст LUNA может определить сама. С полом легко: у меня борода, а вот возраст система завысила на пять лет - видимо, из-за той же бороды.

Теперь камера узнает меня, даже если я снимаю очки или поворачиваю голову. Приходится попробовать средство посерьезней - мы направляемся к шкафу с париками и накладными усами. Я выбираю густые кудри, скрывающие к тому же пол-лица, - LUNA все равно узнает меня.

Наигравшись с париками, мы открываем ICQ и начинаем развлекаться с масками для видеозвонков: на мое цифровое лицо в реальном времени накладываются маски - можно неузнанным общаться в видеочате.

Следующий номер нашей программы - Face.DJ. Это приложение строит 3D-модель лица по селфи, а потом "надевает" это лицо на виртуальную голову, чтобы вы могли примерять прически и аксессуары. Другое назначение приложения - анимировать пользователя, создать его мультяшную копию для игр и прочих онлайн-занятий.

Мы готовим такое же приложение для сервиса знакомств: люди при первом контакте часто не хотят раскрываться, - рассказывает Юля, пиарщик компании VisionLabs, разработавшей LUNA. - Некоторые надевают маски, чтобы добавить в романтическое общение элемент игры.

У кросс-платформенной системы LUNA тоже много масок. Есть приложение в мессенджере Telegram, которое распознает пол и возраст по лицу, есть LUNA в облаке и LUNA для браузера. Но главное - эту программу можно внедрять в самые разные технологические продукты, чтобы использовать для распознавания лиц.

Например, одному из наших клиентов нужно выбирать фотографии - так называемый bestshot из видеопотока. Так вот, наша программа справляется с этим сама. Другому клиенту нужно, чтобы система распознавала лицо не только при входе в интернет-банк, но и на протяжении всего сеанса, потому что вы можете отойти, а вашим доступом воспользуется злоумышленник. С этой задачей мы тоже справились.

Главные клиенты VisionLabs - банки. Например, в "Почта Банке" системой LUNA оборудованы 50 тысяч рабочих мест - это самое большое внедрение биометрии в мире. Важно распознавать и лица клиентов, чтобы сравнивать фотографии в паспортах с фото в базе данных. Ведь самое распространенное мошенничество в этой сфере - вклейка своего фото в чужой паспорт для получения кредита.

Как видят машины

К нам подходит Александр Ханин, директор VisionLabs.

Расскажите о компьютерном зрении?

Александр Ханин: Компьютерное зрение - это область прикладной математики, которая по сложности эквивалентна задаче создания искусственного интеллекта в целом. Визуальный канал основной для получения информации об окружающем мире. И доверяем мы увиденному своими глазами больше, чем другим источникам.

Наша задача - научить программу по фотографии или видео делать выводы и понимать картинку так же, как человек. Или даже лучше. Вот когда машина сравняется с человеком в этом умении, можно будет считать, что задача решена. Пока же она решена лишь для некоторых узких прикладных областей. Например, для распознавания дефектов оборудования или распознавания лиц.

Задача распознавания лиц решена?

Александр Ханин: Да, уже сейчас достоверно показано, что машина различает лица лучше нас. И точнее, и быстрее. Человек не очень хорошо определяет возраст, национальность. Тот, кто живет в Европе, хуже различает лица людей с азиатской внешностью, и наоборот. Еще мы забывчивы. В довершение всего машина делает это в десятки миллионов раз быстрее.

Зато человек анализирует не отдельные параметры, а лицо и даже ситуацию в целом. Мы понимаем контекст, в котором лицо собеседника принимает то или иное выражение. Как машина со всем этим справляется?

Александр Ханин: Сочетая лучшие методики компьютерного зрения и машинного обучения. Взять, например, метод глубокого обучения - его особенность в том, что человек не задает параметры лица для распознавания.

Нейросеть программирует сама себя?

Александр Ханин: Нейросети появились еще в 1970-х, а революция в этой области началась примерно в 2013-2014-м. Потому что только к этому времени удалось накопить достаточно большие объемы данных , чтобы учить нейросети, а вычислительные мощности стали относительно дешевыми. Продолжать разрабатывать детерминированные методы распознавания - указывать, какие части лица как сравнивать, - стало бессмысленно.

Прорыв произошел, когда отказались от заданных параметров, например от ключевых точек на лице. Вместо этого машине поставили задачу: "Смотри, вот десять тысяч пар фотографий, каждая пара - один человек. Проанализируй их, чтобы суметь определить на фото, которые ты пока не видишь, где один человек, а где разные". Машина сама находит параметры, которые важны для решения этой задачи.

Вы именно так обучали свою систему?

Александр Ханин: Ну да, это типичная задача идентификации - сравнить фотографию, сделанную сейчас, с фото в паспорте и подтвердить, что это один и тот же человек. Мы давали машине на вход большие данные - миллионы пар фотографий, а на выходе требовали правильного ответа для любых фотопортретов. И система училась - сама настраивала параметры так, чтобы минимизировать ошибки. То есть для глубокого обучения сначала надо найти обучающую выборку - много примеров правильных решений. Потом программа работает уже сама.

Где же вы взяли эти миллионы пар фотографий?

Александр Ханин: Есть доступные обучающие выборки для исследователей - сначала мы использовали их, а дальше уже работали с партнерами и клиентами, которые разрешили продолжить обучение на их данных.

Как преуспеть на рынке

Задача распознавания людей по лицу решена. А как обстоит дело с определением эмоций?

Александр Ханин: Как, например, в африканских странах люди миновали стадию телеграфа и сразу перешли на мобильную сеть, так и мы, не решая задачу распознавания эмоций, сразу перешли на более высокий уровень - к выводам о важных для наших клиентов характеристиках человека. Бизнес показывает: от того, что машина распознает, улыбается человек или нахмурен, пользы никакой. Нужны более серьезные умения.

Распознавать ложь, например?

Александр Ханин: Да. Или определять, соответствует кандидат вашим требованиям или нет. Удовлетворен клиент обслуживанием или нет - улыбка ведь может выражать не только радость, но и насмешку и скрытое недовольство. Поэтому само по себе распознавание эмоций - это подзадача. Мы изучаем лицо в динамике, последовательность реакций на вопросы, обслуживание, обстановку.

Есть ли в мире инновационные продукты, на которые вы ориентируетесь?

Александр Ханин: Мы сами на переднем фланге. Медицинский факт, что наш продукт - первая в мире комплексная система распознавания лиц для банков и ретейла, которая работает и в мобильном телефоне, и на сайте, и в отделениях, и в банкоматах, и в терминалах самообслуживания - везде. Мы не только первые, но пока, насколько я знаю, единственные.

В каких-то терминалах самообслуживания уже установлена система распознавания лиц?

Александр Ханин: Да, например, в банке "Открытие" - в терминалах электронной очереди. И это не пилотные проекты, а такие, которые работают и удовлетворяют заказчиков в реальных условиях.

Чувствуете, как конкуренты дышат в спину?

Александр Ханин: Пилотных проектов в близких к нам областях много. Компаний, которые занимаются распознаванием лиц, только в России десятки, в Китае - около сотни, в мире - больше тысячи. Поэтому я и говорю, что сама по себе задача распознавания лиц решена, - во всяком случае для большинства сегментов и практических задач.

Для успеха на рынке важны не технологии. Большинству клиентов плевать, какая у нас технология и как именно мы решаем задачу, допустим, по ускорению обслуживания в банке или магазине, - с помощью распознавания лиц, прогноза погоды или черной магии. Им важно, чтобы был результат.

Распознать всех!

Какие задачи еще не решены, но будут - в обозримой перспективе? Над чем работают специалисты?

Александр Ханин: Одна из важнейших нерешенных задач - распознавание лиц в полностью неконтролируемой обстановке, например в толпе. Многие говорят, что умеют это делать, но по факту ничего такого пока не внедрили. Видимо, напрасно говорят.

Разве узнавать случайных людей по лицам не запрещено законом? Это ведь использование персональных данных.

Александр Ханин: Бизнесу запрещено, конечно. Это нарушение прав человека и вмешательство в частную жизнь. Вообще, технологии сейчас позволяют сделать гораздо больше, чем разрешает законодательство. Но мы работаем только в белой зоне - в полном соответствии с законом. Для нас важно не нарушать права людей. Мы не имеем права использовать без согласия человека его данные из соцсетей и поэтому не станем делать, например, для магазина систему, которая ищет информацию о клиенте по его фотографии. Но мы можем разработать программу, которая будет приблизительно оценивать пол и возраст покупателей по фото.

Наша компания работает только с бизнесом, а вот у служб национальной безопасности есть системы, которые ищут людей по фотографии.

То есть ФСБ можно, а обычным людям нельзя?

Александр Ханин: Да. Если спецслужба хочет найти террориста в толпе, ей нужно сканировать и распознать всех. А если человек зашел в магазин и программа по фотографии нашла его аккаунт в соцсети, узнала телефон и начала рассылать спам, это очень серьезное нарушение. На Западе за это предусмотрена уголовная ответственность.

В аэропортах уже есть системы распознавания лиц?

Александр Ханин: Да, в основном на паспортном контроле - они проверяют, ваш ли это паспорт, не поддельный ли и не числитесь ли вы в списке заблокированных или в федеральном розыске. За рубежом степень автоматизации значительно выше. В аэропортах Сингапура, Лондона, Парижа паспортный контроль можно проходить автоматически, без участия сотрудников. Вы сканируете свой паспорт, вас фотографируют, происходит сверка - и все, можно идти дальше.

Угадай, что на картинке

Как будет развиваться компьютерное зрение?

Александр Ханин: Есть большая группа задач, именуемых visual question answering: вы показываете компьютеру картинку, и он должен понять, что там изображено. Это очень сложно: если просто учить распознавать объекты по отдельности, ничего не получится - надо понимать контекст и взаимосвязь объектов.

Другая похожая задача - распознавание действий человека, они ведь тоже определяются во многом по контексту. Например, если человек поднял руку, что это значит? Он указывает дорогу или собирается кого-то ударить? Вот сидим, думаем.

То есть вы хотите научить машины распознавать образы, смысл которых зависит от контекста?

Александр Ханин: Научить интерпретировать контекст и таким образом распознавать картинки, действия, сцены.

Когда роботы прозреют

Александр Ханин: Хотелось бы, чтоб разработку компьютерного зрения довели до конца. Тогда у роботов появятся настоящие глаза, а значит, возможность понимать происходящее и адекватно реагировать. Иначе они не станут частью общества, а так и будут игрушками с пультами управления.

Как системы, распознающие лица, изменят нашу жизнь в ближайшие годы?

Александр Ханин: Вы совершенно точно заметите работу таких систем при авторизации - например, когда будете разблокировать телефон. Многие уже привыкли к Touch ID, но скоро самым распространенным способом станет вхождение в систему по лицу. Приходя домой, вы не будете искать ключи, на работе вам не понадобится пропуск. Ускорится обслуживание и самообслуживание в банках, магазинах, во всей сфере услуг: расчеты будут происходить без карточек.

На улицах станет безопаснее, потому что появится видеонаблюдение с функциями отслеживания. Города и страны получат дополнительную защиту, а возмездие за преступление станет неизбежным. Система будет фиксировать все: кто и где это сделал, куда потом пошел. На смену понятию "безопасный город" придет "умный город": одна и та же инфраструктура будет обеспечивать безопасность и, например, управление потоками людей и машин, а также много чего другого.

Одна и та же система установленных повсюду камер и компьютерного зрения?

Александр Ханин: Да, алгоритму без разницы, кого распознавать: вип-клиента или воришку. Лица у всех устроены одинаково: глаза, рот и нос. Но дело не только в лицах. Эта же система может заняться, скажем, регулированием освещения. Если в помещении нет людей, зачем жечь электричество? Машина вызовет коммунальные службы, если зафиксирует неполадки, и так далее.

Жить в мире, где все на виду, страшновато. Технически все проще становится построить антиутопию, где за всеми ведется тотальная слежка…

Александр Ханин: Я думаю, в итоге мир станет лучше и намного безопаснее. Но обманывать будет труднее. Например, мы с партнерами недавно разработали продукт, который не только дает доступ в рабочее помещение, но и учитывает проведенное там время: пришли во столько-то, ушли во столько. Прогуляли, опоздали, не вернулись с обеда - все будет зафиксировано.

И никак нельзя будет от этого спрятаться? Наверняка появятся маски с чужим лицом.

Александр Ханин: Безусловно, есть масса способов обмануть систему, и в этой области "гонка вооружений" только начинается. Был такой видеоролик, где учили делать макияж, препятствующий распознаванию. Но то было года три назад - нынешние алгоритмы так просто не проведешь.

А если вместо лица показывать фотографию?

Александр Ханин: Чтобы вычислить мошенников, в системах распознавания лиц программируют специальный "детектор живости" (lifeness detector), который определяет, человек перед ним или фотография. Показателей живости несколько. Самый простой, который считается мировым стандартом, - это моргание. Еще система может попросить человека улыбнуться, повернуть голову, приблизиться к камере, чтобы убедиться, что он реальный. Но если камера оснащена сенсором глубины, это не требуется: машина сразу понимает, что в кадре объемный объект, а не фото.

Кто еще в лидерах

Распознавание лиц - это не только наука и технология, но и большой бизнес, который в развитых странах растет огромными темпами. Исследовательская компания Allied Market Research прогнозирует, что к 2022 году его оборот составит почти десять миллиардов долларов. Среди ведущих игроков есть и российские. Из десятков стартапов и исследовательских проектов мы выделили три самых успешных.

NTechLab. Выпускник МГУ Артем Кухаренко начинал с приложения, определявшего породу собак по фотографии. Но уже в 2015 году созданный им с партнерами по проекту NTechLab алгоритм FaceN одержал победу в двух из четырех номинаций главного мирового конкурса по распознаванию лиц MegaFace, обойдя команду Google. Однако настоящая слава пришла к компании после разработки популярнейшего приложения FindFace, предназначенного для поиска по фото людей в соцсети "ВКонтакте". Сегодня число заявок на интеграцию технологии FindFace приближается к тысяче.

Vocord. Компанию "Вокорд" можно смело считать чемпионом мира по распознаванию лиц: на сайте конкурса MegaFace она занимает первое место, лидируя с солидным отрывом. Команда "Вокорд" - ветераны на рынке систем компьютерного зрения: программу дистанционного биометрического распознавания лиц Vocord FaceControl они выпустили еще в 2008 году, сегодня их продуктами пользуются больше двух тысяч коммерческих и государственных организаций. Специализация компании - идентификация лиц, то есть поиск человека в толпе.

VisionLabs. Их продукты входят в тройку лучших мировых коммерческих систем распознавания лиц. Подробнее об этой компании читайте в основном тексте.

Основные виды биометрии

Международная классификация способов идентификации человека

Лицо. Программа по фото или видеоизображению лица анализирует размер и форму глаз, носа, скул, их взаиморасположение и на основе этих данных создает уникальную комбинацию, которую затем сравнивает с имеющимися на предмет совпадения.

Отпечатки пальцев. Дактилоскопический метод основан на неповторимости папиллярного рисунка кожи, широко применяется в криминалистике.

Речь. Способ распознавания, основанный на преобразовании звучащей речи в цифровую информацию.

Глаза. Распознавание происходит в результате сравнения цифрового изображения радужной оболочки глаза с имеющимися в базе.

Вены. Способ идентификации на основе венозного рисунка руки или пальцев.