Введение
На фоне стремительного роста мирового рынка биометрии технология распознавания радужной оболочки глаза, обладающая уникальными преимуществами высокой точности и безопасности, становится предпочтительным решением для ключевых сценариев, таких как финансовые платежи, пограничная безопасность и умные города. Согласно прогнозам исследовательских институтов, мировой рынок распознавания радужной оболочки глаза вырастет с 5,14 миллиарда долларов США в 2025 году до 12,92 миллиарда долларов США в 2030 году, со среднегодовым темпом роста (CAGR) в 20,3%.
Рисунок 1: Тенденция роста мирового рынка распознавания радужной оболочки глаза (прогноз на 2025-2030 гг.)
В этот критический момент индустриальной трансформации компания Homsh Technology успешно совершила скачкообразное обновление технологии распознавания радужной оболочки глаза от традиционной парадигмы к парадигме искусственного интеллекта благодаря двум основным патентам на изобретения — «Система и метод быстрого поиска радужной оболочки глаза на основе векторной базы данных» и «Метод непрерывного кодирования признаков радужной оболочки глаза на основе глубоких нейронных сетей» — заняв важную инновационную позицию в авангарде технологии распознавания радужной оболочки глаза в Китае и во всем мире.
Технический фон: узкие места традиционных методов и возможности в эпоху искусственного интеллекта
С момента коммерциализации технологии распознавания радужной оболочки глаза в 1990-х годах она долгое время полагалась на метод кодирования IrisCode на основе фильтров Габора. Этот метод извлекает признаки текстуры радужной оболочки глаза с помощью многомасштабных и многонаправленных фильтров Габора, квантует их в 2048-битные двоичные коды и использует расстояние Хэмминга для сопоставления. Однако эта традиционная парадигма сталкивается с тремя основными узкими местами: во-первых, фиксированные фильтры не могут адаптироваться к различиям в качестве разных изображений радужной оболочки глаза; во-вторых, двоичное кодирование вызывает значительную потерю информации, что приводит к частоте равных ошибок (EER) всего около 1,75% в стандартном тестовом наборе CASIA-Iris-Lamp; в-третьих, скорость поиска в больших базах данных (более миллиона уровней) низкая, что затрудняет удовлетворение потребностей приложений реального времени.

Рисунок 2: Сравнение парадигм технологии распознавания радужной оболочки глаза — традиционное кодирование IrisCode против непрерывного кодирования признаков глубокого обучения
С развитием технологии глубокого обучения и накоплением масштабных наборов данных распознавание радужной оболочки глаза открыло окно возможностей для смены парадигмы от «ручных признаков» к «сквозному обучению». Недавние академические исследования показали, что методы распознавания радужной оболочки глаза на основе глубоких нейронных сетей продемонстрировали потенциал, превосходящий традиционные методы. Например, передовая академическая модель IrisFormer может достичь EER 0,88% на том же наборе данных. Однако то, как преобразовать академические достижения в инженерно-реализуемые технические решения с промышленной конкурентоспособностью, является общей проблемой, с которой сталкивается отрасль.
Технические инновации: два патента сотрудничают для создания комплексного решения на основе искусственного интеллекта
Два основных патента, выпущенные Homsh Technology на этот раз, систематически решают технические узкие места традиционного распознавания радужной оболочки глаза с двух сторон — «представление признаков» и «эффективность поиска», формируя полный технический замкнутый цикл от кодирования на переднем плане до поиска на заднем плане.
Рисунок 3: Совместная архитектура с двумя патентами Homsh Technology — сквозная система распознавания радужной оболочки глаза
Патент 1: Метод непрерывного кодирования признаков радужной оболочки глаза на основе глубоких нейронных сетей
Этот патент инновационно сочетает эффективную архитектуру сверточной нейронной сети EfficientNet-B3 в области компьютерного зрения с функцией потерь угловой маржи ArcFace в области распознавания лиц, впервые реализуя сквозное глубокое обучение кодированию признаков радужной оболочки глаза. Его основные инновации включают:
1. Адаптивное извлечение признаков: благодаря стратегии составного масштабирования (трехмерное сбалансированное расширение глубины, ширины и разрешения) и эффективным модулям MBConv (инвертированная остаточная структура + механизм внимания squeeze-and-excitation) EfficientNet-B3 обеспечивает высокодискриминантное извлечение признаков текстур радужной оболочки глаза при ограничении всего 12,14 миллионами параметров. По сравнению с фиксированными фильтрами Габора модель может автоматически изучать оптимальное представление признаков.
2. Непрерывное кодирование признаков: преодолевая ограничение двоичной квантизации традиционного IrisCode, он выводит 512-мерные непрерывные векторные признаки float32 с информационной емкостью 16 384 бита (в 8 раз больше, чем у IrisCode). Пространство признаков обновлено с дискретного пространства Хэмминга до непрерывного евклидова пространства, что позволяет более точно измерять сходство.
3. Оптимизация угловой маржи ArcFace: в нормализованном гиперсферическом пространстве признаков добавление угловой маржи в 10° принуждает к агрегации внутри класса и разделению между классами, уменьшая угол между векторными признаками радужной оболочки глаза одного и того же человека и увеличивая угол между разными людьми, значительно улучшая различимость признаков. Экспериментальная проверка показывает, что по сравнению со стандартной функцией потерь Softmax, ArcFace снижает EER на 45,4%.
4. Сбалансированная выборка пакетов по классам: чтобы решить проблему неравномерного количества образцов среди разных людей в наборах данных радужной оболочки глаза, разработана инновационная стратегия сбалансированной выборки по классам. Каждый обучающий пакет содержит 16 классов с 8 образцами в каждом классе, гарантируя, что функция потерь ArcFace может полностью изучать границы между классами, ускоряя сходимость на 30% по сравнению со случайной выборкой.
Патент 2: Система и метод быстрого поиска радужной оболочки глаза на основе векторной базы данных
Этот патент впервые в мире применяет технологию векторной базы данных FAISS (Facebook AI Similarity Search) в области распознавания радужной оболочки глаза, реализуя поиск за миллисекунды в базе данных из одного миллиона человек и обеспечивая ключевую техническую поддержку для применения систем распознавания радужной оболочки глаза в реальном времени. Его основные инновации включают:
1. Построение векторного индекса FAISS: после L2-нормализации 512-мерных векторных признаков радужной оболочки глаза, извлеченных методом глубокого обучения, для хранения используется тип индекса IndexFlatIP FAISS. Этот тип индекса основан на поиске сходства по внутреннему произведению, что эквивалентно косинусному сходству нормализованных векторов. По сравнению с поиском методом грубой силы NumPy, он обеспечивает ускорение ЦП в 15,9 раз и ускорение ГП в 75,0 раз в базе данных масштаба 10 000 человек.
2. Интеллектуальная стратегия индексации: разработана инновационная многоуровневая архитектура индексации. Благодаря оптимизации распределения признаков и адаптивной кластеризации избегаются несоответствия и поддерживаются гибкие режимы распознавания, что значительно повышает точность распознавания и надежность системы.
3. Эффективный дизайн структуры данных: система хранит индексные файлы FAISS (.index.faiss) и файлы метаданных (.meta.json) отдельно. Индексные файлы напрямую отображаются в память для поиска ближайшего соседа, а файлы метаданных хранят бизнес-информацию, такую как идентификаторы персонала, время сбора и номера устройств. Задержка запроса контролируется в пределах 8,5 миллисекунд (режим ЦП).
4. Бесшовная интеграция моделей глубокого обучения: на переднем плане системы используется EfficientNet-B5 (112 МБ ONNX) для сегментации радужной оболочки глаза для извлечения области интереса; на заднем плане используется EfficientNet-B3+ArcFace (44 МБ ONNX) для извлечения признаков. Весь процесс оптимизирован сквозным образом от ввода изображения до вывода результата поиска, поддерживая режимы вывода как ЦП, так и ГП и адаптируясь к различным сценариям развертывания, таким как периферийные устройства и серверы.
Технические показатели: достижение мирового уровня
Строгие испытания на международном стандартном наборе данных радужной оболочки глаза CASIA-Iris-Lamp (573 человека, 11 845 изображений) показывают, что решение с двумя патентами Homsh Technology достигло следующих прорывных показателей:
Рисунок 4: Сравнение производительности распознавания радужной оболочки глаза (набор данных CASIA-Iris-Lamp)
1. Частота равных ошибок (EER): 0,70%. По сравнению с традиционным методом Габора + расстояния Хэмминга (EER 1,75%), частота ошибок снижена на 60%; по сравнению с предыдущим базовым решением Homsh Technology EfficientNet-B3 (EER 2,66%), частота ошибок снижена на 73,7%; по сравнению с передовой академической моделью IrisFormer (EER 0,88%), производительность улучшена на 20,5%, что обеспечивает лидирующую позицию мирового уровня в отрасли.
2. Точность распознавания (AUC): 99,97%, что указывает на то, что очень высокая частота правильного распознавания может поддерживаться даже при чрезвычайно низкой частоте ложного распознавания.
3. Скорость поиска: в базе данных масштаба 10 000 человек средняя задержка поиска составляет 8,5 миллисекунд в режиме ЦП FAISS с пропускной способностью 117,6 QPS; задержка поиска составляет 1,8 миллисекунды в режиме ГП с пропускной способностью 555,6 QPS. По сравнению с традиционным поиском методом грубой силы NumPy, он обеспечивает ускорение в 15,9 и 75,0 раз соответственно, полностью удовлетворяя потребности приложений реального времени.
4. Эффективность модели: модель извлечения признаков EfficientNet-B3 имеет всего 12,14 миллиона параметров, время вывода ONNX составляет 8 миллисекунд (ЦП) и занимает 1,8 ГБ памяти, поддерживая развертывание на периферийных устройствах и мобильных терминалах; посредством квантования INT8 размер модели может быть дополнительно сжат до 11,2 МБ, время вывода сокращено до 5 миллисекунд, а занимаемая память уменьшена до 0,5 ГБ.
Лидерство в отрасли: двойные инновации от микросхем ASIC до парадигм искусственного интеллекта
Homsh Technology обладает уникальным техническим опытом и инновационными генами в авангарде китайской технологии распознавания радужной оболочки глаза. Еще до 2020 года компания успешно разработала первую в мире микросхему ASIC, предназначенную для распознавания радужной оболочки глаза, преодолев узкое место аппаратного ускорения алгоритмов распознавания радужной оболочки глаза, увеличив скорость распознавания до миллисекундного уровня и заложив аппаратную основу для крупномасштабной коммерциализации технологии распознавания радужной оболочки глаза. Эта инновация дала Homsh Technology преимущество первопроходца в процессе индустриализации.
Вступая в эпоху искусственного интеллекта, Homsh Technology остро уловила возможность технологии глубокого обучения для реструктуризации парадигмы распознавания радужной оболочки глаза, решительно инвестировала в исследования и разработки и добилась обновления парадигмы от «традиционной обработки сигналов» до «сквозного глубокого обучения» в двух основных измерениях: методы кодирования и системы поиска. Выпущенное на этот раз решение с двумя патентами не только достигает мирового уровня EER 0,7% в технических показателях, но и, что более важно, реализует глобальное новаторское применение векторной базы данных FAISS в области распознавания радужной оболочки глаза, заполняя пробел в этом техническом маршруте. Это означает, что Homsh Technology завершила стратегическую трансформацию от «инноватора микросхем» к «лидеру парадигмы искусственного интеллекта», установив технологическую высоту в эпоху интеллектуального распознавания радужной оболочки глаза.
Потенциальные приложения: расширение возможностей интеллектуального обновления в нескольких областях
Благодаря своим техническим преимуществам высокой точности, высокой скорости и простоты развертывания, решение с двумя патентами Homsh Technology может широко применяться в следующих сценариях:
Рисунок 5: Сценарии применения решения с двумя патентами Homsh Technology
Финансовые платежи
Развертывание распознавания радужной оболочки глаза в банкоматах и терминалах мобильных платежей, сверхнизкий EER 0,7% обеспечивает безопасность средств, скорость распознавания 8 миллисекунд обеспечивает плавный пользовательский опыт, а одноглазый режим поддерживает пользователей, носящих очки.
Пограничная безопасность
Развертывание крупномасштабных систем распознавания радужной оболочки глаза в аэропортах и портах, векторная база данных FAISS поддерживает поиск за миллисекунды в базе данных из одного миллиона человек, а стратегия мультимодального слияния дополнительно повышает точность, эффективно предотвращая мошенничество с идентификацией.
Умные парки
Развертывание контроля доступа по радужной оболочке глаза в корпоративных парках и государственных учреждениях, квантованная модель INT8 поддерживает локальное развертывание на периферийных устройствах (машины контроля доступа, турникеты), обеспечивая распознавание в реальном времени без сети и обеспечивая конфиденциальность данных.
Здравоохранение
Интеграция распознавания радужной оболочки глаза в больничные системы HIS для точной привязки идентификационных данных пациентов к электронным медицинским картам, избегая путаницы, вызванной одинаковыми именами, и повышая безопасность медицинской помощи; создание уникального биометрического идентификатора при управлении новорожденными для предотвращения похищения детей.
Общественная безопасность
Развертывание распознавания радужной оболочки глаза в системах городского мониторинга в сочетании с оборудованием для сбора радужной оболочки глаза на больших расстояниях для реализации раннего предупреждения о мониторинге и контроле ключевого персонала. Режим вывода ГП поддерживает одновременный анализ в реальном времени.
Замечания генерального директора: д-р И Кайцзюнь, генеральный директор
Д-р И Кайцзюнь, генеральный директор Homsh Technology, заявил в интервью: «Успешная разработка этих двух патентов является результатом более чем десятилетнего технического опыта Homsh Technology и постоянных инвестиций в инновации. Мы глубоко понимаем, что в высококонкурентной области биометрии только овладев основными технологиями, мы можем оставаться непобедимыми. От инноваций в области микросхем ASIC до 2020 года до сегодняшних двойных прорывов в области глубокого обучения + векторной базы данных, Homsh Technology всегда придерживалась углубленной интеграции передовых технологий и промышленных потребностей. Показатель EER 0,7% — это не просто число; он представляет собой оптимальный баланс между «безопасностью» и «удобством использования», достигнутый системой. Для ключевых сценариев, таких как финансы и проверки безопасности, это означает более высокие гарантии безопасности и лучший пользовательский опыт.»
«Что еще более важно, мы первые в мире внедрили технологию векторной базы данных FAISS в область распознавания радужной оболочки глаза. Эта инновация открывает новые возможности для применения систем распознавания радужной оболочки глаза в реальном времени в больших масштабах. В будущем мы продолжим углублять наши усилия в области искусственного интеллекта + биометрии, продвигать применение технологии распознавания радужной оболочки глаза в большем количестве сценариев и вносить вклад Homsh в построение умного общества. Инновации бесконечны, и Homsh Technology продолжит лидировать в технологическом прогрессе отрасли.»
Перспективы: будущее интеллектуального распознавания радужной оболочки глаза
С непрерывным развитием технологии искусственного интеллекта и улучшением инфраструктуры, такой как 5G и периферийные вычисления, распознавание радужной оболочки глаза переходит от «специализированных сценариев» к «инклюзивным приложениям». Решение с двумя патентами Homsh Technology, обладающее выдающимися техническими характеристиками и инженерными возможностями, полностью готово к встрече с взрывным ростом рынка в следующем десятилетии. Компания продолжит инвестировать в ресурсы исследований и разработок и вносить непрерывные инновации в таких направлениях, как мультимодальное слияние (радужная оболочка глаза + лицо + отпечаток пальца), обнаружение живости и вычисления конфиденциальности, внося основной технический вклад в построение более безопасного, умного и удобного цифрового общества.
О компании Homsh Technology
Homsh Technology — ведущий поставщик технологий распознавания радужной оболочки глаза в Китае, специализирующийся на исследованиях, разработках и индустриализации алгоритмов, микросхем и систем распознавания радужной оболочки глаза. Компания владеет рядом патентов на основные технологии, включая первую в мире микросхему ASIC, предназначенную для распознавания радужной оболочки глаза, а ее продукция широко используется в таких областях, как финансы, безопасность и здравоохранение.