В последние годы технологический прогресс в области искусственного интеллекта (ИИ) достиг значительных высот, особенно в сфере распознавания и обработки текстовой информации. Примером такого прогресса является компания Dahua Technology, китайский гигант в области видеонаблюдения и решений для Интернета вещей (IoT), который доказал своё мастерство, заняв первое место в двух категориях международного конкурса ReCTS (Robust Reading Competition on Reading Chinese Texts on Signboard). Этот конкурс, ориентированный на распознавание китайских текстов на вывесках, подчеркивает важность способности ИИ адаптироваться к реальным условиям и изменяющейся среде.
Конкурс ReCTS, который проводится с 2011 года, стал важным событием в области исследований "Надежного чтения", занимающегося обнаружением и распознаванием текста на изображениях в самых разнообразных условиях. Эта дисциплина особенно важна, учитывая всё увеличивающееся количество текстовой информации, которое постоянно генерируется в современном мире. В 2021 году в рамках конкурса был представлен набор данных, содержащий 25 000 изображений, собранных в неконтролируемых условиях, что делает задачу особенно сложной. Из этого набора 20 000 изображений были предназначены для обучения, а оставшиеся 5 000 использовались для тестирования алгоритмов.
Dahua Technology проявила себя в двух ключевых задачах конкурса: распознавании отдельных символов и распознавании целых строк текста на вывесках. В первой задаче компания использовала технологию EfficientNet, адаптированную с разной глубиной и шириной для оптимального распознавания символов. Важную роль в успехе Dahua сыграло применение синтетических образцов, созданных собственными алгоритмами, и последующая обработка этих образцов с помощью методов сглаживания, вырезания и вращения. В результате, алгоритм Dahua показал точность в 97.73%, заняв первое место в этой категории.
Вторая задача требовала распознавания целых строк текста. Здесь Dahua использовала фреймворк CRNN с различными структурами многомасштабной магистрали извлечения функций, включая SAResNET. Ключевым аспектом в этой задаче стало многомодельное слияние для предсказания окончательных результатов. Обучение нейросети проводилось на основе данных не только от ReCTS, но и от других источников, таких как LSVT, RCTW и ART, а также с использованием высококачественных синтетических изображений. В этом тесте система Dahua демонстрирует результат в 96.93%, что также позволило компании занять первое место.
Достижения Dahua Technology в области искусственного интеллекта и машинного обучения не только подтверждают её лидирующие позиции в технологической индустрии, но и открывают новые возможности в реальных приложениях. Эти технологии могут быть использованы в широком спектре задач, от автоматического анализа содержимого изображений до улучшения систем видеонаблюдения и безопасности. Победа в тестах ReCTS является свидетельством не только технического мастерства компании, но и её стремления к инновациям и улучшению качества обработки информации в различных условиях. Это значимый шаг вперед в области искусственного интеллекта и его практического применения в повседневной жизни.