Блог DFCenter

Домашние поделки для нужд КИИ

Только мы написали, какие теоретически риски могут приключиться при обнаружении в вашем ПО кусков недружественного кода, как тут уже реализация в практику подоспела. Конечно, не совсем один в один, но направление то же.

Пишут тут в отдельных новостных тг-каналах (с аудиторий под 500 тыс.), что, мол, для проверки результатов всяких там аттестационных экзаменов кое-где у нас порой «используется ПО, связанное с недружественным разработчиком». А именно – программа распознавания символов IXORA TestReader. Которая, вроде как, через 10 прокси принадлежит-таки ни больше ни меньше той самой ABBYY, что основал многонациональный IT-предприниматель Давид Евгеньевич Ян. С которым связано еще много всяких историй, но это уже не тематика нашего канала.

Утка это или целый лебедь – мы не знаем, но попробуем посмотреть на это с точки зрения «а что если там и впрямь что-то есть?».

Так вот. Эта самая Ixora TestReader (при рождении возможно что ABBYY TestReader) – это «решение для оперативного распознавания и проверки распознанных символов, оформленных рукопечатным шрифтом на бланках стандартизированной формы в рамках проведения и обработки материалов Государственной итоговой аттестации по образовательным программах основного общего и среднего общего образования (ЕГЭ, ОГЭ, ГВЭ)». Тут все сходится.

Читаем сайт компании дальше. И выясняем, что Ixora TestReader включена в Единый реестр российских программ для электронных вычислительных машин и баз данных по классу «Информационные системы для решения специфических отраслевых задач». Ну то есть ее проверяли по всяким там критериям отечественности, код смотрели и т.д. И по итогам проведения всего этого – есть справка, что прога наша, отечественная. Так что все нормально, можно не переживать.

Тут правда генеральный директор ABBYY Россия (когда была такая компания) еще в далеком 2019м рассказывал, что, во-первых, разные их продукты работают не только в РЖД, Альфа-Банке, Сбербанке, Перекрестке, М.Видео, Ozon.ru, Вкусвилле, но и примерно во всем остальном российском enterprise-сегменте. Да и в G-сегменте тоже. Но это, скажите вы, пугалка-банальщина уровня Капитана О. Но вы погодите, это присказка.

Во-вторых, почти все их продукты уже завязаны на ИИ, который наверняка глобальный, с трансграничной передачей. Ну потому что вряд ли кто-то стал бы строить локальный российский ИИ в этом случае. Само собой этот ИИ с обучением на всех имеющихся у него данных. Потому, что все так делают, что бы ни писали в своих Privacy Policy.

А в-третьих, в их партнерских сетях больше 170 компаний, в том числе с разработчиками технологий. Это, «например, все крупнейшие производители систем по защите от утечек данных (DLP). Технологии ABBYY в составе DLP-систем позволяют предотвращать утечки информации, переданной в виде изображений: сканов, фотографий и скриншотов конфиденциальных документов». А дальше он, директор, упоминает таких партнеров, как Логика бизнеса, ЛАНИТ, ЭОС, VisionLabs и т.п.

Что стало с компонентами ABBYY в продуктах этих отечественных компаний и чем они заменены нам найти не удалось. Надеемся, что только потому, что искали мы не очень усердно, и все там хорошо и правильно.

Но и это еще не все. ABBYY ладно, у них хоть и заморское, но зато работает как обещано. А то вот тут пишут, случай был. Проводилась оцифровка технического архива Калининской АЭС, которая включала «4 млн листов проектной, рабочей и исполнительной документации». Делала все это компания «Биорг» – российский разработчик сервиса для оцифровки документов, распознавания изображений, идентификации личности (KYC), резидент «Сколково». Ну то есть, считай, отечественный ABBYY практически.

Звучит прекрасно, технологично и инновационно. А потом выяснилось, что это очередная реинкарнация механического турка – для обработки документации на объекте КИИ Биорг использовал свою же краудсорсинговую платформу HomeOperator, где живые люди-пользователи обрабатывали изображения этих документов ручками на своих домашних ПК. К слову, сумма контракта составила 650 млн. рублей. Там вообще много чего интересного в этом кейсе, судя по всему.

Вот и думай, как тут и пройти меж двух этих крайностей. Хотя может это и не крайности, а что-то другое, как-то между собой все связывающее.