В разработке алгоритма, который по фотографии распознает текст, написанный шрифтом Брайля, для Ильи Оводова сошлись профессиональные навыки и личный интерес. Илья — специалист по компьютерному зрению и воспитывает слепую с рождения приемную дочь. Он стал лауреатом премии губернатора Подмосковья, а его разработка уже помогает общаться сотням людей. В интервью «Зеленоград.ру» Илья рассказал о своей разработке, нейронных сетях, ответственности за развитие технологий и как важно оставлять в жизни хорошие следы.
— У нас в семье приемная дочка, которую мы взяли из Сергиево-посадского интерната для слепых детей. Сейчас ей 11 лет, в нашей семьей она уже два года. Есть проблема ее обучения, учитывая, что специализированных школ для незрячих детей в округе нет. Но с нами случилось чудо — оказалось, что учительница в менделеевской школе по образованию тифлопедагог и умеет работать со слепыми детьми. Вы только подумайте, как много людей подобной специальности в нашем городе? И один из них оказался в нашей школе!
Дочка занимается индивидуально с преподавателем по брайлевским книгам. Но! Даже для учительницы, которая является профессионалом в этой области, обучение в таком формате — это просто чудовищный в физическом плане труд.
Брайлевские книги представляют из себя выдавленные на плотной бумаге пупырышки, и самостоятельные работы детей тоже выдавлены на бумаге, на специальном устройстве (оно называется планшет). У ребенка есть металлическая книжечка — вниз подкладывается бумага, сверху накладывается вторая половинка, и в ней прорезанные, как трафарет, места, куда вписываются брайлевские буквы. С помощью специального шила по этому трафарету в уголочках или посередине продавливает точки там, где нужно, чтобы написать букву.
В итоге получается лист бумаги, в нужных местах вдавленный. А дальше зрячему человеку, в нашем случае, педагогу дочери, предлагается это читать глазами. А с книгами, где символы печатаются с двух сторон, все становится совсем тяжело. Когда незрячий человек читает по этим пупырышкам пальцами, ему все более-менее понятно — вдавленные пупырышки, которыми напечатаны буквы с обратной стороны листа, не прощупываются, а чувствуется только те, что выдавлены. А глазами все это выдавленное и вдавленное превращается просто в месиво! И ведь зрячему человеку читать пальцами тоже не просто — потому что у него чувствительность совсем другая. Наша учительница готовилась к занятиям по шесть часов.
В какой-то момент моя жена Ольга воскликнула: «Ты же профессионально этим занимаешься! Неужели ты за пару вечеров не сможешь сделать программу для расписывания этих точек? Зачем ты тогда специалист по компьютерному зрению?»
Так что, можно сказать, именно супруга вдохновила меня на создание подобного алгоритма. Другое дело, что это не пара вечеров, это довольно серьезная работа. И, конечно, я не первый, который задался такой задачей. Я поднял литературу, которая есть по данному вопросу: аналоги, научные работы и т. д. Изучил около 50 различных статей по тематике компьютерного распознавания Брайля.
Существующие аналоги требуют, чтобы текст с шрифтом Брайля был аккуратно разложен, расправлен, потому что сориентироваться, что означают конкретно вот эти точки, можно только в контексте того, что вот это строчка, а вот это — столбец. Тот технический аналог, который мне удалось найти в России, требует сканера. А книгу, написанную Брайлем, физически невозможно разложить и засунуть в обычный сканер — они все толщиной по пять сантиметров и размером больше А4. Поэтому нужен специализированный сканер для брайлевских книг.
А у меня была задача создать такой алгоритм, чтобы обходиться без сканера. Так, чтобы система работала просто с фотографии, сделанной на мобильный телефон: подошел, сфотографировал, получил расшифрованный текст. Единственной особенностью является то, что нужно правильно фотографировать. Есть некоторые довольно простые требования — типа того, что фотографировать надо сверху, а свет должен падать с противоположной от вас стороны.
В течении года я эту технологию доводил дом ума — отлаживал и улучшал, и сейчас она уже доведена до уровня, когда ее можно использовать. Сейчас этой программой пользуется более ста человек. Моя жена выложила ее у себя на страничке в фейсбуке, и за этот год с помощью программы распознали примерно две тысячи страниц.
Компьютерное зрение — это класс алгоритмов, которые позволяют компьютеру по фотографии или видео извлекать полезную информацию. Область применения этих алгоритмов сейчас очень широка и продолжает расширяться.
В частности, на моей основной работе мы разрабатываем сложные системы видеонаблюдения. Они используются на тех объектах, где недостаточно просто посадить людей за экраны монитора, потому что на этих мониторах изображение с сотен камер: например, в аэропортах, на атомных станциях. Система компьютерного зрения обрабатывает фотографии автоматически и уже в преобразованном виде выдает их оператору тогда, когда возникает внештатная ситуация, проникновение на территорию, возгорание или что-то подобное. Например, человек поставил в зале ожидания аэропорта чемоданчик и ушел. Как видите, задачи бывают довольно сложные.
Сейчас технологии компьютерного зрения переживают бум, который начался примерно с 2012 года. Изобретенные примерно за 15 лет до этого так называемые сверточные нейронные сети были применены для распознавания изображения, И оказалось, что эта штука очень эффективная. Исследования в данном направлении привели к тому, что способность компьютера понимать изображение на картинке сейчас, по сравнению с тем, что было восемь лет назад — просто небо и земля.
Сейчас эти способности компьютера приближаются к способностям человека. И несколько лет назад создать такой алгоритм расшифровки брайлевского текста, как тот, что работает в моей программе, было просто невозможно.
В планах поездки по школам, чтобы рассказать о таком алгоритме. Хотим съездить, в том числе, и в московскую школу для слепых, и в Сергиев Посад. Естественно, я исхожу из того, что проблема, которую я решаю с помощью такой программы — это не проблема отдельно взятого ребенка в отдельно взятом поселке Менделеево, поэтому с самого начала я знал, что буду делать эту технологию доступной для всех тех людей, которым она понадобится.
Я чувствую гордость и радость от того, что я сделал в своей жизни то, что реально изменит жизнь некоторой категории людей к лучшему. На самом деле, даже когда занимаешься профессионально чем-то, такая удача не каждый день выпадает. И даже, правильнее сказать, вообще в жизни не каждому выпадает.
Потому что на самом деле дело это большое и важное. Даже если у ребенка есть возможность заниматься со специалистом, для самого педагога такая программа большое подспорье. Плюс к тому, ребенок может захотеть заниматься в литературном кружке или где-то еще. Каждого преподавателя такого кружка обучить Брайлю?
Конечно, в программе есть что улучшать: в плане, например, оформления сайта, того, как она работает через интернет. Я специалист по компьютерному зрению, а не по сайтам, кроме того есть вещи, которые в программе просто хотелось бы усовершенствовать. Мне прислали отзыв даже из Австралии и просят сделать ее на английском языке. Для этого нужно приложить еще немало усилий, в английском Брайле есть существенные особенности.
Буду рад помощи неравнодушных людей! Если кто-то на безвозмездной основе готов помочь, пишите мне на почту angelina-reader@ovdv.ru .
Как и многие люди, занимающиеся подобной деятельностью, я осознаю свою ответственность за те технологии, которые при этом получаются. Понятно, что мы исходим из того, что программа будет использоваться в благих целях. Но жизненный опыт, к сожалению, показывает, что так получается далеко не всегда. И даже безотносительно к благим целям может оказаться, что это вообще не принесет пользы людям.
Уже сейчас встает вопрос о том, что внедрение каких-то технологий оставит без работы определенное количество людей. И это вызывает серьезные вопросы, сомнения и опасения. Не всегда есть четкое понимание, что именно вот это хорошо, а вот это нет. Одно из направлений, в котором применяется технология компьютерного зрения — диагностика в медицине, к примеру, оценка рентгеновских снимков. То, что для человека является непривычным и требует от него очень большого профессионализма, машина делает с легкостью. При этом есть риск, что в результате те профессионалы, которые способны что-то делать без компьютера, грубо говоря, исчезнут. Я не уверен, что это хорошо. Хотя вроде бы мы работаем над тем, чтобы облегчить диагностику, эффективнее лечить заболевания.
Технологии для охранных систем — тоже, казалось бы, всецело для пользы, но возникают вопросы, когда такие разработки начинают применяться массово, на улицах. Поэтому то, что свои знания и умения мне удалось применить для расшифровки алгоритма Брайля — для меня это очень приятно. Это тот результат, в котором я вижу только плюсы.
Это большая радость, когда в жизни удается оставить хороший след, когда что-то, к чему ты хотя бы имел какое-то небольшое отношение, живет через много лет, и люди этому радуются. Я заканчивал физмат-школу при МГУ (раньше она называлась ФМШ-18, сейчас — СУНЦ). В 1986 году мы впервые устроили КВН между учениками нового набора, команды назывались «Восток"-"Запад», я тоже в этом участвовал. И когда через много лет я приезжал в родную школу, и ставший традиционным КВН «Восток-Запад» был ключевым событием посвящения новых учеников, так и хотелось, как лягушке-путешественнице, крикнуть «это я придумал». На самом деле придумал не я, там целая компания была, но и я в этом участвовал.
Еще мы с друзьями десять лет делали подростковый молодежный лагерь, помогали восстанавливать монастырь в Белогорье. И целое поколение ребят выросло на этих поездках. Для меня дорого, что эти поездки ценны до сих пор не только для меня, но и для тех, кто в них ездил.
Такие следы в жизни остаются, и это радует.
В детях, конечно, хочу оставить продолжение свое. Учу их активному, творческому отношению к жизни, помогать людям, с людьми с любовью обходиться. Хотел бы научить их христианской вере, но это штука такая, что просто в виде обучения не передается. Сейчас все мои дети в подростковом возрасте, когда вера переживает некий кризис. Но если я смог своим примером заложить пример христианского отношения к жизни, к людям, я буду спокоен.
Сайт проекта — angelina-reader.ru