Войти в почту

Разметка данных станет игрой

Совладельцы компании NativeOS, которая разрабатывает «антивирус для брендов» на основе компьютерного зрения, запускают новый стартап. Речь идет о создании геймифицированной платформы для разметки больших данных Little Big Data, которая будет отличаться от существующих большей точностью. Об этом «Инвест-Форсайт» узнал от кофаундера компании Ивана Сощика на митапе в технологическом центре Microsoft. Из рекламы к платформе для создания Big Data Сооснователь Little Big Data Виталий Сотников в 2017 году запустил американский стартап NativeOS, который не пропускает рекламу в негативный контент: алкоголь, насилие, наркотики, религия, катастрофы, порно, политика, азартные игры. Таким образом решается проблема brand safety, или защиты бренда в digital-пространстве при помощи глубоких семантических структур и нескольких нейросетей. Технология NativeOS позволяет следить за тем, чтобы сообщения брендов были показаны исключительно в безопасных местах, сокращая их репутационные потери. Это своего рода «антивирус для брендов». С NativeOS работают Microsoft, NVidia, Publicis Groupe и др. Детали сотрудничества не разглашаются. Для одного клиента (его название не раскрывается) NativeOS учила нейросеть распознавать все виды наркотиков, чтобы исключить их из рекламы. NativeOS для Brand Safety нужно большое количество данных, размеченных фотографий, изображений и т.д. для обучения нейросетей. Стартап сначала начал сотрудничать с различными компаниями, заказывая данные у таких известных вендоров, как «Яндекс.Толока», DBrain и других, но качество разметки их не устроило. «Например, ребята из DBrain нам столько клевых вещей рассказали про свой подход, а на деле мы получили дата-сеты с кучей ошибок. 20-25% полученных данных никуда не годились, – рассказывает Виталий Сотников. – А для нашей деятельности это достаточно критично. Мы стали думать – почему, и поняли, что сервисы, работающие с разметкой данных, не позволяют сотрудникам раскрыться: у них низкая мотивация, так как это скучный, монотонный труд, за который мало платят. Кроме того, люди быстро устают из-за монотонности, у них падает концентрация внимания, так появляются ошибки». От рутины к игре и образованию Чтобы всего этого избежать, нужно ориентироваться не на работающих людей, которые хотят получать все здесь и сейчас, а на студентов – людей, которые делают первые шаги в своем карьерном развитии, открыты для всего нового, решили предприниматели. Кроме того, в российских вузах мало IT-программ, которые позволяют будущим IT-специалистам достичь необходимого профессионального уровня, например от front-end и UX вплоть до AI&machine learning. Little Big Data готова предложить студентам интересную работу по разметке данных. Достаточно зайти на платформу, зарегистрироваться и начать размечать данные. Но чтобы избегать ошибок, время работы ограничено четырьмя часами в день с обязательным перерывом после двух часов. Работа разметчика данных по уровню концентрации внимания и монотонности похожа на работу авиадиспетчера. Авиадиспетчеры, координируя движение самолетов, отвечают за жизни пассажиров и, чтобы всегда быть в форме, каждые два часа отдыхают. А чтобы сотрудникам было нескучно размечать данные, платформа Little Big Data дает возможность получать дополнительное образование, развивать необходимые умения. Стартап собирает аналитику о том, чему хотят научиться будущие IT-шники. Кроме того, новая платформа по обработке больших данных геймифицирована. Разметчик, например, может играть в персонажа, прокачивая его умения и способности, сражаться с противниками. Эти противники и есть данные, которые необходимо разметить. Они упакованы в боксы, при столкновении с противником сотруднику необходимо размечать их. Таким образом скучная работа превращается в игру, челлендж. За нее платится внутренняя валюта (Little Big Points), которая может тратиться на образование. Работа также оплачивается в фиатной валюте, по тарифам на уровне рынка. При хороших скорости и качестве можно за 4 часа заработать около 3 тыс. руб. «По сути мы в Little Big Data своей основной задачей ставим лишить труд ощущения труда, превратив его скорее в игру. Нашими основными ориентирами являются Hearthstone, Heroes of the Storm, The Elder Scrolls Legends, а не, например, платформы по типу DBrain, – поясняет Сощик, – сейчас мы работаем над собственным сеттингом, назвав его Startup Fantasy». Студенты смогут использовать размеченные данные для построения своих машин для обучения, если заказчик не станет возражать. Работа разметчиков перепроверяется другими сотрудниками, чтобы подтвердить качество. Ботов для проверки работы использовать не планируется, по крайней мере, пока. Возможно, боты смогут заменить администраторов, которые консультируют разметчиков по техзаданию, какой объект изображения как должен быть размечен и т.д. Рестораны «Икея» без кассиров Little Big Data пока на стадии MVP, в мае начнется рекрутинг сотрудников в компанию, а полноценный запуск платформы произойдет до конца года. Но уже сейчас у стартапа есть клиент – SKIDATA. Для обновленных ресторанов «Икея» в торговых центрах они разметят еду, чтобы сделать обслуживание без кассиров. Это будет происходить не как в супермаркетах, когда ты пробиваешь чек за товар сам, а на основе компьютерного зрения, при помощи которого машина будет считывать, что на подносе и выставлять счет. На сегодня платформа сумела добиться снижения уровня ошибок до одного процента. Сейчас здесь уже работает 15 разметчиков, 5 из них из России, в том числе из Санкт-Петербургского политехнического университета. Кроме изображений, в ближайшее время на Little Big Data будут обрабатываться также тексты и звуковые файлы. Автор: Наталья Кузнецова

Разметка данных станет игрой
© Инвест-Форсайт