Skip navigation

Smart TV, который сам определяет наиболее интересный канал, или необычное решение судоку для видеоконтента

Новость:

Как по-вашему связаны монетизация ТВ-каналов, нейронные сети и судоку? На первый взгляд, как программирование с искусством — возможно, но удается далеко не многим. Однако, присмотревшись, наша команда нашла необычный ответ на этот вопрос. Продукт, который разработали инженеры, позволял с помощью разных видов нейронных сетей определять начало и конец рекламных блоков, чтобы они появлялись в правильное время. Сейчас же он уже трансформировался в универсальное средство для решения широкого круга задач. И мы с удовольствием расскажем, что к чему.

Все началось с того, что основным источником прибыли для американских стриминговых компаний и ТВ-каналов стала монетизация контента с помощью рекламы. Владельцы ТВ-каналов разрешали провайдерам заменять определенную часть рекламы и показывать ролики своих клиентов. Однако, если рекламные блоки наслаивались друг на друга, то рекламодатели оставляли негативные отзывы. В итоге, реклама на канале отключалась, а доход терялся.

Для решения этой проблемы использовались разные подходы. Свой подход был и у одного из крупных поставщиков видеоконтента в США, который начал работать с EPAM. Однако, его точность не превышала шестидесяти процентов. Это значит, что в сорока процентах случаев рекламные ролики перекрывали друг друга, что могло привести к полному отключению рекламы на этих ТВ-каналах.

По словам менеджера проекта Влада Байовского: «Как только проект стартовал, инженер Леша Дружинин столкнулся с этой проблемой, и у него возникла идея. Заключалась она в том, чтобы создать продукт, который будет определять начало и конец рекламных блоков. Скажу честно, сначала я был настроен скептически, так как решение было технически сложным, то есть предполагало использование нейронных сетей и машинного обучения. И на тот момент у нас не было соответствующей экспертизы в этих областях.

В целом, все ребята, которые успели принять участие в этом проекте, опробовали разные типы нейронных сетей и разные алгоритмы, связали и синхронизировали разные компоненты. Несмотря на то, что идея родилась в Калифорнии, нам удалось задействовать 70 инженеров из абсолютно разных локаций EPAМ.

В итоге у нас получился отличный продукт, который теперь не только определяет смену рекламы, но и является универсальным решением для любых задач, связанных с определением смены видеоконтента, включая потенциальное решение для поиска видео. Иными словами, его область применения не ограничивается лишь рекламой — это могут быть, например, и ТВ-шоу, у которого меняются рубрики, и данные с видеокамер или оцифрованные старые фильмы, у которых нет метаданных о содержании видеоряда».

Леша Дружинин: «Если бы мы не делали проект, а ставили пьесу, то у нас получилась бы очень хорошая пьеса! У нее постоянно меняются жанры, происходит кардинальная и частая смена действий, есть интрига. Сначала мы пытались решить задачу простым способом без нейронных сетей, но ничего не получилось. Нам пришлось полностью разобраться с устройством большинства видов нейронных сетей и с нуля обучить их выполнять определенные задачи. Чтобы было понятно — существует множество архитектур нейронных сетей, но нас интересовали те из них, которые обрабатывают визуальную информацию.

Со временем мы заметили, что наш проект стал чемпионом в компании по использованию нейронных сетей: у нас их было более пяти видов. Сейчас мы остановились на двух. Они анализируют каждый кадр и каждый кусочек звука. Когда происходит кардинальная цветовая смена кадров либо тональности звука, сети на это реагируют, предсказывая конец рекламы и затем переход между рекламными блоками. Пока та сеть, которая определяет переход между роликами, точнее той, которая предсказывает конец ролика.

Графики вероятностей смены видео контента

Каждая из них получает свою копию нарезанных кадров и звуков, однако вместе они обеспечивают 90-процентную точность результата. Мы запустили это решение на реальных каналах, и оно работает. Нам удалось создать бота, который умеет смотреть телевизор. Образно говоря, если после этого проекта к нам придут клиенты с просьбой: «А сделайте-ка нам улучшенный "Smart TV”, то мы уже готовы к таким задачам. Наше решение — это и есть маленький Smart TV, который уже способен самостоятельно различать контент, только для определенной ниши».

Кстати, об опыте мировых IT-компаний. Во время работы над этим проектом команда EPAM пришла к тому, что уже давно практикуют мировые корпорации — требования к открытому коду. Так как изменения на проекте возникали очень часто и постоянно подключались новые инженеры, код просто должен быть гибким. Поэтому проводились постоянные проверки его читаемости, или, как говорят, meaty (мясистости).

Изначально задачей команды было «поразить, удивить и завоевать доверие заказчика». Однако, в процессе работы над решением стартовая концепция улучшилась до такой степени, что получился универсальный продукт, который после определенной доработки можно предлагать многим компаниям, бизнес которых связан с видеоконтентом.