Исследователи научили нейронную сеть судить книги по обложке

Несмотря на то, что книги по обложке судить крайне не рекомендуется, некоторые обложки просто созданы для того, чтобы по ним можно было попытаться угадать содержание литературного произведения. У людей это зачастую выходит не очень хорошо, а вот как с этим обстоят дела у машин, до недавнего времени было совершенно неясно. Тем не менее, благодаря совместной работе Брайана Кендзи Иваны (Brian Kenji Iwana) и Сейичи Учиды (Seiichi Uchida) из японского университета Кюсю, ответ на этот вопрос найти удалось. Исследователи научили нейронную сеть изучать книжные обложки и определять, к какой категории эти книги относятся.

Technology Review

Technology Review

Ивана и Учида загрузили с Amazon.com 137788 уникальных книжных обложек, каждой из которых соответствовал какой-то жанр. В случае, если книга относилась не к одной, а к двум или более категориям, исследователи использовали первую. 80 % всех имеющихся данных использовались для обучения нейронной сети распознаванию жанра книги посредством «взгляда» на обложку. Здесь была задействована четырёхслойная сеть с 512 нейронами в каждом слое. Ещё 10 % данных использовались для подтверждения модели, а финальное тестирование на умение правильно классифицировать обложки проводилось ещё на 10 % данных.

Алгоритм показывал правильный жанр в списке трёх наиболее вероятных вариантов в 40 % случаев, а более чем в 20 % случаев показывал точный жанр книги. «Это доказывает, что классификация дизайна обложек возможна, однако это очень сложная задача», — заявили Ивана и Учида.

Как оказалось, некоторые категории книг распознаются нейронной сетью легче, чем другие. Например, относительно просто искусственному интеллекту было распознавать книги о путешествиях и книги о компьютерах и технологиях, поскольку на обложках такой литературы зачастую используются похожие изображения. Если на обложке кулинарной книги была изображена еда, то определение жанра давалось нейронной сети так же просто, однако в остальных случаях (например, когда на обложке располагалась фотография шеф-повара) алгоритм был крайне неоднозначен в своих определениях.

Биографии и мемуары тоже были для нейронной сети проблемой — такие книги она обычно относила к историческим. Детские книги алгоритм часто путал с комиксами, то же касается медицинских и научных книг.

У исследования есть один изъян: эффективность нейронной сети в распознавании жанра книг по обложкам не была сравнена с эффективностью человека. Тем не менее, даже в таком случае исследование может быть полезно — например, алгоритм мог бы заменить реальных людей, придумывающих обложки для книг. Это, впрочем, означает, что скоро в мире может стать на одну профессию меньше.

Источник:

Читайте также