Несмотря на то, что книги по обложке судить крайне не рекомендуется, некоторые обложки просто созданы для того, чтобы по ним можно было попытаться угадать содержание литературного произведения. У людей это зачастую выходит не очень хорошо, а вот как с этим обстоят дела у машин, до недавнего времени было совершенно неясно. Тем не менее, благодаря совместной работе Брайана Кендзи Иваны (Brian Kenji Iwana) и Сейичи Учиды (Seiichi Uchida) из японского университета Кюсю, ответ на этот вопрос найти удалось. Исследователи научили нейронную сеть изучать книжные обложки и определять, к какой категории эти книги относятся.
Ивана и Учида загрузили с Amazon.com 137788 уникальных книжных обложек, каждой из которых соответствовал какой-то жанр. В случае, если книга относилась не к одной, а к двум или более категориям, исследователи использовали первую. 80 % всех имеющихся данных использовались для обучения нейронной сети распознаванию жанра книги посредством «взгляда» на обложку. Здесь была задействована четырёхслойная сеть с 512 нейронами в каждом слое. Ещё 10 % данных использовались для подтверждения модели, а финальное тестирование на умение правильно классифицировать обложки проводилось ещё на 10 % данных.
Алгоритм показывал правильный жанр в списке трёх наиболее вероятных вариантов в 40 % случаев, а более чем в 20 % случаев показывал точный жанр книги. «Это доказывает, что классификация дизайна обложек возможна, однако это очень сложная задача», — заявили Ивана и Учида.
Как оказалось, некоторые категории книг распознаются нейронной сетью легче, чем другие. Например, относительно просто искусственному интеллекту было распознавать книги о путешествиях и книги о компьютерах и технологиях, поскольку на обложках такой литературы зачастую используются похожие изображения. Если на обложке кулинарной книги была изображена еда, то определение жанра давалось нейронной сети так же просто, однако в остальных случаях (например, когда на обложке располагалась фотография шеф-повара) алгоритм был крайне неоднозначен в своих определениях.
Биографии и мемуары тоже были для нейронной сети проблемой — такие книги она обычно относила к историческим. Детские книги алгоритм часто путал с комиксами, то же касается медицинских и научных книг.
У исследования есть один изъян: эффективность нейронной сети в распознавании жанра книг по обложкам не была сравнена с эффективностью человека. Тем не менее, даже в таком случае исследование может быть полезно — например, алгоритм мог бы заменить реальных людей, придумывающих обложки для книг. Это, впрочем, означает, что скоро в мире может стать на одну профессию меньше.
Источник: