Как-то, еще в далеком марте 2022 года, после всем известных событий, научное сообщество озадачилось вопросом о будущем российской науки: как оставаться в курсе мировой повестки и еще как-то там мелькать. Поскольку я не ученый, а аналитик, в моем окружении больше звучали вопросы о том, что делать с наукометрией, когда закроют SciVal и Scopus? Так вышло, что это единственные базы научных публикаций, которые мы используем в работе. Вот мы и решили с коллегами разобраться какие вообще существуют альтернативы, если все-таки лавочку прикроют.
Было это давно, еще в начале апреля, но недавно я решила зайти посмотреть что на эту тему есть на Habr и, к моему удивлению, не нашла статьи по сравнению таких ресурсов. Нужно исправлять ситуацию.
The Lens
The Lens – гигантская база научных статей и патентов. Суммарно на платформе представлено 400 млн документов. Из них 250 млн – научные публикации и только 48 млн в открытом доступе. Но и это не мало!
Фильтров предостаточно: по автору, организации, стране/региону, научной области и ключевым словам. Можно даже по источнику финансирования работы отфильтровать. Плюс можно посмотреть работы, на которые ссылаются в патентах или работы, в которых есть ссылки на патенты. Мне пока такое не пригождалось, но приятно само наличие такой возможности.
По патентам набор фильтров также приятно радует: страна, заявитель, владелец, статус и прочее. Есть даже отдельный фильтр для поиска биологических материалов, упоминаемых в патентах.
Перейдем к аналитике. На самой платформе графики можно построить «на заказ» – выбрать по какому полю и какой график построить. Есть даже облака тегов и картограммы. Удобно, когда нужно быстренько вставить в презентацию. А если экспортировать данные захочется, то тут уже не все так радужно. Ограничение на экспорт – 1000 публикаций, и в экспортируемых форматах нет моего любимого .xlsx . Можно, конечно, скачать в CSV, но заморачиваться с разделителями не особо приятно. Но есть и хорошая новость – после регистрации можно выгрузить 50 000 строк. Есть возможность подключения API.
Есть даже версия сайта на русском языке, правда, перевод у неё кривоватый, но когда нас это останавливало?
Плюсы:
-
Большая база патентов. Тем, кому также как и мне не нравится интерфейс WIPO, зайдет.
-
Большой набор фильтров. Возможности SciVal закрывает.
-
Интуитивный интерфейс. Даже без опыта работы с SciVal можно разобраться с Lens за пол часа.
-
Можно пользоваться всем функционалом без регистрации и смс. Правда, если захочется сохранить какую-нибудь подборку, то зарегаться все же придется. Платные тарифы для коммерческого использования тоже есть, но особого дополнительного функционала они не дают.
Минусы:
-
Ограничены возможности экспорта: 1000 документов без регистрации, 50 000 – после регистрации.
-
Нет формата .xlsx (лично для меня это трагедия). Можно выгрузить данные только в форматах JSON/CSV/RIS/BibTeX. .
Dimensions
Dimensions – онлайн-ресурс для поиска и анализа научных публикаций, патентов, клинических исследований, датасетов, грантов и государственных документов. На платформе представлено суммарно 421,5 млн документов.
В бесплатной версии доступны только публикации и датасеты. Публикации можно отфильтровать по ученому, типу публикации, году, области знаний и проч. Сильно не хватает фильтра «по странам/регионам» и «институтам», но они есть в платной версии. Датасеты можно отфильтровать по области знаний, ученому, репозиторию. Не ко всем датасетам есть доступ, но со временем доступ открывается, так что придется запастить терпением на год-два.
На платформе можно автоматически построить графики количества публикаци или сфере исследований, а также можно получить список исследователей с максимальным количеством публикаций, но почему-то без возможности построить график автоматически.
Плюсы:
-
Нестандартный набор документов. Много вы видели наукометрических баз, где есть и гранты, и датасеты, и клинические исследования, и еще куча всего?
-
Можно экспортировать данные в .xlsx (!!!)
-
Платная подписка дает доступ к полному функционалу Dimensions, а также открывает ряд других продуктов: Dimensions Analytics (анализ связей между типами контента), Dimensions on Google BigQuery (для анализа больших объемов данных), Dimensions Life Sciences & Chemistry (специальные инструменты для этой области знаний), Dimensions Profiles (подробная информация об институтах и научных организациях).
Минусы:
-
В бесплатной версии функционал сильно ограничен вплоть до набора фильтров.
-
Мало публикаций российских авторов. К сравнению: из ТОП-3 авторов на SciVal с более чем 1000 публикаций – на Dimensions отображается 2-9 публикаций.
-
Без регистрации нельзя сохранять выборки и экспортировать данные. Как по мне, не критично, так как регистрация занимает считанные минуты. .
-
В бесплатной версии можно экспортировать максимум 500 документов. Ну, это смешно. .
eLibrary.Ru
В первую очередь это не наукометрическая база, а электронная библиотека в области науки, технологии, медицины и образования. На портале содержится рефераты и полные тексты более 38 млн научных публикаций и патентов, в том числе электронные версии более 5600 российских научно-технических журналов, из которых более 4800 журналов в открытом доступе. Для скачивания открытых статей нужно быть зарегистрированным в системе.
В целом здесь, конечно, можно что-то найти по ключевым словам, организации, журналу, авторам. Также можно найти патенты. Правда, в интерфейсе можно ногу сломать, и понадобится выделить приличное время на освоение платформы.
Экспортировать данные просто так вам eLibrary не позволит, поэтому, если уж очень надо, то парсеры данных вам в помощь. Без костылей не получится.
Как по мне, как наукометрическая база eLibrary работает плохо, но вот как библиотека научных публикаций на русском языке платформа работает хорошо. Если прям критически нужно использовать eLibrary, то всегда можно придумать способ достать необходимые данные.
Слышала, что с подпиской Science Index Org можно построить какие-то сводные таблицы и даже диаграммы, но поскольку у меня такой подписки нет, проверить не могу. Если у вас есть такой доступ, то поделитесь, пожалуйста, опытом. Можно ли реально с ней что-то дельное сотворить?
Плюсы:
-
Такого количества русскоязычных публикаций не найдете нигде! .
-
Много публикаций в открытом доступе.
Минусы:
-
Как инструмент для наукометрии ресурс работает из рук вон плохо. Чтобы получить хоть какое-то подобие базы данных, придется подключать костыли.
Свела основные моменты по бесплатным версиям рассмотренных ресурсов в табличку для наглядности.
В целом, у каждого из этих ресурсов есть свои преимущества и недостатки для решения конкретных задач. Если говорить про анализ глобальных трендов, то и Lens и Dimentions с задачей справляются. Если нужно посмотреть наукометрию по России, то Dimensions я бы не советовала, слишком мало российских авторов. Если нужно провести качественный анализ по российским авторам или организациям, то добро пожаловать на eLibrary.Ru.
Надеюсь, для кого-то статья будет полезной. Если хотите, могу сделать подобный разбор по другим ресурсам: Semantic Scholar, Sci-Hub, arXiv.org, Google Scholar.