data mining

Исследование качества информации и достоверности источников в Википедии

Возможно для кого-то это будет удивительно и даже возмутительно, но в Википедии информация не должна быть правдивой, важно, чтобы она была подтверждена достоверными источниками. Именно проблеме дезинформации и достоверности источников в Википедии был посвящён последний выпуск уходящего 2020 года Wikimedia…
Читать дальше

Цепи Маркова и Пайтон — разбираемся в теории и собираем генератор текстов

Понимаем и создаём Хорошие новости перед статьей: высоких математических скиллов для прочтения и (надеюсь!) понимания не требуется. Дисклеймер: кодовая часть данной статьи, как и предыдущей, является адаптированным, дополненным и протестированным переводом. Я благодарна автору, потому что это один из первых…
Читать дальше

Байесовские сети при помощи Питона — что и зачем?

Дисклеймер: данная статья является адаптированным переводом. Оригинал можно прочесть здесь. Байесовские сети при помощи Питона — объяснение с примерами Из-за ограниченности информации (особенно на родном русском) и ресурсов работы, байесовские сети окружены рядом проблем. И можно было бы спать спокойно,…
Читать дальше

Data Science для гуманитариев: что такое «data»

Размышления об информации, памяти, аналитике и распределениях Все, что воспринимают наши чувства, — это данные, хотя их хранение в наших краниальных материалах оставляет желать лучшего. Записать это немного надежнее, особенно когда мы записываем это на компьютере. Когда эти записи хорошо…
Читать дальше

Знакомство с Decision Intelligence

Новая дисциплина в борьбе за лидерство в эпоху искусственного интеллекта Знаете, что общего между защитным поведением при встрече со львами в саванне, ответственным подходом к управлению ИИ и проблемами проектирования хранилищ данных? Добро пожаловать в decision intelligence! Decision intelligence —…
Читать дальше

Мой дашборд и анализ динамики распространения инфекции COVID-19

COVID-19 — название коронавирусной инфекции. Вирус, который ее вызывает, называется коронавирусом SARS-CoV-2. Хочу поделиться своим дашбордом и анализом динамики распространения инфекции. Информация доступна по этом адресу. Дашборд написан на Google Таблицах и Google Apps Script, поэтому содержимое не адаптируется под…
Читать дальше

Анализ данных по коронавирусу часть 2, попытка сравнить с тем, что было в Китае

Ввиду того, что коронавирус всё же распространился по всему миру, я решил сопоставить данные по вирусу в сравнение с тем, что было в Китае. Когда пандемия только начиналась, я сделал небольшой анализ данных по Китаю, и так как там ситуация…
Читать дальше

Анализ данных по коронавирусу SARS-CoV-2 (2019-nCov)

В последнее время вижу много выпусков новостей о новом вирусе, но так ли всё плохо, прошёл ли пик эпидемии или всё ещё впереди. По большей части из новостных выпусков сложно сделать хоть какие-то выводы. В итоге решил разобраться сам, и…
Читать дальше

Как программист машину покупал. Часть III

В двух предыдущих частях (I, II) своего повествования о сервисе для поиска выгодных автомобилей я подробно изложил техническую сторону вопроса — постановку задачи и ее решение. В этой статье я более подробно остановлюсь на результатах и возможностях сервиса robasta.ru. Для…
Читать дальше