Стилометрия, или как отличить Акунина от Булгакова с помощью 20 строк кода?
Привет Хабр. Довольно интересным направлением «прикладной статистики» и NLP (Natural Languages Processing а вовсе не то что многие сейчас подумали) является анализ текста. Появилось это направление задолго до компьютеров, и имело вполне практическую цель: определить автора того или иного текста.…
Читать дальше