ГлавнаяНовостиМатематики из Оксфорда научились определять авторство текста по знакам препинания

Математики из Оксфорда научились определять авторство текста по знакам препинания

Можно ли отличить роман Диккенса от Фолкнера или Хемингуэя от Теккерея, если убрать из книг все слова и оставить только знаки препинания? Оказывается, да.
Группа математиков из Оксфорда, Уорикского университета и Калифорнийского университета в Лос-Анджелесе доказала это, использовав открытую базу проекта «Гутенберг». Ученые проанализировали почти 15 000 текстов и определили идиостиль более 650 авторов.

Главными параметрами, на которые опирались исследователи, были частотность знаков препинания, длина предложений и расстояние между знаками. К этим параметрам ученые применили математические формулы и составили для избранных произведений тепловые карты.

Полученные данные впоследствии загрузили в нейросеть и она распознала писателей с точностью до 72%. Вот так-то!

Поделиться:
09.01.2019