Наукові публікації університету

Nonparametric methods of authorship attribution in english literature

У статтi описанi результати порiвняння двох непа-раметричних методiв iдентифiкацiї невiдомого автора на прикладах англiйської лiтератури. У нiй описано реалiзацiю мето-ду кластеризацiї та застосування методiв тестування з кластеризацiєю та без неї. Запропоновано метод вибору n-грам, якi є кращими маркерами для iдентифiкацiї автора. Для тестування було використано понад 800 текстiв 16 авторiв. В результатi було встановлено, що метод, який використовує щiльнiсть розподiлу,придатний для iдентифiкацiї авторiв як великих текстiв (50000+ символiв), так i малих (10000+ символiв). Метод, який використовує p-статистику, придатний тiльки для великих текстiв.За допомогою кластеризацiї текстiв на тестовiй вибiрцi для обох методiв була досягнута значно кращi результати. Робота продовжує дослiдження ефективностi методiв iдентифiкацiї авторства,виконану ранiше на прикладi творiв класичної росiйської лiтератури. Результати пiдтверджують, що ефективнiсть методiв не залежить вiд вибраної мови твору.

ID: 247026
Кількість показів: 14
дата змінення: 17.07.2020 20:06:33
Ким змінено (ім'я): (cyb15) Тетяна Ківва
Вид роботи:  Наукова публікація
Тип роботи:  Наукова стаття
Кількість сторінок:  9
Рік видання:  2020
Звітний рік:  2020
Видання:  Журнал обчислювальної та прикладної математики
Том:  1
Випуск, частина:  133
Номери сторінок:  50-58
Галузь науки:  Математика
Автори,співробітники Університету:  Клюшин Дмитро Анатолійович
Автори,студенти та аспіранти Університету:  Михайлюк Владислав Юрійович
Кількість недоданих авторів:  0
Кафедра / Відділ:  НДЛ Обчислювальних методів в механіці суцільних середовищ / Обчислювальної математики
№ теми:  19БФ015-03
Посилання на статтю (посилання на рецензію в журналі (для монографій):  DOI: https://doi.org/10.17721/2706-9699.2020.1.04
Ключові слова:  атрибуцiя тексту, iдентифiкацiя авторства, не-параметричнi методи, статистика Петунiна, кластеризацiя
Опубліковано за рішенням Вченої ради:  ні
Інститут/Факультет:  Факультет комп'ютерних наук та кібернетики

Повернення до списку

Вгору