Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://dspace.wunu.edu.ua/handle/316497/32336
Назва: ANALYSIS OF THE DEVELOPED QUANTITATIVE METHOD FOR AUTOMATIC ATTRIBUTION OF SCIENTIFIC AND TECHNICAL TEXT CONTENT WRITTEN IN UKRAINIAN
Автори: Sachenko, Svitlana
Lytvyn, V
Vysotska, V
Pukach, P
Nytrebych, Z
Demkiv, I
Senyk, A
Malanchuk, A
Kovalchuk, R
Huzyk, N
Ключові слова: NLP, контент-монi- торинг, стоп-слова, контент-аналiз, статистичний лiнгвiстичний аналiз, квантитативна лiнгвiстика
Дата публікації: 2018
Видавництво: Східноєвропейський журнал передових технологій
Бібліографічний опис: Sachenko S.ANALYSIS OF THE DEVELOPED QUANTITATIVE METHOD FOR AUTOMATIC ATTRIBUTION OF SCIENTIFIC AND TECHNICAL TEXT CONTENT WRITTEN IN UKRAINIAN./S/ Sachenko,V. Lytvyn ,V. Vysotska //Східноєвропейський журнал передових технологій. – Vol.6,No 2(96),2018/-C.19-31
Серія/номер: Vol.6,No 2(96);
Короткий огляд (реферат): Запропоновано формальний пiдхiд реалiзацiї визначення автора україно- мовного тексту. Дослiдження проводилось в україномовних наукових текстах технiчного профiлю. Проаналiзованi результати застосування розроблених алгоритмiв автоматичного визначення автора текстового контенту на основi методiв NLP та стилеметрiї. Розглянуто перспективи та особливостi застосування iнформацiйних технологiй стилеметрiї для визначення автора тек- стового контенту. Квантитативний контент-аналiз текстового контенту науково-технiчного спрямування вико- ристовує переваги контент-монiторин гу та контент-аналiзу тексту на основi методiв NLP, Web-Mining та стилеме- трiї для визначення множини авторiв, стилi мовлення яких подiбнi з дослiджуваним уривком тексту. Це звужує коло пошуку при подальшому використаннi в методах стилеметрiї для визначення ступеня приналежностi аналiзованого тексту конкретному авторовi. Проведено декомпозицiю методу визначення автора на основi аналiзу таких коефiцiєнтiв мовлення як лексична рiзноманiтнiсть, ступiнь (мiра) синтаксичної складностi, зв’язнiсть мовлення, iндекси винятковостi та концентрацiї тексту. Паралельно проаналiзованi такi параметри авторського стилю як кiлькiсть слiв у певному текстi, загальна кiлькiсть слiв цього тексту, кiлькiсть речень, кiлькiсть прийменникiв, кiль- кiсть сполучникiв, кiлькiсть слiв iз час- тотою 1, та кiлькiсть слiв iз частотою 10 та бiльше. Подальшого експеримен- тального дослiдження потребує апроба- цiя запропонованого методу для визначення ключових слiв з iнших категорiй текстiв – наукових гуманiтарного профiлю, художнiх, публiцистичних тощо
URI (Уніфікований ідентифікатор ресурсу): http://dspace.tneu.edu.ua/handle/316497/32336
ISSN: 1729-3774
Розташовується у зібраннях:Статті

Файли цього матеріалу:
Файл Опис РозмірФормат 
149596-329071-1-PB (стаття в журналі Скопусі).pdf1.7 MBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.