Послуги університету



Інтелектуальна технологія обробки текстової інформації


Резюме:  Розроблена технологія комп’ютерно-лінгвістичної обробки текстів на природній мові, яка базується на створених потужних лінгвістичних базах даних та евристичних алгоритмах смислової обробки текстів.

Опис:  Розроблена технологія комп’ютерно-лінгвістичної обробки текстів на природній мові, яка базується на створених потужних лінгвістичних базах даних та евристичних алгоритмах смислової обробки текстів. Як результат застосування даної технології пропонуються такі системи: • Cистема “Рефератор” призначена для обробки текстів природної мови. За допомогою даної системи ви можете легко та зручно створювати реферати текстів та проводити їх індексацію (визначення за тематикою). Підтримка системи каталогізації надає можливість зберегти результати в базі даних. • Система “VitaminЕ” призначена для поліпшення якості машинного перекладу. Побудована на базі алгоритмів білінгвістичного семантичного аналізу. • Система семантичної фільтрації текстів. На вхід системи подається список тем, що цікавлять користувача та вхідний текст природною мовою. Система аналізує текст та визначає чи є документ семантично приналежним до заданих тематик. • Система смислового пошуку текстів. Програма допомагає сучасним системам пошуку здійснювати визначення документів, релевантних запитам користувача, не за фактом входження ключових слів запиту у тіло тексту, а за подібністю смислових структур тексту до семантичного образу запиту • Система фільтрації Internet-повідомлень з використанням лінгвістичних методів аналізу текстів. Система аналізує потоки текстової інформації у комп'ютерної мережі (з можливістю заборони доступу до визначеного контенту). • Система для вирішення задач класифікації документів. Запропоновано комплекс параметрів, які використовуються для визначення належності текстів певному автору. Було реалізовано спосіб, заснований на застосуванні нейронної мережі, за допомогою якого можна досить точно визначити авторство того чи іншого тексту на основі наперед визначених розробником ознак.

Переваги та інновації:  Застосування цієї бази дозволяє отримати кращі результати у задачах: • визначення емоційної направленості тексту; • визначення запозичень та «плагіату» в текстах; • визначення іменованих сутностей у текстах; • встановлення ко-референтних зв’язків у текстах. У 2013-2014 році програмні модулі для вирішення останніх двох задач були успішно розроблені та реалізовані в рамках великих лінгвістичних проектів. Вищезазначені системи є працюючими програмними прототипами, які цілком готові до впровадження при умові проведення невеликих модифікацій та адоптацій під специфіку конкретної задачі замовника та потрібну предметну область.

Стадія готовності:  Доступна для демонстрації

Коментарі до стадії готовності:  Вищезазначені системи є працюючими програмними прототипами, які цілком готові до впровадження при умові проведення невеликих модифікацій та адоптацій під специфіку конкретної задачі замовника та потрібну предметну область.

Опис шуканого партнера:  Тип шуканого партнера – бізнес-партнери, інвестори. Завдання які повинні бути виконані партнером – інвестування коштів для доробки проекту до промислового рівня та підтримка при впровадженні розроблених програмних продуктів.

Мова спілкування:  English / Русский язык / Українська мова

Пропозиція (файл PDF):  Завантажити



	

Завантажити пропозицію on-line.





← Повернення до списку

Вгору