ЛАН.ТЕКСТОВЫЙ ПРОЦЕССОР
Программа разработана для извлечения, обработки и анализа
текстовых данных из различных источников и на различных языках.
Основные функции:
Программа реализует обработку текстовых данных с помощью гибко настраиваемых, многоязыковых,
обучаемых правил обработки текстовых данных.
Программа включает следующие основные функциональные модули:
компоненты обучения автоматических классификаторов на основе правил, компоненты оценки
качества автоматической классификации и анализа текстов;
компоненты построения специализированных лингвистических индексов для обеспечения
поиска, классификации и анализа текстов;
компоненты лингвистического анализа текстов на различных естественных языках,
представленных в кодировке UNICODE;
компоненты для синтаксического анализа и трансляции запросов и правил на
специализированном языке;
компоненты автоматической классификации и анализа текстов на основе массивов
правил;
компоненты идентификации языков и кодировок документов.