Анализ структуры документа

DictaScope Structure

Большинство документов нормативного характера (законы, стандарты, договоры) имеют внутреннюю иерархическую структуру. Эта структура может быть описана стилями MicrosoftWord или разметкой HTML, которые, как правило, отсутствуют в документе.

Программа DictaScopeStructure предназначена для автоматического выявления в неразмеченном тексте его иерархической структуры. Программа находит в тексте заголовки распространенных форматов, маркированные списки, и определяет подчинение найденных заголовков и текстовых фрагментов.

Входной формат — plain-текст. Выдача результата производится в формате XML.