Технологии

Компания «Диктум» предлагает набор программных компонент для информационного поиска и анализа текста под торговой маркой DictaScope.

Продукты семейства DictaScope

Синтаксический анализатор – получение синтаксической разметки предложения русского языка. Разметка включает дерево зависимостей, информацию о типе связей, морфологических значениях слов и ролях знаков препинания.

Обработка словосочетаний – извлечение словосочетаний из текста, определение их типа, приведение к заданной грамматической форме, например к начальной.

Лексический анализатор – выявление в тексте объектов специального вида – именованных сущностей, таких как персоны, даты, организации, адреса и т.д. Возможно описание собственных групп объектов.

Анализатор структуры документа – определение в неразмеченном тексте нумерованных и маркированных списков, заголовков, примечаний, установление иерархии этих элементов.

Все продукты компании доступны в виде библиотек для Windows/FreeBSD. По вопросам приобретения пишите sales@dictum.ru