ПерваяНовостиО технологииOn-line переводчикСсылки


Ukraine Context Optimizer.Технологии информационного поиска


ИНФОРМАЦИЯ О ТЕХНОЛОГИИ

Информационный раздел
Технологии автоматического анализа текста

RCO Fact Extractor SDK - новый пакет для анализа текста

Пакет RCO и UCO Fact Extractor SDK - это комплексный инструментарий для разработки информационно-поисковых и аналитических систем, требующих лингвистического анализа текста на русском и украинском языках.
Ядро пакета представляет библиотека RCO и UCO FX Ru, которая осуществляет полный синтактико-семантический разбор русского текста. Библиотека выделяет различные классы сущностей, упомянутых в тексте (персоны, организации, география, предметы, действия, атрибуты и др.), и строит сеть отношений, связывающих эти сущности, а также предоставляет всю грамматическую информацию о составляющих текста. Средства библиотеки также обеспечивают семантическую интерпретацию результатов разбора текста - поиск описаний ситуаций, удовлетворяющих заданным семантическим шаблонам.

RCO и UCO FX включает в себя все возможности, реализованные ранее в библиотеках RCO и UCO Pattern Extractor, RCO Syntactic Engine, RCO Semantic Network, RCO Entity Extractor и RCO Fact Extractor, с добавлением новых функций, предоставляя единообразный программный интерфейс ко всем результатам анализа текста.

В состав лингвистического обеспечения пакета, помимо общих словарей и правил русского и украинского языков, входят правила выделения специальных объектов (дат, адресов, документов, телефонов, денежных сумм, марок автомобилей и пр.), шаблоны для распознавания различных классов событий и фактов (сделок, экономических показателей, конфликтов, биографических фактов и пр.), характеристик объекта (позитива, негатива и др.), высказываний прямой и косвенной речи.

Дополнительно в состав пакета RCO и UCO Fact Extractor SDK входят исходные коды приложений на С++, иллюстрирующие использование библиотеки RCO FX Ru для решения всех типовых задач, встающих перед разработчиками прикладных информационных систем:

построения смыслового портрета документа – множества слов и словосочетаний, ранжированных по значимости;
построения реферата текста, в том числе рефератов по каждой сущности;
построение ассоциативной семантической сети текста или коллекции текстов;
построения иерархического глоссария по коллекции текстов;
трансляции запроса на естественном языке в пакет запросов поисковой машины.
RCO и UCO Fact Extractor SDK работает на платформах Windows и Unix. Выпускается в редакциях Standard, Standard Plus, Professional и Exclusive.





Статьи раздела:
Ассоциативно-статистический подход .
Синтактико-семантический подход.
RCO Fact Extractor SDK - новый пакет для анализа текста

Информационные разделы

Генератор статистических отчетов
Инструментарий аналитика
Инструментарий разработчика
Лингвистическое обеспечение
Поиск для IBM OmniFind.
Поиск для Microsoft
Поиск для Oracle
Поисковая машина
Технологии автоматического анализа текста
Технологии информационного поиска
Технологии навигации в информационных массивах .







Авторское право © Компания Текон & Студия РОМАрт, 2004-2009.
UCO™ является торговой маркой компаний Текон и "ЭР СИ О".
RCO™ является торговой маркой компании "ЭР СИ О".
Все права защищены.


Яндекс цитирования Webalta Уровень доверия