|
|
|
НОВОСТИ
30.10.2007 RCO Fact Extractor SDK - новый пакет для анализа текстаПакет RCO Fact Extractor SDK - это комплексный инструментарий для разработки информационно-поисковых и аналитических систем, требующих лингвистического анализа текста на русском языке.
Ядро пакета представляет библиотека RCO FX Ru, которая осуществляет полный синтактико-семантический разбор русского текста. Библиотека выделяет различные классы сущностей, упомянутых в тексте (персоны, организации, география, предметы, действия, атрибуты и др.), и строит сеть отношений, связывающих эти сущности, а также предоставляет всю грамматическую информацию о составляющих текста. Средства библиотеки также обеспечивают семантическую интерпретацию результатов разбора текста - поиск описаний ситуаций, удовлетворяющих заданным семантическим шаблонам.
RCO FX включает в себя все возможности, реализованные ранее в библиотеках RCO Pattern Extractor, RCO Syntactic Engine, RCO Semantic Network, RCO Entity Extractor и RCO Fact Extractor, с добавлением новых функций, предоставляя единообразный программный интерфейс ко всем результатам анализа текста.
В состав лингвистического обеспечения пакета, помимо общих словарей и правил русского языка, входят правила выделения специальных объектов (дат, адресов, документов, телефонов, денежных сумм, марок автомобилей и пр.), шаблоны для распознавания различных классов событий и фактов (сделок, экономических показателей, конфликтов, биографических фактов и пр.), характеристик объекта (позитива, негатива и др.), высказываний прямой и косвенной речи.
Дополнительно в состав пакета RCO Fact Extractor SDK входят исходные коды приложений на С++, иллюстрирующие использование библиотеки RCO FX Ru для решения всех типовых задач, встающих перед разработчиками прикладных информационных систем:
построения смыслового портрета документа – множества слов и словосочетаний, ранжированных по значимости;
построения реферата текста, в том числе рефератов по каждой сущности;
построение ассоциативной семантической сети текста или коллекции текстов;
построения иерархического глоссария по коллекции текстов;
трансляции запроса на естественном языке в пакет запросов поисковой машины.
RCO Fact Extractor SDK работает на платформах Windows и Unix. Выпускается в редакциях Standard, Standard Plus, Professional и Exclusive.
|
|
|