ПерваяНовостиО технологииOn-line переводчикСсылки


Ukraine Context Optimizer.Технологии информационного поиска


НОВОСТИ

28.07.2008
Вышла новая версия пакета лингвистического анализа русского текста RCO Fact Extractor SDK 2.0

В версии 2.0 ядра пакета - библиотеке RCOFXRu.dll - реализованы следующие обновления:

Добавлены новые настройки, позволяющие регулировать механизм выделения фреймов, в частности, определять условия обработки неоднозначных ситуаций, одновременно относимых к фреймам различных классов.

Реализован новый механизм установления анафорических связей между именами нарицательными (в предыдущей версии анафорические связи устанавливались только между именами собственными, личными местоимениями). Теперь для сущности, обозначенной в тексте именем существительным, устанавливается ссылка на ее предыдущее упоминание в тексте - кореферентную сущность, например: … коммерческое образование … <- … образование …; … депутат Думы … <- … этот депутат … ; … взорвать мост … <- … взрыв …

Встроенные средства обеспечивают использование анафорических связей при синтезе имен сущностей для получения более развернутых словосочетаний (этот налог = новый налог на имущество, введение этого налога = введение нового налога на имущество, реформа = реформировать сельское хозяйство).


При поиске ситуаций теперь находятся дополнительные участники, связанные с кореферентными сущностями в других предложениях текста. Сущности, заполняющие слоты фрейма, теперь могут находиться в различных предложениях.

Существенно переработаны алгоритмы обработки имен собственных и снятия омонимии, что обеспечило повышение полноты и точности выделения персон, организаций, географических и прочих именованных объектов. Теперь при идентификации слов и словосочетаний, похожих на имена собственные (написанных с большой буквы, в кавычках и т.п.), используется информация о контексте их упоминания в рамках всего текста (в прошлой версии библиотеки учитывались только предыдушие упоминания по тексту). Реализован многопроходный механизм контекстно-зависимой идентификации, когда на первой фазе анализа всего текста выделяются наиболее достоверные имена (В.А. Волков, ООО "Красные ворота"), а на каждой последующей фазе - все менее достоверные (Владимир Волков, компания Ромашка, мэр Лужков, город Владимир, "Красные ворота"), завершая этот процесс идентификацией отдельных слов (Волков, Владимир, Ромашка, Лужков), причем на каждой фазе используется информация об именах, идентифицированных на предыдущих фазах в рамках целого текста.

С подробным описанием продукта можно ознакомиться
Здесь



Все новости

Компания RCO анонсирует расширения для продукта IBM OmniFind. [01.10.2008]

Появилось описание библиотеки семантических шаблонов [24.09.2008]

Статья "Практические применения анализа текстовой информации" директора компании "Текон" Коржова Е.И. опубликованная в журнале "Копоративные системы" №4/2008г. [24.09.2008]

Вышла новая версия пакета лингвистического анализа русского текста RCO Fact Extractor SDK 2.0 [28.07.2008]

Статья директора компании «Текон» Евгения Коржова «UOSES: «правовой» доступ к информации в корпорации» в журнале «Директор Информационной службы» №3/2008 г. [24.06.2008]

Статья "Лингвистика для бизнеса: поиск общего языка" директора компании "Текон" Коржова Е.И. "Корпоративная информация: особенности поиска" опубликованная в журнале "Копоративные системы" №3/2008г. [13.06.2008]

Участие в конференции Диалог [12.06.2008]

Технологии RCO на Украине [25.04.2008]

Статья диретора компании "Текон" Коржова Е.И. "Корпоративная информация: особенности поиска" опубликованная в журнале "Копоративные системы" №2/2008г. [10.04.2008]

Статья "Украинизация лингвистических возможностей ORACLE" [10.04.2008]

Автоматизация государственного языка [12.03.2008]

Решения RCO внедрены в новостной агрегатор CNews Дайджест. [31.01.2008]

RCO Fact Extractor SDK - новый пакет для анализа текста [30.10.2007]

Технологии RCO в новой системе для поиска данных в корпоративной информационной среде - ROSES [16.10.2007]

ФОРС выводит на рынок РФ поисковую систему для корпоративных сетей [15.10.2007]

Компания "Текон" зарегистрировала торговый знак "UCO". [17.08.2007]

Участие в конференции Диалог'2007 "Компьютерная лингвистика и интеллектуальные технологии" [06.06.2007]

Russian Context Optimizer - RCO. [25.04.2007]

Открыт английский сайт RCO. [19.03.2007]

RCO представляет последние разработки на CEBIT'2007 [14.03.2007]

RCO Fact Extractor "завалил" серебряного ЗУБРа! [02.03.2007]

Новые версии RCO Semantic Entity Extractor SDK и RCO Fact Extractor SDK. [19.10.2006]

Статья "Технологии извлечения знаний из текста". [18.09.2006]

Статья "Мост между мирами" [09.08.2006]

Выход очередной версии UCO для Оракл (Oracle). [21.04.2006]

Обновлен ассортимент программных продуктов RCO и политика их лицензирования [05.12.2005]

RCO for BackOffice дополнен инструментарием для разработчиков информационно-поисковых систем [28.09.2005]

Для ТНК-ВР создан и запущен в эксплуатацию новый двуязычный интранет-сайт проекта по реинжинирингу системы снабжения (SPR). [15.08.2005]

Участие наших партнеров Гарант-Парк_интернет в Международной конференции Диалог [16.06.2005]

GTRF.ru: записи общей продолжительностью 15 лет [05.05.2005]

Группа ИСТ ЛАЙН использует интранет-технологии для формирования корпоративной культуры [05.05.2005]

На сайте наших партнеров "Гарант-Парк-Интернет" обновлен раздел "Технологии" [05.04.2005]

Доклад "Текон" - Технологии анализа и поиска текстовой информации. Ukraine Context Optimizer для платформы Windows & Linux. [22.02.2005]

Участие "Текон" в семинаре для разработчиков программного обеспечения на базе технологий Oracle. [15.02.2005]

19-20 января 2005 специалисты компании "Гарант-Парк-Интернет" приняли участие в 3-ей конференции "Конкурентная разведка в металлургии", проходившей в Москве в гостинице «Балчуг Кемпински». [28.01.2005]

Программа для поиска фактов в тексте RCO Fact Extractor 1.0 [12.01.2005]

Новый генератор отчетов для корпоративных хранилищ текстовой информации масштаба предприятия. [16.11.2004]

Веб-сервис в приложениях Microsoft Office 2003. [09.11.2004]

Online-заказы на продукты RCO. [04.11.2004]

Открытие первого этапа проекта. [27.10.2004]

“Гарант-Парк-Интернет” приняла участие в семинаре по оценке методов информационного поиска РОМИП'2004 [07.10.2004]

Aladdin и «Гарант-Парк-Интернет»: новое партнерство, новые перспективы [04.10.2004]

Oracle буде «розмовляти» українською. [20.09.2004]

Программный продукт RCO for Backoffice исправляет ошибки Microsoft [17.09.2004]

Библиотека анализа текста RCO Semantic Network 3.0 – инструмент для компьютерной разведки [17.09.2004]

Гарант-Парк-Интернет и TECON продвигают поисковые технологии RCO® в Украине. [12.09.2004]







Авторское право © Компания Текон & Студия РОМАрт, 2004-2008.
UCO™ является торговой маркой компаний Текон и "ЭР СИ О".
RCO™ является торговой маркой компании "ЭР СИ О".
Все права защищены.


Яндекс цитирования Webalta Уровень доверия