ПерваяНовостиО технологииOn-line переводчикСсылки


Ukraine Context Optimizer.Технологии информационного поиска


НОВОСТИ

25.04.2007
Russian Context Optimizer - RCO.

В последние годы наблюдается бурный рост рынка приложений, использующих полнотекстовый поиск в документоориентированных базах данных. Это связано с развитием Internet/Intranet технологий, систем документооборота, а также с появлением коммерческого программного обеспечения, интегрирующего стандартные возможности реляционных баз данных с возможностями полнотекстового поиска, семантического анализа и автоматической классификации документов. СУБД Oracle позволяет реализовать указанные возможности и имеет мощный инструментарий для создания приложений. СУБД Oracle работает с текстами на многих европейских языках, но при работе с документами на русском недостаточно эффективен, так как задействует лингвистические технологии, которые зависят от лексики, грамматики и семантики языка.

RCO for Oracle позволяет значительно расширить возможности Oracle в русскоязычных базах данных. RCO for Oracle предназначается для системных интеграторов и разработчиков приложений, использующих возможности информационного поиска, а также отделов автоматизации производства среднего и крупного бизнеса.

Преимущества

Oracle Text, являясь компонентой СУБД Oracle, представляет собой высокопроизводительную информационно-поисковую систему, обладающую широким спектром возможностей. RCO дополняет Oracle Text лингвистическим обеспечением, необходимым для полноценной поддержки русского языка. В частности, RCO позволяет осуществлять поиск с учетом словоформ русского языка, повышая полноту и точность выдаваемых результатов, выделять значимые темы документов, строить рефераты, классифицировать документы по рубрикам, налету группировать списки документов в иерархии, наглядно представляя результаты поиска.

RCO позволит использовать для русского языка все преимущества используемых вами продуктов Oracle.

Такие продукты Oracle, как Ultra Search, Collaboration Suite, Internet Application Server, Content Mamagement SDK (бывший Internet File System) используют средства Oracle Text для организации полнотекстового поиска. Учет словоформ русского языка, предоставляемый RCO, значительно упростит поиск нужных документов при решении задач из различных предметных областей, в которых применяются перечисленные продукты.

RCO упростит для вас задачу поиска в корпоративных архивах.

По оценкам IDC, 90% корпоративной информации представлено в виде текста. Oracle Ultra Search совместно с RCO поможет вам объединить все корпоративные ресурсы в единое информационное пространство. Это позволит вам эффективно использовать опыт компании, накопленный в предыдущих проектах.

RCO предоставляет не только поисковые, но и аналитические возможности.

Широкий спектр алгоритмов анализа текста и лингвистического обеспечения, входящего в RCO, позволит вам получить не только средство поиска документов, но и мощный аналитический инструмент, обладающий такими функциями как:

маршрутизация и классификация потока документов (например, сообщения новостной ленты, электронная почта),
представление тематической структуры исследуемого информационного массива,
представление динамики изменения тематического поля вокруг интересующего предмета/объекта,
выявление ассоциативных связей между темами/объектами.
Постройте решение для своего аналитического отдела на базе RCO! Это повысит качество работы ваших аналитиков.

RCO повысит качество услуг для ваших клиентов.

Если ваш корпоративный web-сайт или интернет-магазин построен на технологиях Oracle, используйте RCO, чтобы помочь вашему клиенту быстрее и проще найти требуемую информацию или товар.

RCO поможет достичь преимущества перед конкурентами.

Если вы являетесь поставщиком решений в области организации электронных архивов, систем управления знаниями или систем управления документооборотом на базе технологий Oracle, добавление в ваше решение функциональности RCO поможет вам опередить конкурентов. Ваши конкуренты используют только контекстный поиск по точному совпадению, в то время как поисковая служба Вашего решения на базе RCO сможет давать ответы даже на неявные запросы!

Технические подробности

Oracle Text представляет собой поисковую машину, встроенную в Oracle Database. Это позволяет задавать в запросах одновременно задавать контекстные и реляционные ограничения, а также выполнять администрирование реляционных и полнотекстовых индексов едиными средствами. Среди возможностей Oracle Text следует выделить следующие:

работа с документами, хранящимися как в СУБД Oracle, так и в файловой системе и в Web,
поддержка более 150 различных форматов документов,
богатый язык поисковых запросов, включающий логические связки, поиск с учетом расстояния между словами, использование метасимволов и т.д.
мощные лингвистические опции, такие как поиск с учетом словоформ, нечеткий поиск, расширение запросов при помощи тезауруса,тематический анализ, реферирование, классификация, кластерный анализ.
Однако для русского языка Oracle Text реализует только базовые поисковые возможности. RCO for Oracle решает проблему полноценной реализации всех существующих функций Oracle Text для русского языка, а именно:

поиск документов с учетом всех грамматических форм слов запроса;
поиск слов, близких по написанию; нечеткий поиск;
расширение запроса синонимами, более общими и более частными понятиями на основе тезауруса общей лексики русского языка;
поиск документов по ключевым темам, которые автоматически выделяются при индексировании;
выявление смысловых связей между темами документов, что позволяет расширять или уточнять запрос ассоциативно близкими темами;
составление общих и тематических рефератов документов;
автоматическое построение иерархических рубрикаторов и классификация документов по рубрикам;
поддержка всех кодовых страниц русского языка.
Морфологический анализатор RCO позволяет обрабатывать более 110 тысяч слов, заданных в морфологическом словаре, а также любые неизвестные слова, анализируя их по аналогии с похожими известными словами. Используемый при этом словарь лингвистических данных для русского языка включает в себя помимо словооснов, 6 тысяч окончаний, 1.5 тысячи моделей словоизменения, 200 суффиксов, что соответствует 2.5 миллионам распознаваемых словоформ.

В состав тезауруса RCO вошло около 75 тысяч слов и словосочетаний, объединенных в 22 тысячи гипонимических рядов (22 тысячи гиперонимов), в том числе 17 тысяч синонимических рядов, охватывающих 45 тысяч слов.

В состав RCO for Oracle Enterprise Edition входят средства актуализации морфологического словаря и тезауруса, включающие их исходные тексты, средства сборки и верификации, а также приложения для автоматизированного пополнения морфологического словаря.

RCO основан на открытых стандартах и спецификациях Oracle. В RCO предусмотрена возможность интеграции с существующими приложениями, использующими Oracle Text, что позволяет расширить их функциональные возможности. Это касается не только прикладных решений, но и продуктов корпорации Oracle:

Oracle Ultra Search (средство для организации поиска по разнородным информационным ресурсам, бесплатно поставляется в составе Oracle database),
Oracle Internet Application Server (средство создания интернет и интранет приложений, содержит портлет для поиска по документам и формам портала, использующий Oracle Text)
Oracle Collaboration Suite (служит для организации коллективной работы, включающее электронную и голосовую почту, средства публикации, календарь, использующее поиск Ultra Search),
Oracle Content Management SDK (бывший Internet File System, средство управления документами различной природы с возможностью поддержания структуры каталогов, разграничением прав доступа, ведения версий документов, использующее Oracle Text для поиска).
Платформы и версии:

В настоящее время существуют коммерческие версии продукта для Windows и различных UNIX-платформ (SUN Solaris, SCO UnixWare, Compaq Tru64 Unix, HP UX, IBM AIX).



Все новости

Статья директора компании «Текон» Евгения Коржова «UOSES: «правовой» доступ к информации в корпорации» в журнале «Директор Информационной службы» №3/2008 г. [24.06.2008]

Статья "Лингвистика для бизнеса: поиск общего языка" директора компании "Текон" Коржова Е.И. "Корпоративная информация: особенности поиска" опубликованная в журнале "Копоративные системы" №3/2008г. [13.06.2008]

Участие в конференции Диалог [12.06.2008]

Технологии RCO на Украине [25.04.2008]

Статья диретора компании "Текон" Коржова Е.И. "Корпоративная информация: особенности поиска" опубликованная в журнале "Копоративные системы" №2/2008г. [10.04.2008]

Статья "Украинизация лингвистических возможностей ORACLE" [10.04.2008]

Автоматизация государственного языка [12.03.2008]

Решения RCO внедрены в новостной агрегатор CNews Дайджест. [31.01.2008]

RCO Fact Extractor SDK - новый пакет для анализа текста [30.10.2007]

Технологии RCO в новой системе для поиска данных в корпоративной информационной среде - ROSES [16.10.2007]

ФОРС выводит на рынок РФ поисковую систему для корпоративных сетей [15.10.2007]

Компания "Текон" зарегистрировала торговый знак "UCO". [17.08.2007]

Участие в конференции Диалог'2007 "Компьютерная лингвистика и интеллектуальные технологии" [06.06.2007]

Russian Context Optimizer - RCO. [25.04.2007]

Открыт английский сайт RCO. [19.03.2007]

RCO представляет последние разработки на CEBIT'2007 [14.03.2007]

RCO Fact Extractor "завалил" серебряного ЗУБРа! [02.03.2007]

Новые версии RCO Semantic Entity Extractor SDK и RCO Fact Extractor SDK. [19.10.2006]

Статья "Технологии извлечения знаний из текста". [18.09.2006]

Статья "Мост между мирами" [09.08.2006]

Выход очередной версии UCO для Оракл (Oracle). [21.04.2006]

Обновлен ассортимент программных продуктов RCO и политика их лицензирования [05.12.2005]

RCO for BackOffice дополнен инструментарием для разработчиков информационно-поисковых систем [28.09.2005]

Для ТНК-ВР создан и запущен в эксплуатацию новый двуязычный интранет-сайт проекта по реинжинирингу системы снабжения (SPR). [15.08.2005]

Участие наших партнеров Гарант-Парк_интернет в Международной конференции Диалог [16.06.2005]

GTRF.ru: записи общей продолжительностью 15 лет [05.05.2005]

Группа ИСТ ЛАЙН использует интранет-технологии для формирования корпоративной культуры [05.05.2005]

На сайте наших партнеров "Гарант-Парк-Интернет" обновлен раздел "Технологии" [05.04.2005]

Доклад "Текон" - Технологии анализа и поиска текстовой информации. Ukraine Context Optimizer для платформы Windows & Linux. [22.02.2005]

Участие "Текон" в семинаре для разработчиков программного обеспечения на базе технологий Oracle. [15.02.2005]

19-20 января 2005 специалисты компании "Гарант-Парк-Интернет" приняли участие в 3-ей конференции "Конкурентная разведка в металлургии", проходившей в Москве в гостинице «Балчуг Кемпински». [28.01.2005]

Программа для поиска фактов в тексте RCO Fact Extractor 1.0 [12.01.2005]

Новый генератор отчетов для корпоративных хранилищ текстовой информации масштаба предприятия. [16.11.2004]

Веб-сервис в приложениях Microsoft Office 2003. [09.11.2004]

Online-заказы на продукты RCO. [04.11.2004]

Открытие первого этапа проекта. [27.10.2004]

“Гарант-Парк-Интернет” приняла участие в семинаре по оценке методов информационного поиска РОМИП'2004 [07.10.2004]

Aladdin и «Гарант-Парк-Интернет»: новое партнерство, новые перспективы [04.10.2004]

Oracle буде «розмовляти» українською. [20.09.2004]

Программный продукт RCO for Backoffice исправляет ошибки Microsoft [17.09.2004]

Библиотека анализа текста RCO Semantic Network 3.0 – инструмент для компьютерной разведки [17.09.2004]

Гарант-Парк-Интернет и TECON продвигают поисковые технологии RCO® в Украине. [12.09.2004]







Авторское право © Компания Текон & Студия РОМАрт, 2004-2008.
UCO™ является торговой маркой компаний Текон и "ЭР СИ О".
RCO™ является торговой маркой компании "ЭР СИ О".
Все права защищены.


Яндекс цитирования Webalta Уровень доверия