ПерваяНовостиО технологииOn-line переводчикСсылки


Ukraine Context Optimizer.Технологии информационного поиска


ИНФОРМАЦИЯ О ТЕХНОЛОГИИ

Информационный раздел
Поиск для oracle

RCO и UCO for Oracle

В последние годы наблюдается бурный рост рынка приложений, использующих полнотекстовый поиск в документоориентированных базах данных. Это связано с развитием Internet/Intranet технологий, систем документооборота, а также с появлением коммерческого программного обеспечения, интегрирующего стандартные возможности реляционных баз данных с возможностями полнотекстового поиска, семантического анализа и автоматической классификации документов. СУБД Oracle позволяет реализовать указанные возможности и имеет мощный инструментарий для создания приложений. СУБД Oracle работает с текстами на многих европейских языках, но при работе с документами на русском недостаточно эффективен, так как задействует лингвистические технологии, которые зависят от лексики, грамматики и семантики языка.

RCO и UCO for Oracle позволяет значительно расширить возможности Oracle в русско-украинских язычных базах данных. RCO и UCO for Oracle предназначается для системных интеграторов и разработчиков приложений, использующих возможности информационного поиска, а также отделов автоматизации производства среднего и крупного бизнеса.

Преимущества

Oracle Text, являясь компонентой СУБД Oracle, представляет собой высокопроизводительную информационно-поисковую систему, обладающую широким спектром возможностей. RCO и UCO дополняют Oracle Text лингвистическим обеспечением, необходимым для полноценной поддержки русского языка. В частности, RCO и UCO позволяют осуществлять поиск с учетом словоформ русского и украинского языков, повышая полноту и точность выдаваемых результатов, выделять значимые темы документов, строить рефераты, классифицировать документы по рубрикам, налету группировать списки документов в иерархии, наглядно представляя результаты поиска.

RCO и UCO позволят использовать для русского и украинского языков все преимущества используемых вами продуктов Oracle.

Такие продукты Oracle, как Ultra Search, Collaboration Suite, Internet Application Server, Content Mamagement SDK (бывший Internet File System) используют средства Oracle Text для организации полнотекстового поиска. Учет словоформ русского языка, предоставляемый RCO и UCO, значительно упростит поиск нужных документов при решении задач из различных предметных областей, в которых применяются перечисленные продукты.

RCO упростит для вас задачу поиска в корпоративных архивах.

По оценкам IDC, 90% корпоративной информации представлено в виде текста. Oracle Ultra Search совместно с RCO и UCO поможет вам объединить все корпоративные ресурсы в единое информационное пространство. Это позволит вам эффективно использовать опыт компании, накопленный в предыдущих проектах.

RCO предоставляет не только поисковые, но и аналитические возможности.

Широкий спектр алгоритмов анализа текста и лингвистического обеспечения, входящего в RCO и UCO, позволит вам получить не только средство поиска документов, но и мощный аналитический инструмент, обладающий такими функциями как:

маршрутизация и классификация потока документов (например, сообщения новостной ленты, электронная почта),
представление тематической структуры исследуемого информационного массива,
представление динамики изменения тематического поля вокруг интересующего предмета/объекта,
выявление ассоциативных связей между темами/объектами.
Постройте решение для своего аналитического отдела на базе RCO или UCO! Это повысит качество работы ваших аналитиков.

RCO и UCO повысят качество услуг для ваших клиентов.

Если ваш корпоративный web-сайт или интернет-магазин построен на технологиях Oracle, используйте RCO и UCO, чтобы помочь вашему клиенту быстрее и проще найти требуемую информацию или товар.

RCO и UCO помогут достичь преимущества перед конкурентами.

Если вы являетесь поставщиком решений в области организации электронных архивов, систем управления знаниями или систем управления документооборотом на базе технологий Oracle, добавление в ваше решение функциональности RCO и UCO поможет вам опередить конкурентов. Ваши конкуренты используют только контекстный поиск по точному совпадению, в то время как поисковая служба Вашего решения на базе RCO и UCO сможет давать ответы даже на неявные запросы!

Технические подробности

Oracle Text представляет собой поисковую машину, встроенную в Oracle Database. Это позволяет задавать в запросах одновременно задавать контекстные и реляционные ограничения, а также выполнять администрирование реляционных и полнотекстовых индексов едиными средствами. Среди возможностей Oracle Text следует выделить следующие:

работа с документами, хранящимися как в СУБД Oracle, так и в файловой системе и в Web,
поддержка более 150 различных форматов документов,
богатый язык поисковых запросов, включающий логические связки, поиск с учетом расстояния между словами, использование метасимволов и т.д.
мощные лингвистические опции, такие как поиск с учетом словоформ, нечеткий поиск, расширение запросов при помощи тезауруса,тематический анализ, реферирование, классификация, кластерный анализ.
Однако для русского языка Oracle Text реализует только базовые поисковые возможности. RCO и UCO for Oracle решает проблему полноценной реализации всех существующих функций Oracle Text для русского и украинского языков, а именно:

поиск документов с учетом всех грамматических форм слов запроса;
поиск слов, близких по написанию; нечеткий поиск;
расширение запроса синонимами, более общими и более частными понятиями на основе тезауруса общей лексики русского и украинского языков;
поиск документов по ключевым темам, которые автоматически выделяются при индексировании;
выявление смысловых связей между темами документов, что позволяет расширять или уточнять запрос ассоциативно близкими темами;
составление общих и тематических рефератов документов;
автоматическое построение иерархических рубрикаторов и классификация документов по рубрикам;
поддержка всех кодовых страниц русского и украинского языков.
Морфологический анализатор RCO и UCO позволяет обрабатывать более 110 тысяч слов, заданных в морфологическом словаре, а также любые неизвестные слова, анализируя их по аналогии с похожими известными словами. Используемый при этом словарь лингвистических данных для русского и украинского языков включает в себя помимо словооснов, 6 тысяч окончаний, 1.5 тысячи моделей словоизменения, 200 суффиксов, что соответствует 2.5 миллионам распознаваемых словоформ.

В состав тезауруса RCO и UCO вошло около 75 тысяч слов и словосочетаний, объединенных в 22 тысячи гипонимических рядов (22 тысячи гиперонимов), в том числе 17 тысяч синонимических рядов, охватывающих 45 тысяч слов.

В состав RCOи UCO for Oracle Enterprise Edition входят средства актуализации морфологического словаря и тезауруса, включающие их исходные тексты, средства сборки и верификации, а также приложения для автоматизированного пополнения морфологического словаря.

RCO и UCO основан на открытых стандартах и спецификациях Oracle. В RCO и UCO предусмотрена возможность интеграции с существующими приложениями, использующими Oracle Text, что позволяет расширить их функциональные возможности. Это касается не только прикладных решений, но и продуктов корпорации Oracle:

Oracle Ultra Search (средство для организации поиска по разнородным информационным ресурсам, бесплатно поставляется в составе Oracle database),
Oracle Internet Application Server (средство создания интернет и интранет приложений, содержит портлет для поиска по документам и формам портала, использующий Oracle Text)
Oracle Collaboration Suite (служит для организации коллективной работы, включающее электронную и голосовую почту, средства публикации, календарь, использующее поиск Ultra Search),
Oracle Content Management SDK (бывший Internet File System, средство управления документами различной природы с возможностью поддержания структуры каталогов, разграничением прав доступа, ведения версий документов, использующее Oracle Text для поиска).
Платформы и версии:

В настоящее время существуют коммерческие версии продукта для Windows и различных UNIX-платформ (SUN Solaris, SCO UnixWare, Compaq Tru64 Unix, HP UX, IBM AIX).

Последняя версия продукта - RCO и UCO for Oracle 4.0.1

Зарегистрироваться и скачать trial-версию RCO и UCO 4.0.1

RCO 4.0.1

новая архитектура системы,
полностью переработан системный интерфейс взаимодействия модулей RCO (значительное увеличение скорости работы),
новая функция ThemeGetSynonyms - получение синонимов и гипонимов слова в тезаурусе
RCO 4.0

возможность вызова внешних процедур Oracle для работы с RCO и UCO,
средства для работы со словарями,
средства для работы с рубрикаторами;
Учебный курс

Пройти курс обучения по использованию RCO и UCO можно в учебном центре компании Форс







Статьи раздела:
RCO и UCO for Oracle

Информационные разделы

Генератор статистических отчетов
Инструментарий аналитика
Инструментарий разработчика
Лингвистическое обеспечение
Поиск для Microsoft
Поиск для Oracle
Поисковая машина
Технологии автоматического анализа текста
Технологии информационного поиска
Технологии навигации в информационных массивах .







Авторское право © Компания Текон & Студия РОМАрт, 2004-2008.
UCO™ является торговой маркой компаний Текон и "ЭР СИ О".
RCO™ является торговой маркой компании "ЭР СИ О".
Все права защищены.


Яндекс цитирования Webalta Уровень доверия