|
|
|
ИНФОРМАЦИЯ О ТЕХНОЛОГИИ
Информационный раздел Поисковая машина
Russian Context ServerRussian Context Server является результатом разработок поисковых программных продуктов, проводимых нами для таких информационных систем, как ИС «ПАРК» и «Гарант - WWW». Russian Context Server поможет посетителям вашего Web-сервера просто и быстро находить нужную информацию. Теперь и вашему серверу будут доступны все преимущества этой простой и одновременно мощной поисковой системы.
Развитие интернет-технологий привело к увеличению количества информации, предоставляемой через World Wide Web. Рост объема информации в интернет привел к тому, что поиск нужного документа даже на одном-единственном Web-сервере стал представлять настоящую проблему. Опыт показывает, что с ростом объема Web-узла даже самая совершенная и продуманная система ссылок между документами не позволяет пользователю найти требуемую информацию за разумное время. Для решения этой проблемы и был разработан Russian Context Server.
Russian Context Server служит для поиска текстовой информации на корпоративном узле интернет или интранет под управлением операционной системы Windows. Эта поисковая машина позволяет задавать запросы на естественном языке (русском или английском) и получать результаты поиска с подсветкой искомых выражений в найденных документах.
При разработке Russian Context Server учитывалось, что процедура поиска должна быть максимально простой, а результаты - наглядными и информативными. Вследствие этого Russian Context Server был наделен следующими возможностями:
поиск документов по запросам на естественном русском и английском языке с учетом морфологии и стоп-слов;
ранжирование документов по степени соответствия запросу;
подсветка обнаруженных фраз и выражений в найденных документах;
поиск документов по реляционным атрибутам, например: дате, автору, источнику;
упорядочивание результатов поиска по различным критериям;
SQL-подобный язык запросов.
При разработке продукта также учитывалось, что он должен быть совместим с существующими интернет-технологиями и стандартами, устойчиво работать в условиях высокой нагрузки, характерной для Web-серверов. Такие требования обусловили ряд технологических решений, примененных в Russian Context Server.
Остановимся на следующих технологических особенностях Russian Context Server:
Индексирование Web-страниц.
Поисковая машина Russian Context Server является так называемой индексирующей системой и прежде, чем производить поиск документов, она производит накопление информации о положении всех слов на страницах Web-узла. Эта информация сохраняется внутри специализированной компактной базы данных, обеспечивающей быстрое обнаружение требуемых документов при поиске.
Высокая скорость работы.
Для поисковых систем наиболее важным критерием их эффективности является скорость индексирования и поиска информации. Russian Context Server позволяет индексировать текстовую информацию со скоростью более 100 МБайт в час и обрабатывать более 10 тысяч сложных поисковых запросов в сутки.
Гибкость технологии
Основным преимуществом интернет–технологий является их исключительная гибкость. Решения на базе Russian Context Server в полной мере используют это преимущество и могут быть использованы для поиска не только по страницам WWW-сервера, но также по базам данных, файловым архивам и т.п.
Работа с пятью кодировками кириллицы.
Исторически сложилось так, что в русской части Интернет одновременно используется несколько кодировок кириллицы. Russian Context Server автоматически распознает кодировку документов в пяти основных кодировках: Windows-1251, DOS Cyrillic 866, KOI8-R (Unix), Mac Cyrillic и ISO 8859-5 (Sun). Отчёты о найденных документах могут генерироваться в любой из перечисленных кодировок.
Таким образом, Russian Context Server представляет собой мощную поисковую систему, позволяющую значительно упростить работу с информацией на вашем узле World Wide Web.
Статьи раздела:
Russian Context Server
|
|
|