августа 13, 2006

 

Яndex.Server — порядок на вашем веб-сервере

Яndex.Server — порядок на вашем веб-сервере

Как бы хорошо вы ни продумали структуру вашего веб-сервера, жизнь обычно богаче схемы. Сервер растет, его посетителям становится все сложнее и сложнее находить нужную информацию. Хождение по страничкам может стать столь долгим, что посетитель бросит cвое занятие, не дойдя до нужного места. Свободный поиск по всему содержанию, быстрая выдача результирующих документов, указание найденного в каждом тексте — может быть, это то, что нужно вам и вашему серверу?
Компания «Яндекс» предлагает вашему вниманию Яndex.Server — средство полнотекстового поиска информации на вашем веб-сервере или в локальной сети с учетом морфологии русского языка.
Вы можете легко настроить Яndex.Server на конкретные условия вашего сервера — указать, какие директории и типы файлов индексировать, а какие исключить, выбрать кодировку русского языка, указать способ получения документов (прямо из директории или через веб-сервер), перестраивать ли весь индекс при новом индексировании или организовать обновление и слияние.
Яndex.Server включает так называемого поискового робота — механизм, используемый поисковой системой Yandex.Ru, и позволяющий индексировать сайты не только в вашей локальной сети, а также результаты работы скриптов. Предполагается, что индексатор запускается регулярно, например каждой ночью, чтобы индекс всегда отражал текущее состояние веб-сервера.
Поиск работает с учетом морфологии русского и английского языков, например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т. д. На запрос «окно» будет выдана информация, содержащая и слово «окон», а на запрос «отзывали» — документы, содержащие слово «отозвали».
Развитый поисковый интерфейс позволяет помимо стандартных логических операторов (И, ИЛИ, НЕ) задавать поиск по близости, то есть указывать расстояние между словами в запросе. При индексации учитываются имена собственные. Если в запросе слово написано строчными буквами, то поиск будет произведен без учета больших и маленьких букв (без совпадения регистра). Если первая буква в слове прописная, найдутся только те документы, где это слово написано с большой буквы.
Существует поиск в зонах (заголовках, ссылках, аннотациях) и по атрибутам (датам, ссылкам, именам). Возможно настроить HTML-зоны и атрибуты, по которым необходимо проводить индексирование и поиск. Можно организовать независимые поиски в различных разделах вашего сайта. Мощный язык запросов позволил реализовать естественно-языковый запрос — то есть возможность обращаться к поисковой машине на естественном русском (или английском) языке. Качество поиска обеспечивается тонким алгоритмом расчета релевантности.
Результатом поиска является список документов, упорядоченных по релевантности, которая учитывает не только количество найденного, но и контрастность слов (частотные характеристики) и расстояние между словами. Внутри документа выделены (подсвечены) слова, участвующие в запросе. С каждого такого слова можно перейти на следующее и на предыдущее. Можно сортировать результат поиска и по времени появления (обновления) страниц.
Помимо настраиваемой функциональности Яndex.Server дает возможность по вашему вкусу настроить дизайн поисковой страницы и результатов поиска, организовывать нестандартные запросы, которые облегчат пользователям навигацию по вашему
сайту.

Comments: Отправить комментарий



<< Home
  • This page is powered by Blogger. Isn't yours?