Индексирование Web-узлов

       

Индексирование Webузлов


Закрепление материала

1. Что необходимо для индексирования документов специальных форматов (например, файлов Microsoft Word)?

Для индексирования документов специальных форматов необходимы соответствующие фильтры содержимого. В состав Index Server входят несколько фильтров по умолчанию: для текстовых файлов, для HTML-файлов, для файлов Word 95, Word 97, Excel 95, Excel 97, PowerPoint 95 и PowerPoint 97, а также фильтр свойств двоичных файлов.

Для индексирования документов другого типа необходимо приобрести и установить соответствующий фильтр содержимого.

2. Какие факторы влияют на производительность Index Server?

Число индексируемых документов, объем данных, частота запросов и их тип.

3. Что можно сделать, чтобы уменьшить время обработки запросов к часто используемым документам?

Добавьте часто используемые документы в кэш свойств с помощью встраиваемого административного модуля Index Server. Извлечение свойств запрашиваемых документов из кэша, а не из самого документа значительно повышает производительность обслуживания запросов.

4. Какие средства Index Server позволяют отображать ту часть документа, которая удовлетворяет Вашему запросу?

Выделение искомого текста в найденных документах позволяет создать HTML-страницу со списком документов, отвечающих критериям Запроса, с выделением искомых слов красным курсивом. Кнопки Show Highlights (condensed) и Show Highlights (full text), расположенные под резюме каждого из найденных документов, позволяют посмотреть выделенные слова в выбранном документе.

5. Как исключить некоторые папки из процесса индексирования?

Индексирование и поиск документов ведется в так называемой области индексирования, отсчитываемой от виртуального корня. Чтобы исключить виртуальную папку из области индексирования, в Диспетчере служб Интернета откройте окно свойств Directory этой папки и снимите флажок Index This Resource.

Кроме того, в соответствующем IDQ-файле Вы можете перечислить файлы, не подлежащие включению в результат запроса.

6. Если пользователь не имеет доступа к конкретному файлу на узле Интернета или интрасети, может ли этот файл фигурировать среди возвращаемых пользователю результатов запросов?

В процессе фильтрования документов Index Server сохраняет информацию из соответствующих списков кот-роля доступа файловой системы Windows NT. На основании этой информации Index Server выясняет есть ли у автора запроса права доступа к найденным файлам. Если права доступа к какому-либо из файлов нет, он не попадает в результат выполнения запроса, что предотвращает несанкционированный доступ.



Содержание раздела