Индексирование Webузлов
Закрепление материала
1. Что необходимо для индексирования документов специальных форматов (например, файлов Microsoft Word)?
Для индексирования документов специальных форматов необходимы соответствующие фильтры содержимого. В состав Index Server входят несколько фильтров по умолчанию: для текстовых файлов, для HTML-файлов, для файлов Word 95, Word 97, Excel 95, Excel 97, PowerPoint 95 и PowerPoint 97, а также фильтр свойств двоичных файлов.
Для индексирования документов другого типа необходимо приобрести и установить соответствующий фильтр содержимого.
2. Какие факторы влияют на производительность Index Server?
Число индексируемых документов, объем данных, частота запросов и их тип.
3. Что можно сделать, чтобы уменьшить время обработки запросов к часто используемым документам?
Добавьте часто используемые документы в кэш свойств с помощью встраиваемого административного модуля Index Server. Извлечение свойств запрашиваемых документов из кэша, а не из самого документа значительно повышает производительность обслуживания запросов.
4. Какие средства Index Server позволяют отображать ту часть документа, которая удовлетворяет Вашему запросу?
Выделение искомого текста в найденных документах позволяет создать HTML-страницу со списком документов, отвечающих критериям Запроса, с выделением искомых слов красным курсивом. Кнопки Show Highlights (condensed) и Show Highlights (full text), расположенные под резюме каждого из найденных документов, позволяют посмотреть выделенные слова в выбранном документе.
5. Как исключить некоторые папки из процесса индексирования?
Индексирование и поиск документов ведется в так называемой области индексирования, отсчитываемой от виртуального корня. Чтобы исключить виртуальную папку из области индексирования, в Диспетчере служб Интернета откройте окно свойств Directory этой папки и снимите флажок Index This Resource.
Кроме того, в соответствующем IDQ-файле Вы можете перечислить файлы, не подлежащие включению в результат запроса.
6. Если пользователь не имеет доступа к конкретному файлу на узле Интернета или интрасети, может ли этот файл фигурировать среди возвращаемых пользователю результатов запросов?
В процессе фильтрования документов Index Server сохраняет информацию из соответствующих списков кот-роля доступа файловой системы Windows NT. На основании этой информации Index Server выясняет есть ли у автора запроса права доступа к найденным файлам. Если права доступа к какому-либо из файлов нет, он не попадает в результат выполнения запроса, что предотвращает несанкционированный доступ.