Индексирование Web-узлов

       

Словари


Словари — это небольшие временные индексы, хранящиеся в памяти. Каждый словарь содержит сведения о нескольких документах. Когда Index Server фильтрует документ, он сохраняет данные в словаре. Создание словарей занимает очень мало времени и не требует обновления информации на жестком диске. Словари выполняют роль области промежуточного хранения данных при индексировании. Для управления поведением словарей можно воспользоваться ключами реестра, которые находятся в разделе

\HKEY_LOCAI_MACHINE\SYSTEM\CurrentControlSet\Control\Content Index . В приведенной ниже таблице перечислены ключи реестра, относящиеся к словарям, и их описание.



Параметр Описание
MaxWordLists Максимальное число одновременно существующих словарей
MaxWordlistSize Максимальный объем памяти, занимаемый отдельным словарем. По достижении этого значения в словарь добавляются только слова того документа, который фильтруется в данный момент. Слова других документов будут позднее помещены в другие файлы. Единица измерения — 128 кб (например, значение 20 эквивалентно 2,5 Мб).
MinSizeMergeWordlists Минимальный общий размер словарей, по достижении которого выполняется их слияние в промежуточный индекс
MinWordlistMemory Минимальный объем памяти для создания словаря

Когда число словарей превосходит значение параметра MaxWordLists, Index Server объединяет их в промежуточный индекс с помощью процесса, называемого промежуточным слиянием (Вы познакомитесь с ним позже на этом занятии). Хотя при хранении слов в словаре применяется сжатие данных, оно не слишком эффективно, поскольку словари — всего лишь временные структуры. Кроме того, поскольку словари хранятся в памяти, документы, на основе которых они построены, придется фильтровать заново при следующем запуске Internet Information Server Index Server самостоятельно определяет, когда необходимо повторное фильтрование, и выполняет его автоматически.



Содержание раздела