Инвертированный индекс

19 марта 2013 г.

Чтобы Ваша раскрутка сайта была успешной и при подробном изучении поисковых систем следует знать следующие определения- прямой и инвертированный индекс.

Прямой индекс- это такой вид информации, который имеет практически каждая поисковая система. Она включает в себя снимок экрана поисковика с найденной информацией. В таком индексе информация видна также, как в реальности.

ПродвижениеА вот инвертированный индекс простой пользователь наблюдать не может. К этой информации имеет доступ лишь внутренний круг пользователей поисковиков. Такой вид индекса содержит в себе сведения о словах, которые были найдены и сохранены в базе данных. Инвертированный индекс подразделяется на две части- текст ссылок и контент документов. Эти обе части схожи по всем признакам.

Рассмотрим подробно одну из них.

Существует две таблицы:

Первая имеет вид определенного оглавления. В ней имеется два столбца, в которых находятся сами термины, отсортированные в алфавитном или ином порядке, и номера строк второй таблицы.

Во второй содержится информация о позициях слов из первой и их URL, по которым и происходит сортировка терминов. Также в этой таблицы содержатся все сведения о каких либо особенностях слов, например жирности или курсива.

Вся вышеизложенная информация используется поисковыми системами для определения места документа среди остальных по важности и вхождению в него всех слов.

Когда какой нибудь пользователь вводит текст в поисковик, система разбивает его на термины и по инвертированному индексу ищет и сортирует слова по вхождению в документ.

Теги: рубрика Интернет