Инвертированный индекс
Чтобы Ваша раскрутка сайта была успешной и при подробном изучении поисковых систем следует знать следующие определения- прямой и инвертированный индекс.
Прямой индекс- это такой вид информации, который имеет практически каждая поисковая система. Она включает в себя снимок экрана поисковика с найденной информацией. В таком индексе информация видна также, как в реальности.
А вот инвертированный индекс простой пользователь наблюдать не может. К этой информации имеет доступ лишь внутренний круг пользователей поисковиков. Такой вид индекса содержит в себе сведения о словах, которые были найдены и сохранены в базе данных. Инвертированный индекс подразделяется на две части- текст ссылок и контент документов. Эти обе части схожи по всем признакам.
Рассмотрим подробно одну из них.
Существует две таблицы:
Первая имеет вид определенного оглавления. В ней имеется два столбца, в которых находятся сами термины, отсортированные в алфавитном или ином порядке, и номера строк второй таблицы.
Во второй содержится информация о позициях слов из первой и их URL, по которым и происходит сортировка терминов. Также в этой таблицы содержатся все сведения о каких либо особенностях слов, например жирности или курсива.
Вся вышеизложенная информация используется поисковыми системами для определения места документа среди остальных по важности и вхождению в него всех слов.
Когда какой нибудь пользователь вводит текст в поисковик, система разбивает его на термины и по инвертированному индексу ищет и сортирует слова по вхождению в документ.