Индекс – применяемая в информационных системах структура данных, служащая для ускорения, улучшения работы поиска. Индекс позволяет при увеличении размера данных добиться значительного ускорения поиска информации.
В контексте темы Интернет наибольший интерес представляет индексирование поисковыми машинами содержимого сайтов. Если по запросу пользователя поисковая система будет просматривать весь массив информации на предмет обнаружения заданных ключевых слов, то поиск практически будет невозможен.
Поэтому поисковые роботы содержимое страниц вносят в индекс – структуру, где описываются ключевые слова и приводится перечень ссылок, где они встречаются. Ранжирование (упорядочивание) списка ресурсов при выдаче пользователю производится в соответствии с общей релевантностью (адекватностью) запросу. Общая релевантность различными системами определяется на основе разных критериев. В основе их лежат содержательная релевантность текста, а также показатели популярности (цитирования), определяемых по ссылкам на страницу – индексам цитирования по общему числу ссылок, весовому (с учетом популярности), тематическому (с учетом тематики).