Определение релевантности (адекватности, степени совпадения запросу) лежит в основе работы практически всех поисковых систем (ПС). Поисковые машины (Яндекс, Google и др.) стараются охватить весь объём информации, содержащейся на сайтах в Интернет. Для обеспечения пользователям максимально быстрого поиска необходимой информации, весь контент индексируется согласно его тематике. Для этого и используется анализ релевантности документов – степени их соответствия запросам.
Общую релевантность документа ПС определяют, основываясь на двух базовых показателях: релевантности самого текста и полезности, авторитетности материала. Релевантность (тематика, основное содержание) самого текста определяется на основе анализа частоты ключевых фраз в нём. По логике ПС, если материал полезен пользователям, прочитавшим его, то в Интернете будут появляться тематические (релевантные) ссылки на него. Таким образом, ссылочная релевантность определяется на основе числа внешних тематических ссылок.
На основе общей релевантности пользователю выдаётся по его запросу полный список ресурсов упорядоченный (ранжированый) по степени совпадения запросу.