Наверняка большинство из вас при наличии такого выбора, как джумла или вордпресс размышлять будут долго и бдительно, поскольку каждая из выше предложенных CMS по-своему качественна, эффективна и, как известно, популярна!
Тем не менее, несмотря на сложность подобного выбора, сейчас хотелось бы уделить несколько строк иным вещам, популярность которых так же высока и заметна. А речь пойдет об основных компонентах поисковых систем, о которых ранее мы начинали говорить. Сейчас же мы обратим ваше внимание на некоторые из основных принципов работы этих компонентов.
В первую очередь подчеркнем такой компонент, как «паук», то есть специальная программа под названием Spider, главная функция которой заключается в скачивании веб-страниц теми же способами, которыми скачивают их и браузеры пользователей. Главное отличие браузера от данной программы состоит в том, что в отличие от браузера, который отображает информацию, размещенную на странице, паук не имеет каких-либо визуальных компонентов, ведь он напрямую работает с так называемыми html-текстами вашей страницы.
В свою очередь компонент, название которого Crawler, предназначен для выделения всех ссылок, размещающихся на вашей странице. И задача данной программы заключается в определении необходимого пути направления так называемого паука. А осуществляет такую схему программа Crawler, основываясь на ссылках или же на заданном предварительно списке адресатов. Таким образом, располагая найденными ссылками, эта программа производит поиск документов, еще не известных поисковикам.