Статьи
КАКИМ ДОЛЖЕН БЫТЬ ДИЗАЙН САЙТА?
Для кого делается сайт? Для посетителей и клиентов. Поэтому одним из ключевых моментов является разработка дизайна сайта. Какой должен быть дизайн? Для того, чтобы ответить на этот вопрос, я советую обратить внимание на сайты крупных компаний, например:
- www.adobe.com
- www.schwarzkopf.com
- www.corel.com
- www.autodesk.com
КАК РАБОТАЕТ ПОИСКОВАЯ МАШИНА?
Поисковая машина – это программа, которая составляет и хранит предметный указатель Интернета, а также находит в нем заданные ключевые слова. Для этого программа составляет так называемый индекс.
Чтобы составить индекс по страницам, сначала нужно решить, какие страницы нам нужны. Таким образом, нужно сначала составить список страниц – набор адресов тех страниц, по которым будет составляться индекс.
Поскольку сайты и их страницы беспорядочно разбросаны в Интернете, поисковой машине нужно с чего-то начать. Обычно разработчики поисковой машины загружают в нее какой- то начальный список адресов страниц сайтов (взяв его, например, из какого-нибудь каталога). Затем поисковая машина ( ее составная часть – так называемый поисковый робот) собирает все гипертекстовые ссылки с каждой из заданных страниц на другие страницы и добавляет все найденные в ссылках адреса к своему первоначальному набору адресов.
Таким образом, первоначальный набор адресов страниц быстро увеличивается за счет ссылок на другие сайты и страницы и постепенно становится очень большим. Сейчас поисковики обходят и индексируют миллиарды веб-страниц.
Выкачивание страниц
Чтобы поработать с текстом страницы и составить из него индекс, поисковик должен получить этот текст.Для этого поисковик должен выкачать этот текст, т.е. запросить у сайта заданную страницу. Выкачивает страницы специальный модуль поисковой машины, называемый поисковым "пауком" (по-английски crawler), или поисковым роботом. Поисковый робот обходит заданный на предыдущем этапе список страниц, выкачивает гигантский объем сырого текстового материала, хранит его на дисках своих компьютеров и передает на индексирование индексному роботу.
Составление индекса, или индексирование
Чтобы составить индекс, индексный робот поисковой машины должен выбрать все слова из всех выкачанных текстов и расположить их в алфавитном порядке, вместе с номерами страниц и разной служебной информацией о каждой странице.Для этого индексный робот перебирает все выкачанные страницы, нумерует их (а как же, ведь нужно как-то пометить страницы, чтобы потом находить их), удаляет из текста страниц всякий ненужный, нетекстовый "мусор" (например, разметку языка HTML), затем извлекает из текста слова и помещает их в индекс. При этом слова снабжаются информацией о страницах, с которых они были взяты.
Продолжение следует...
автор И.АШМАНОВ, А. ИВАНОВ

