Статьи

КАКИМ ДОЛЖЕН БЫТЬ ДИЗАЙН САЙТА?

Для кого делается сайт? Для посетителей и клиентов. Поэтому одним из ключевых моментов является разработка дизайна сайта. Какой должен быть дизайн? Для того, чтобы ответить на этот вопрос, я советую обратить внимание на сайты крупных компаний, например:

  • www.adobe.com
  • www.schwarzkopf.com
  • www.corel.com
  • www.autodesk.com
Такие сайты делает не один человек, а группы людей – профессионалы своего дела. Мы – дизайнеры, обязаны понимать, что посетитель должен найти авто запчасти, а не дизайн! Посетителю должно быть удобно передвигаться по сайту, он не должен ждать пока загрузится страница. Отсюда вывод: дизайн должен быть грамотным!

КАК РАБОТАЕТ ПОИСКОВАЯ МАШИНА?

Поисковая машина – это программа, которая составляет и хранит предметный указатель Интернета, а также находит в нем заданные ключевые слова. Для этого программа составляет так называемый индекс.

Чтобы составить индекс по страницам, сначала нужно решить, какие страницы нам нужны. Таким образом, нужно сначала составить список страниц – набор адресов тех страниц, по которым будет составляться индекс.

Поскольку сайты и их страницы беспорядочно разбросаны в Интернете, поисковой машине нужно с чего-то начать. Обычно разработчики поисковой машины загружают в нее какой- то начальный список адресов страниц сайтов (взяв его, например, из какого-нибудь каталога). Затем поисковая машина ( ее составная часть – так называемый поисковый робот) собирает все гипертекстовые ссылки с каждой из заданных страниц на другие страницы и добавляет все найденные в ссылках адреса к своему первоначальному набору адресов.

Таким образом, первоначальный набор адресов страниц быстро увеличивается за счет ссылок на другие сайты и страницы и постепенно становится очень большим. Сейчас поисковики обходят и индексируют миллиарды веб-страниц.

Выкачивание страниц

Чтобы поработать с текстом страницы и составить из него индекс, поисковик должен получить этот текст.

Для этого поисковик должен выкачать этот текст, т.е. запросить у сайта заданную страницу. Выкачивает страницы специальный модуль поисковой машины, называемый поисковым "пауком" (по-английски crawler), или поисковым роботом. Поисковый робот обходит заданный на предыдущем этапе список страниц, выкачивает гигантский объем сырого текстового материала, хранит его на дисках своих компьютеров и передает на индексирование индексному роботу.

Составление индекса, или индексирование

Чтобы составить индекс, индексный робот поисковой машины должен выбрать все слова из всех выкачанных текстов и расположить их в алфавитном порядке, вместе с номерами страниц и разной служебной информацией о каждой странице.

Для этого индексный робот перебирает все выкачанные страницы, нумерует их (а как же, ведь нужно как-то пометить страницы, чтобы потом находить их), удаляет из текста страниц всякий ненужный, нетекстовый "мусор" (например, разметку языка HTML), затем извлекает из текста слова и помещает их в индекс. При этом слова снабжаются информацией о страницах, с которых они были взяты.

Продолжение следует...
автор И.АШМАНОВ, А. ИВАНОВ