[an error occurred while processing this directive]

Российские поисковые машины

Небольшая преамбула к этому документу, касающаяся самой молодой и самой перспективной, на мой взгляд, поисковой машины Яndex.

Сейчас на yandex.ru первая страница работает в режиме обработки запроса на естественном языке. Такой возможности нет у других поисковых систем (это больше, чем просто поиск по всем словам, указанным в запросе, а поиск с "пониманием"). В этом режиме вообще нет языка запросов. При этом желающие указывать в запросе логические операторы, могут пользоваться расширенным поиском со страницы http://yandex.ru/advanced.html

На странице выдачи результатов добавлена возможность <Найти похожие документы>, чего опять же нет у других российских поисковых систем.

Со 2-го февраля 1998 года в поисковой системе Яndex появилась возможность осуществлять повторный поиск только в найденных документах (нужно в случае, если найденно слишком много документов для уточнения запроса). Это некоторый эквивалент опции Refine Альтависты.

 ТипПолнотекстоваяПолнотекстоваяПолнотекстоваяПолнотекстоваяПолнотекстоваяРазмер500.000140.0942.500.0002.000.0002.600.000Период обновления20 дней3-4 недели1 раз в неделюперманентнораз в сутки (от 10 до 40 тысяч документов)Дата обновленияНет, в проекте даДаДа, при расширенной выдаче результатовДаДаУказанные (submittes) страницы20 дней-7-14 дней1-2 дня1-15 днейНеуказанные (non-submitted) страницы20 дней-до 3 месяцевв зависимости от популярности документовлимитируется скоростью обновления индексаГлубина индексирования5.000 документов на глубину 15020 документовнеограниченанеограниченанеограниченаПоддержка фреймовДаДаДаДаДаПоддержка ImageMapДаДаДаДаДаИндексирование защищенных паролями директорий и серверовВозможноНетВозможноВозможноНетУчет популярности документа при реиндексированииНет (в проекте - да)НетНетДаНетИспользование robots.txt <META ROBOTS=...Даrobots.txt - да

META - нет Да Да Да

Влияние на алгоритм определения релевантностиНетПока нет, в проекте - META-KeywordsНет и не будетПока не поддерживаютсяПока не поддерживаютсяTitleпока URLtitletitle или URL и относительная мера релевантностиtitle и URLtitleDescriptionMETA-таг Description и часть текста документаПервые строки документаПервые 512 байт документа исключая meta, javascript, images... Существуют еще две формы вывода описания - короткая и длиннаяВыдаются первые 1024 байт текста, мера релевантности, дата создания и объем документаПредложения, содержащие слова запроса (1, 3 или до 10)Контроль за индексациейНетЯвно - нет, косвенно - указав в качестве критерия URLДа (См. подробнее)Пока нетДа (См. подробнее)Имя поискового роботаwww.search.ru-StackRambler/1.2YandexWebAport
Russian Express TELA поиск Rambler Яndex Апорт Поиск

Составил Андрей Аликберов, ЦИТ. Последние изменения 6 января 1998 года
Я благодарю за помощь Михаила В. Шишмарева (Plug Communication), Дмитрия Крюкова (Stack Ltd.), Силантия Крестовоздвиженского (Dux), Евгения Киреева (Agama), а также Елену Колмановскую и Алексея Амилющенко (CompTek) [an error occurred while processing this directive]