В секции "Интернет-порталы и технологии поиска" на РИФе-2001 исполнительный директор компании "Рамблер" Игорь Ашманов рассказал об особенностях нового поискового ядра компании - Rambler.2.0. Новое ядро было написано командой разработчиков "Рамблера" в декабре 2000 года, а в январе 2001 началось его бета-тестирование, которое продолжается и сейчас. Весь 2000 год, по признанию Игоря Ашманова, поиск был в "Рамблере" больным местом. Старое ядро было написано еще в 1996 году. До конца 1999 года над ним работал всего один человек - один из создателей "Рамблера" Дмитрий Крюков. И к началу 2000 года "рамблеровский" поиск существенно отставал от конкурентов - "Яндекса" и "Апорта".
К разработке нового ядра команда из 10 разработчиков приступила летом 2000 года. Старое ядро не обеспечивало хорошую релевантность поиска по нескольким причинам:
Отсутствие координат слов (поисковику было все равно, насколько далеко друг от друга в тексте расположены слова, заданные в запросе).
Отсутствие морфологии (поиска по словоформам).
Отсутствие связи с каталогом (что автоматически обеспечивает более высокую релевантность, так как каталог обладает релевантные аннотациями).
Выдача реультатов поска "по документам", а не по сайтам.
Отсутствие поиска по числам.
В новом ядре все эти недостатки были исправлены. Rambler.2.0. учитывает координаты слов, обучен русской и английской морфологии, связывает поиск с каталогом Top100, распознает темы, чтобы связывать результаты поиска с другими разделами портала, группирует результаты поиска по сайтам, ищет по числам. Составлен тезаурус запросов, с помощью которого выделяются темы запросов. В тезаурусе сейчас - 1600 рубрик. Внедрение тезауруса позволило "Рамблеру" поднять посещаемость портала. "Перевязки" на дргуие разделы портала, которые выдаются вместе с результатами поиска, обеспечивают примерно 20 процентов общей посещаемости разделов Rambler.ru. Их средний CTR 4 процента. Надо отметить, что "Яндекс" уже давно связывает результаты поиска со своим каталогам, и делает также поиск по новостям и по товарам. Кроме того, в "Яндексе" функционирует синтаксический анализ запросов.
Итог своей работы "Рамблер" оценивает как удовлетворительный. О чем говорят и цифры. За последние 2 месяца количество уникальных пользователей "Рамблера" увеличилось на 30 процентов (январь 2001 - 105-110 тысяч пользователей в сутки, март - 140-150 тысяч пользователей в сутки).
"Рамблер" предоставил и результаты внутреннего сравнения релевантности различных поисковиков. Исследование проводилось лингвистами по итогам результатов поиска различных поисковиков по одним и тем же запросам. Результаты представлены в следующей таблице.
"Апорт"
"Рамблер"
"Яндекс"
февраль 2000
0,959
0,643
0,845
24.11.2000
0,992
0,903
0,960
29.12.2000
0,992
0,922
0,960
28.02.2001
0,992
0,956
0,960
Цифры свидетельствуют о том, что за последний год не произошло никаких изменений у опережавшего всех в начале прошлого года "Апорта". "Яндекс" и "Рамблер" развивали свой поиск, и релевантность обоих движков сейчас сравнима. Скачок, произошедший в "Рамблере" в ноябре, связан с тем, что некоторые из нововведений в это время уже внедрялись в старый движок.
Количество поисковых запросов на "Рамблере" и "Яндексе" в сутки представители компаний оценивали примерно одинаково - в 800 тысяч. Из игры за звание лучшего российского поисковика сейчас постепенно выбывает "Апорт". Этот год, наверняка, продемонстрирует пользователям Рунета активную конкурентную борьбу на поисковом поле "Рамблера" и "Яндекса".