23 мая, в среду, в 12.00 запущена новая версия поисковой машины "Яндекс". В это же время в отеле "Балчуг" была начата пресс-конференция, посвященная этому событию.
Предыдущую версию поисковой машины компания анонсировала год назад - 6 июня 2000 года. Тогда в "Яндекс" были добавлены синтаксический анализ (вдобавок к имеющемуся изначально морфологическому), поисковик стал отслеживать не только веб-страницы, но и базы данных (в которых используются скрипты), появилась интеграция с каталогом, поиск новостей, параллельный поиск товаров и услуг. 19 июня 2000 года у "Яндекса" появился "аскетический" вариант - по адресу www.ya.ru, приобретающий все большую популярность у пользователей.
В октябре 2000 года было объявлено об усовершенствовании результатов поиска. Тогда были произведены улучшения в интерфейсе выдачи запросов. В ноябре был запущен "Яндекс.Бар" - дополнительная панель инструментов к браузеру, облегчающая процесс поиска через "Яндекс". В ноябре же был запущен сервис "Яндекс.Товары". В рамках этого сервиса осуществляется поиск по товарным предложениям, в первую очередь, предложениям интернет-магазинов.
Сейчас в новую версию поисковика внесены следующие изменения: улучшения коснулись обработки запросов на естественном языке, повысилась точность и скорость поиска.
Теперь "Яндекс" будет корректировать запросы пользователя для большей точности выдачи результатов поиска. Будет осуществляться орфографическая коррекция запроса, перед обработкой вопросы будут перефразироваться (например, запрос "что такое Интернет" перефразируется в "Интернет - это..."). Пока покрыты только определенные типы вопросов, но со временем правил будет больше. Поисковик начал работать и с альтернативной лексикой. Третьей ссылкой при поиске на слово "мастдай" теперь выдается "microsoft.com". а на слово "искалка" - ссылки на российские поисковые машины, хотя это слово сами поисковики по отношению к себе не употребляют.
Улучшился поиск ссылок. Если теперь набрать в поисковом окошке слово "Волож", первой ссылкой можно увидеть yandex.ru, слову "Ханов" соответствует rambler.ru, а слову "Хайтина" - netoscope.ru. Это касается, безусловно, не только персоналий, но и названий компаний. Проблема найти сайт компании по ее названию (в случае его наличия) практически разрешена.
В борьбе за лучшую релевантность результатов поиска большой проблемой для разработчиков является так называемый поисковый спам - действия авторов страниц и рекламщиков, которые приводят к размещению не самых значимых с точки зрения потребителей сайтов на верхние позиции в результатах поиска по определенным словам. Эту проблему "Яндекс" пытается разрешить использованием в ранжировании ссылок "Индекса цитирования", но поскольку и этот параметр поддается "накрутке", учитывается "авторитетность" сайтов, на которых размещены ссылки. Эта методика получила название "взвешенный индекс цитирования".
Илья Сегалович, руководитель отдела разработчиков "Яндекса", считает, что рынок услуг по повышению релевантности сайтов в поисковиках, достаточно большой. Сегалович оценивает его размер в 10 процентов от общего оборота рекламных услуг, связанных с поисковиками. И борьба с такого рода деятельностью - задача крайней сложности.
И последнее - скорость. Часть алгоритмов переписана разработчиками на ассемблере, облегчена выдача - убраны таблицы, произведен аппаратный апргейд. Все эти меры дали очередной выигрыш по скорости поиска. Меры эти были актуальны, так как "Яндекс" обрабатывает сейчас около миллиона запросов в день (до 20 в секунду).
"Яндекс" уже в течение нескольких лет удерживает лидерство среди российских поисковиков по объему индексируемой базы. Сейчас в этой базе - 38 миллионов документов ("Рамблер" "видит" 7,5 миллионов документов). Настоящий объем Рунета неизвестен - никаких исследований на эту тему не существует. Зато существуют любопытные цифры по объему мирового Интернета. На октябрь 2000 года в мире насчитывалось 2,5 миллиарда статических страниц, индексируемых поисковыми машинами, и 550 миллиардов (!) недоступных динамических страниц.
Если Илья Сегалович рассказывал на пресс-конференции о технических деталях поиска, то Аркадий Волож - глава компании - сделал основной акцент на том, что нынешние крупные российские порталы уже представляют собой привлекательные рекламные площадки. Если переводить на язык традиционных медиа, то такой портал, как "Яндекс", имеет недельный "тираж" - 1 миллион в неделю. Этот тираж пока сложно сравнивать с "тиражом" самого крупного медиа - телевидения, но вот уже с тиражами радиостанций и офлайновой прессы - вполне. Такой же тираж - миллион в неделю - имеет крупный компьютерный издательский дом (все издания совокупно). Но если тот же издательский дом имеет годовой рекламный оборот - 5-10 миллионов долларов, то оборот всего рынка интернет-рекламы в Рунете в 2000 году составил, по разным оценкам, 3-5 миллионов долларов. Тот факт, что реклама в Интернете зачастую выгоднее (по соотношению цена/качество), чем реклама на радио и в крупных офлайновых изданиях, просто еще не вошел в обыденное сознание. И крупные интернет-площадки пока не могут продать все свои рекламные позиции. А это, соответственно, приводит к текущим операционным убыткам. Сколь долго продлится эта ситуация? Сколь долго порталы смогут позволить себе операционные убытки?
В интересах всех российских интернет-компаний сейчас - переломить эту ситуацию. С 10 мая "Яндекс" запустил свою новую телевизионную рекламу, которая как раз призвана объяснить потребителям, что времена, когда русский Интернет был совсем маленьким, канули в лету. В рамках этой рекламной кампании по НТВ и ТНТ крутится три ролика "Яндекса", которые представлены ниже.
В ту же точку, что и "Яндекс", бьют сейчас многие интернет-компании. 23 же мая в Санкт-Петербурге состоялся семинар компании "Интернет-проекты", владельца сервиса рассылок Subscribe.ru. На семинаре представители петербургских и московских компаний рассказывали офлайновым рекламным агентствам о преимуществах и актуальности рекламы в Сети.
Если бы всего 2 процента рекламных бюджетов в России тратились сейчас на рекламу в Интернете, прошлый год дал бы оборот в 20 миллионов. А в этом году эта цифра возросла бы на 30-50 процентов. Именно 2 процента рекламных бюджетов тратят сейчас на Интернет европейские компании. В США эта цифра составлят 4,6 процента.