В понедельник в газете New York Times была опубликована статья, посвященная проблемам, с которыми столкнулся поисковый сервер Google, приобретя архивы Usenet у компании Deja.com.
Напомним, что в прошлом году компания Deja.com начала поиск покупателя на архивы конференций Usenet с 1995 года. Архив содержал несколько терабайт информации. В феврале 2001 года архив был куплен компанией Google, а в конце апреля Google полностью открыл его для всех пользователей.
Сейчас возможно найти любое письмо из этого архива по имени автора, имени адресата, названию конференции или строке "Тема письма" (Subject). Также возможен поиск по слову в тексте письма или дате его написания. Поисковый аппарат, созданный Google, весьма эффективен. Ларри Пейдж, один из основателей компании, заявил, что поиск по Google равнозначен перебору за полсекунды страниц, сложенных в кипу высотой около 110 миль. Поэтому найти любое письмо в архиве не представляет ни малейшей сложности.
Казалось бы, все сложилось просто замечательно: довольны пользователи, которые до конца апреля очень часто возмущались тем, что поиск по архиву недоступен, довольна компания Google, сделавшая хороший продукт, довольна компания Deja.com, видящая свое любимое детище в надежных руках. Однако, по данным New York Times, существует активная группа недовольных - это авторы некоторых писем в архиве и специалисты в области конфиденциальности информации.
Письма Usenet носят частный характер. В архиве хранятся, к примеру, письма Марка Андреессена, создателя Netscape, в которых он спрашивает, как подружить его годовалую собаку с новой собакой, которую он скоро возьмет к себе домой, есть письмо Маккензи Безос, жены Джеффа Безоса, основателя компании Amazon, в котором она просит порекомендовать ей школу для дрессировки собак в Сиэттле.
Сведения о собачках и кошечках известных деятелей IT-отрасли выглядят достаточно невинно. Однако, поскольку конференции изначально не предназначались для широкого чтения всеми пользователями Интернета, в них можно встретить и гораздо более личные послания, подпадающие под юрисдикцию специалистов по конфиденциальности. Известные менеджеры, одного из которых упоминает газета, жаловались в конференции на руководителей предприятий, уволивших их с работы.
Обычный поик по Google ведется среди страничек, автор каждой из которых знает, что информацию могут просмотреть все пользователи Интернета, поэтому то, что он хочет скрыть, в Интернет не выкладывается. Однако в случае с Usenet все несколько сложнее.
Сообщения в конференции не живут дольше нескольких недель, не считая частных архивов. Они заменяются ответами на сообщение, потом ответами на ответы и так далее - идет нормальный процесс общения. Люди, которые общаются, не склонны если, конечно, у них нет профессиональной паранойи обдумывать свои локальные высказывания и их возможное влияние на всю свою последующую жизнь.
Но если бы людям, ведущим обычный устный диалог, сказали через несколько лет, что все их слова были записаны, сохранены и их может прослушать любой из сотен миллионов человек, они бы, наверное, были не совсем довольны.
Многие из пользователей Usenet вели словесные перепалки, не слишком хорошо характеризующие их авторов. Многие письма были написаны и отосланы необдуманно, например, письма с угрозами или хамскими выпадами в адрес собеседника, а также послания, написанные в пьяном виде, во время болезни, да и просто поздно ночью. Во многих письмах содержатся шутки, которые могут оказаться непонятными государству. Например, в одной из конференций Usenet небезызвестный в Рунете журналист не так давно обсуждал с друзьями, как лучше ограбить банк и где украсть и кому потом продать вагон обогащенного урана.
Все письма в конференции содержат электронный адрес и имя отправителя, что, как считают специалисты по конфиденциальности, является личной информацией, особенно, если эти сведения содержатся в базе данных крупной интернет-компании. Такая база может использоваться и для рассылки рекламы.
Не исключена также возможность подлога информации, использования чьего-либо имени для публикации посланий в конференции. Например, несколько раз были подделаны адрес и имя Винтона Серфа, нынешнего главы ICANN, приписывая его авторству то, что, как сообщает Серф, он "НИКОГДА не писал".
В момент создания архивов Dejanews пользователи Usenet еще не обдумали как следует возможность использования слов автора против самого автора или использования персональных адресов для мусорной рекламы или подлога информации. Но уже вскоре появились первые протесты. В ответ на это компания Deja.com сообщила о возможности вставить в начало письма комментарий "X-No-archive: yes". Эта фраза помогала системе архивации распознавать письма, которые не надо помещать в архив. Когда эта возможность была создана, вопросы конфиденциальности информации в системе отошли на задний план.
Сейчас все эти проблемы встали перед руководством компании Google, которое уже обещало ввести систему аутентификации пользователей для того, чтобы никто не смог, пользуясь сервисом, подделывать информацию и помещать сообщения в конференции не от своего имени. Также будет восстановлен стандарт "X-No-archive" и создана возможность для авторов удалять свои старые сообщения.
Однако некоторые эксперты считают, что вопрос не стоит выеденного яйца, так как все конференции Usenet изначально представляли собой полностью открытую систему. Поэтому каждый автор, пишущий в конференцию, должен понимать, что его слова могут быть прочитаны многими пользователями. Дебора Пьерс, один из юристов организации Electronic Frontier Foundation, заявила: "Если Usenet это не общественный форум, то я не знаю, что это такое".