История с утечкой СМС от «Мегафона» продолжается
Роскомнадзор потребовал от «Мегафона» объяснить утечку SMS, делом заинтересовались следователи и т.п. - шума наделали много.
Одна из последних вчерашних статей, опубликованных на эту тему, называется «"Яндекс" объяснил попадание в поиск SMS от "Мегафона"», опубликована на Ленте.Ру 18.07.2011, 16:59:46. Статья процитирована у меня на форуме во втором сообщении со ссылкой на источник.
Виноват в этой истории, конечно, «Мегафон». Если динамические страницы были доступны для индексации ПС (то есть, поисковый робот мог беспрепятственно по ним пройтись по ссылкам), тут и говорить нечего.
Яндекс сглупил лишь в том, что начал частично перекрывать доступ к поисковой выдаче 8700 СМСок абонентов «Мегафона». Гораздо проще было бы забанить все домены «Мегафона» до выяснения обстоятельств - меньше возни и меньше претензий (потом бы срочно разбанили - делов-то, случай из ряда вон, можно внести исключения из правил).
Кстати, robots.txt - не панацея, к тому же срабатывает медленно, вдобавок ко всему, никто не застрахован от парсинга сторонним ресурсом, чей контент будет доступен для индексирования.
ИМХО, проблема «Мегафона» в том, что их вебмастера не смогли нормально интегрировать в систему ту шнягу, что накупило начальство (по слухам, заказывали у самых распальцованных программеров). Было бы глупо объяснять админам столь крутого провайдера, что такое robots.txt - люди там наверняка неглупые, просто если система говно, хоть и титулованная, тут никакие отмазки и презентации не помогут.
Лет десять назад у меня был похожий случай с одним из отделений фирмы UVEX (каски, робу, очки всякие-разные водолазные и сварочные выпускают, кстати, очень хорошие) - одна часть сайта была сделана ХЗ когда, вторая - ХЗ кем, а третья - ХЗ у кого куплена. В общем, я не знаю, кто там рулит сейчас, и тот ли это представитель, но в 2010 вроде как они все переделали с нуля. И правильно сделали.
Как видите, я с пониманием отношусь к админам «Мегафона», но это не избавляет их от вины. Всецело я на стороне Яндекса. Одно дело, если б Яндекс украл эту информацию через «Метрику» или «Яндекс.Бар» в браузере (вот оно им это надо!), но Яндекс честно прошел по ссылкам и проиндексировал страницы - обвинять поисковик в этом глупо, ибо на то он и поисковик, чтобы ходить по ссылкам. Если речь идет о приватности, есть масса способов обеспечить эту приватность даже без robots.txt. Такие дела.