Tramvision
Новости => Новости IT => Тема начата: Почта сайта от 18 Июль 2011, 16:08:41
-
Яндекс проиндексировал страницы со статусами доставки СМС с сайта Мегафона.
Очевидно, сработал счетчик Яндекс.Метрика, установленный на сайте Мегафона + открытый доступ.
(http://www.tramvision.ru/daily/funpics3/180711-000.gif)
Пока еще можно поглазеть на это безобразие, но со временем, скорее всего, прикроют.
yandex.ru/yandsearch?p=1&text=url%3Awww.sendsms.megafon.ru*%20|%20url%3Asendsms.megafon.ru*&fyandex=1&lr=213&how=tm
-
Пресс-секретарь "Яндекса" Очир Манджиков пояснил "Ленте.ру", как SMS, отправленные через сайт "Мегафона", попали в выдачу поисковика.
На сайте www.sendsms.megafon.ru (http://www.sendsms.megafon.ru) отсутствовал файл robots.txt, в котором прописываются инструкции для поисковых роботов, заявил он. В результате поисковик проиндексировал SMS, и их стало возможным отыскать через "Яндекс".
Сейчас администраторы сайта "Мегафона" добавили в раздел "Отправить SMS-сообщение" файл robots.txt и тем самым закрыли SMS для индексации. "В максимально скором времени все страницы этого раздела будут недоступны в результатах поиска "Яндекса", - подчеркнул представитель поисковика.
В пресс-службе "Мегафона", в свою очередь, сообщили, что SMS были опубликованы из-за "технического сбоя, связанного с работой внешнего администратора сайта". Сейчас сбой устранен. Затронута оказалась "незначительная часть" SMS, отправленных с сайта. Сообщения, отосланные с мобильных устройств, обнародованы не были.
Источник: http://lenta.ru/news/2011/07/18/yasms/ (http://lenta.ru/news/2011/07/18/yasms/)
-
История с утечкой СМС от «Мегафона» продолжается
Роскомнадзор потребовал от «Мегафона» объяснить утечку SMS, делом заинтересовались следователи и т.п. - шума наделали много.
Одна из последних вчерашних статей, опубликованных на эту тему, называется «"Яндекс" объяснил попадание в поиск SMS от "Мегафона"», опубликована на Ленте.Ру 18.07.2011, 16:59:46. Статья процитирована у меня на форуме во втором сообщении со ссылкой на источник.
Виноват в этой истории, конечно, «Мегафон». Если динамические страницы были доступны для индексации ПС (то есть, поисковый робот мог беспрепятственно по ним пройтись по ссылкам), тут и говорить нечего.
Яндекс сглупил лишь в том, что начал частично перекрывать доступ к поисковой выдаче 8700 СМСок абонентов «Мегафона». Гораздо проще было бы забанить все домены «Мегафона» до выяснения обстоятельств - меньше возни и меньше претензий (потом бы срочно разбанили - делов-то, случай из ряда вон, можно внести исключения из правил).
Кстати, robots.txt - не панацея, к тому же срабатывает медленно, вдобавок ко всему, никто не застрахован от парсинга сторонним ресурсом, чей контент будет доступен для индексирования.
ИМХО, проблема «Мегафона» в том, что их вебмастера не смогли нормально интегрировать в систему ту шнягу, что накупило начальство (по слухам, заказывали у самых распальцованных программеров). Было бы глупо объяснять админам столь крутого провайдера, что такое robots.txt - люди там наверняка неглупые, просто если система говно, хоть и титулованная, тут никакие отмазки и презентации не помогут.
Лет десять назад у меня был похожий случай с одним из отделений фирмы UVEX (каски, робу, очки всякие-разные водолазные и сварочные выпускают, кстати, очень хорошие) - одна часть сайта была сделана ХЗ когда, вторая - ХЗ кем, а третья - ХЗ у кого куплена. В общем, я не знаю, кто там рулит сейчас, и тот ли это представитель, но в 2010 вроде как они все переделали с нуля. И правильно сделали.
Как видите, я с пониманием отношусь к админам «Мегафона», но это не избавляет их от вины. Всецело я на стороне Яндекса. Одно дело, если б Яндекс украл эту информацию через «Метрику» или «Яндекс.Бар» в браузере (вот оно им это надо!), но Яндекс честно прошел по ссылкам и проиндексировал страницы - обвинять поисковик в этом глупо, ибо на то он и поисковик, чтобы ходить по ссылкам. Если речь идет о приватности, есть масса способов обеспечить эту приватность даже без robots.txt. Такие дела.
-
Кажется, у меня есть хорошие новости для Мегафона.
Его веб-интерфейс — не единственный, где можно поживиться подобным счастьем.
Есть, например, пермский портал PRM.RU, принимающий SMS-сообщения через веб-интерфейс для абонентов МТС, Мегафона, Билайна и Utel. При этом сообщения доставляются адресатам, а ссылки на их содержимое — в базу Яндекса:
http://yandex.ru/yandsearch?p=11&text=&site=sms.prm.ru&rd=0 (http://yandex.ru/yandsearch?p=11&text=&site=sms.prm.ru&rd=0)
Вот как выглядит отправленное СМС-сообщение на сайте sms.prm.ru.
В комментариях к предшествующей записи (http://dolboeb.livejournal.com/2141879.html) ещё один долдон спалился, за компанию с Мегафоном (http://dolboeb.livejournal.com/2141651.html) и пермским порталом.
Филиал ФГУП «Почта России» под названием EMS Russian Post (услуги экспресс-доставки (http://www.emspost.ru/company/company.php)) зачем-то отдаёт Яндексу страницы с трекингом посылок, причём делает это практически в реальном времени.
Про посылки эти, конечно, не слишком много можно узнать из трекингов на сайте EMS Russian Post.
Но в них попадаются имя отправителя, его индекс, населённый пункт и индекс получателя, вес и объявленная ценность посылки (http://www.emspost.ru/tracking/EA204354446RU).
У всех служб экспресс-доставки в мире такая информация хранится в открытом доступе, не за логином, потому что она, по идее, интересна только отправителю и получателю, а третьим лицам как бы без надобности. Но при этом Вы ни у какого FedEx не можете спросить "а покажи-ка ты мне, милок, все бандероли, которые получали и отправляли жители моей деревни, откуда и куда". Там ответ на запрос выдаётся строго по идентификатору посылки, который известен отправителю, и может быть ещё переслан получателю. Постороннему этот идентификатор никак не вычислить. Он исполняет функцию своего рода пароля, только без логина.
А вот как раз в EMS Russian Post без логинов и паролей можно посмотреть — через поиск Яндекса — что и откуда получали жители посёлка Полярные Зори в Мурманской области (http://yandex.ru/yandsearch?text=url%3Awww.emspost.ru%2Ftracking*+%D0%BF%D0%BE%D0%BB%D1%8F%D1%80%D0%BD%D1%8B%D0%B5+%D0%B7%D0%BE%D1%80%D0%B8&lr=213). Или станицы Кущевская (http://yandex.ru/yandsearch?text=url%3Awww.emspost.ru%2Ftracking*+%D0%BA%D1%83%D1%89%D0%B5%D0%B2%D1%81%D0%BA%D0%B0%D1%8F&lr=213).
Может, это и безвредный функционал — но, на мой взгляд, совершенно излишний. А зачем информация об отправленных и полученных бандеролях на этом сервере хранится годами — вообще полная загадка.
Update: дальнейшие исследования показали, что в поисковиках свободно доступны данные трекинга отправлений DHL (http://www.dhl.com/content/g0/en/express/tracking.shtml?AWB=2737554282). Причём через всё тот же Яндекс (http://yandex.ru/yandsearch?p=22&text=track+shipment+site%3Adhl.com&lr=87). Зато про абсолютно весь мир. Идентифицирующей информации там совсем мало, но от EMS отличие невелико.
-
Яндекс проиндексировал приватные фотоальбомы МТС streamphoto.ru
Набираем site:streamphoto.ru inurl:pw
Но там ничего интересного, часть альбомов открытая, приватные смотрятся по сохранке.
ЗЫ У Гугла больше альбомов :) 681