ЦитироватьИсточник: http://adindex.ru/news/ek/2013/12/23/105335.phtml (http://adindex.ru/news/ek/2013/12/23/105335.phtml)
Служба специальной связи и информации Федеральной службы охраны Российской Федерации объявила о проведении открытого аукциона на оказание услуг по предоставлению результатов автоматического отбора информации СМИ, изучения информационного поля, мониторинга блогов и социальных медиа
Максимальный бюджет проекта составляет 31,824 млн рублей. Сроки оказания услуг: с января 2014 года по 31 декабря 2015 года. Подача заявок на участие заканчивается 9 января 2014 года в 10.00 по московскому времени. Окончание срока рассмотрения заявок – 16 января 2014 года. Проведение открытого аукциона состоится на электронной торговой площадке ttp://www.sberbank-ast.ru 20 января 2014 года в 10:15 по московскому времени. Вся необходимая документация размещена на сайте госзакупок.
Исполнитель будет предоставлять заказчику результаты, используя информацию указанных в документации систем, которые обеспечивают непрерывный автоматизированный мониторинг источников, а также анализ данных из открытых источников на основе статистических и лингвистических технологий. К примеру, система агрегации и анализа информационных материалов из открытых источников «Новостной терминал «ГЛАСС» предоставляет персонализированную подборку сообщений, позволяет увидеть значимые события дня по заданным темам и регионам с возможностью отслеживать позитивную и негативную окраску событий.
Информационные материалы при загрузке в систему должны будут проходить предварительную обработку с использованием лингвистических и статистических алгоритмов и группироваться по следующим темам:
"Президент РФ";
"Руководство АП РФ";
"Премьер-министр РФ";
"Протесты оппозиции";
"Главы субъектов РФ";
"Негативные события в РФ";
"Происшествия и ЧС";
"Критика власти".
Информационные ресурсы, на базе которых будет осуществляться отбор материалов по заданным темам, должны оперативно пополняться данными не менее чем из 10 000 информационных источников. В их числе:
- центральная пресса (не менее 80 печатных изданий), в том числе все ведущие федеральные издания («Аргументы и факты», «Ведомости», «Известия», «Коммерсантъ», «Комсомольская правда», «Московский комсомолец», «Независимая газета», «Новая газета», «Огонек», «Профиль», «РБК daily», «Российская газета», «Труд», «Эксперт») и их специальные и региональные приложения;
- региональная пресса (не менее 1 500 изданий);
- записи новостных и аналитических телевизионных программ центральных телеканалов и их транскриптов (не менее 50 программ), в том числе программы «Первого канала», «России 1», «НТВ», «РЕН ТВ», «ТВЦ», «Пятого канала»;
- записи телевизионных программ и их транскриптов основных региональных телеканалов;
- записи радиопрограмм центральных радиоканалов и их транскриптов (не менее 10 новостных и аналитических программ), в том числе программы радиостанций «Радио Свобода», «Русская служба новостей», «Эхо Москвы», «Маяк», «Радио России», «Авторадио», «Вести FM»;
- записи радиопрограмм и их транскриптов основных региональных радиоканалов;
- интернет-СМИ (не менее 6 000);
- интернет-блоги (не менее 1 000 наиболее влиятельных блогов).
Система мониторинга и многоуровневой аналитики блогов, микроблогов и социальных сетей «Медиалогия – БАЗЗ» должна предоставлять автоматическое исследование аудитории (авторов, площадок), а также проводить анализ позитивных и негативных сообщений. К примеру, таблица «Топ негативных авторов» будет показывать десять авторов с наибольшим количеством негативных сообщений в отчете с учетом наложенных фильтров. Индикатор «Потенциальная аудитория» отразит количество уникальных подписчиков авторов сообщений, а индикатор с абсолютным значением «Увлеченность» покажет среднее количество сообщений одного автора.
Периодичность предоставления результатов по всем системам – круглосуточно семь дней в неделю.
Усекли, что теперь надо делать? Писать всю критику в торжественных, иронично-восхвалительных тонах - и трындец всем вашим нано-алгоритмам ;D
Пример:
Ура, теперь депутаты будут сбивать еще больше пешеходов! Да здравствует Единая Россия!!!
Позитивная ли фраза с точки зрения робота? Да. Негативной она сможет стать лишь тогда, когда ее внесут в базу конкретно вручную. Прогресса в области искусственного интеллекта в ближайшие 100-300 лет не предвидится. То есть, грубо говоря, их супер-пупер алгоритм будет тупо считать негативные слова и выражения. Браво! Это супер!
Возродим Эзопов язык :).
Цитата: Почта сайта от 25 декабря 2013, 12:26:12Возродим Эзопов язык :).
Да не вопрос. Вот только, думаю, что Воландеморт Воландемортович и на это найдет управу.
Ну, есть попытки программно распознавать иронию, но опять же за счет наработанных ручных баз. Если мыслить не штампами, не употреблять клишированных фраз, то никакая программа не поможет.
Всем пацакам надеть намордники и радоваться! (С)
Волноваться не о чем: во-первых ПО по госзаказу, во-вторых - ФСО. Двойная гарантия неработоспособности... (http://www.kolobok.us/smiles/icq/wink.gif)
+100500 )))
Цитата: Lazy Crazy от 25 декабря 2013, 22:25:34
Волноваться не о чем: во-первых ПО по госзаказу, во-вторых - ФСО. Двойная гарантия неработоспособности... (http://www.kolobok.us/smiles/icq/wink.gif)
Во-во. FAIL guaranteed. In case of unFAIL, выдерни шнур, выдави стекло! :)