Статистический анализ выборов президента России 4 марта 2012 года

Политика — это искусство возможного, и невозможного тоже!

Статистический анализ прошедших в России президентских выборов, который специально для «Газеты.Ru» провел физик Сергей Шпилькин, показывает наличие «подозрительных» 9 млн. голосов, отданных за Владимира Путина (что соответствует реальной явке около 56 % вместо официальных 65 % и доле голосов за Путина 57,5 % вместо официальных 63,5 %), а также демонстрирует появление второго (помимо административного ресурса) фактора, влияющего на итог голосования, — социальной активности жителей крупных городов. Наличие этого фактора требует более аккуратного подхода к оценке масштабов выборных манипуляций методами статистики.
C точки зрения выборной статистики нынешние выборы президента России и похожи, и не похожи на своих предшественников.
Сходство в том, что, как и в прошлые годы, явка очевидным образом работает в пользу одного из кандидатов. Это наглядно показывает диаграмма зависимости голосования за кандидатов от явки:
Каждой территориальной избирательной комиссии (ТИК) соответствуют шесть точек, показывающих, какая часть зарегистрированных избирателей проголосовала за того или иного кандидата (включая кандидата «недействительный бюллетень»). В нормальной ситуации доли голосов за кандидатов от списочного состава избирателей с ростом явки должны расти пропорционально.

Таблица 1

Однако на рисунке видно, что, начиная с явки примерно 60 – 65 %, растет только доля голосов за Путина, а доли голосов остальных кандидатов стабилизируются и затем снижаются.
Эта закономерность видна и на распределении голосов за кандидатуры в зависимости от явки на избирательных участках.
Как и на выборах прошлых лет, кандидат от власти получает значительную долю своих голосов на участках с повышенной явкой, где другим кандидатам голосов почти не достается. Такая ситуация естественным образом возникает при искусственном завышении голосов за одного из кандидатов на части участков (не важно — путем принуждения к «правильному» голосованию, вброса бюллетеней или простого переписывания протоколов). Однако вычисление разности распределений голосов за Путина и умноженного на подгоночный коэффициент распределения голосов за других кандидатов обнаруживает интересный эффект:
В отличие от выборов прошлых лет, когда отличие распределения голосов за кандидатуру власти и голосов за остальных кандидатов было практически нулевым при явках ниже некоторого порога и затем резко росло при явках выше порога, на нынешних выборах в голосовании за Путина наблюдается явственный провал при явках 55 – 60 %.

Таблица 2

Это как раз тот диапазон явок, куда, судя по всему, попало большинство участков, расположенных в крупных городах.
В предыдущий раз подобная картина наблюдалась на президентских выборах 2004 года, когда провал в голосовании за Путина в окрестности явки 50 % четко совпал с максимумом в голосовании за Ирину Хакамаду. В этот раз, судя по всему, голосовали за Прохорова.
По диаграмме рассеяния голосов за кандидатов по имеющемуся на данный момент набору избирательных участков Москвы видно, что в диапазоне явок 50 – 65 % процент голосов за Путина явственно снижается с ростом явки при растущем проценте голосов за Прохорова и почти неизменном — за других кандидатов. Причина, видимо, не в административном ресурсе, которого у сторонников Прохорова нет, и который имеет обыкновение действовать с гораздо большим размахом (вот участки с явкой выше 65 – 66 % – это, скорее всего, административный ресурс), а именно в активности части московских избирателей, которые целенаправленно шли голосовать за Прохорова.
Появление вдобавок к административному ресурсу второго фактора, влияющего на результаты голосования, – социальной активности горожан – требует более аккуратного подхода к оценке масштабов выборных манипуляций методами статистики.

Таблица 3

Для получения уверенных оценок необходимы расчеты отдельно по регионам с выделением крупных городов, где картина голосования, как мы видим на примере Москвы, может иметь существенные особенности. Кроме того, статистика выявляет только локальные манипуляции на среднем фоне и не учитывает эффект равномерного по всей стране административного давления, которое на этих выборах было беспрецедентным.
В качестве же осторожной предварительной оценки показанный выше вариант выделения аномальной части в распределении голосов соответствует примерно 9 млн. «подозрительных» голосов за Путина.
(Данные цифры приведены для обработанного набора в 88 тыс. участков с 98 млн. зарегистрированных избирателей; для полного набора цифра может оказаться ближе к 10 млн.)

Таблица 4

Это соответствует реальной явке около 56 % вместо официальных 65 % и доле голосов за Путина 57,5 % вместо официальных 63,5 %.
При подготовке статьи использовался набор данных голосования по участкам, собранный Алексеем Шипилёвым.

Метки: , , , , , , , , , , , , , , ,

Один отзыв на «Статистический анализ выборов президента России 4 марта 2012 года»

  1. Алекс:

    Гауссиана — фальсификация для доказательства фальсификации
    8cinq
    December 14th, 2011
    Предыстория

    В период пост-выборного срача, в интернете появились несколько видов «математического доказательства» фальсификации выборов. Например вот такой график, так называемой «гауссианы».

    Впервые столкнувшись с гауссианой при анализе выборов, я впал в ступор. Я не математических наук доктор, а матанализ для меня давно законченный предмет из далекого университетского времени. Но я всегда считал, что с математикой и логикой у меня лады — мне часто приходится иметь дело с функциями по работе, приходится думать над логикой работы больших систем в веб проектах — тренировка есть. Но тут я почувствовал себя дураком — я читаю комментарии «математического доказательства», которые изобилуют уверенностью в своей правоте. Даже те, кто умом, на вид, не отличается — и те похоже все поняли. А я сижу и вижу только лишь гистограмму, которая сообщает нам бессмысленную статистику. При чем здесь гауссиана? Как вообще можно применять гауссиану в качестве социологического исследования?

    Я постучался в скайп к своему знакомому, ядреному технарю, который уж точно должен был мне вправить мозги. Тем более никакой симпатии к власти он не испытывает. Он тоже напрягся, подумал, мы почитали тексты эсквайра и блогов — но смысл всего этого действа опять ускользнул от нас. Стало ясно, что дело мутное и нужно в это серьезно вникать, чтобы написать опровержение. На написание статьи ушло 2 дня. Задача представлялась сложной. Сложно объяснять бессмысленность.

    Благодарю 4izh за помощь в составлении материала. Его комментарии в тексте будут отмечены вот таким цветом.

    Что такое гауссиана и что она здесь делает?

    Начнем с того, что гауссиана — это функция, которая предназначена для изучения отклонений в технических измерениях. К гистограмме выборов это не относится, ведь никакой функцией мы не пользуемся. Если и есть смысл применять к ней какой-то научный термин, то это Нормальное Распределение — такое распределение случайных данных, гистограмма которых напоминает колокол по своей форме.

    Область применения гауссианы. Например, мы изобрели супер нанотехлологичный измеритель радиации. Оценить качество нашего изобретения можно при помощи несложных тестов: мы берем кусок урана с заведомо известным (точным) уровнем радиации и начинаем его мерить нашим прибором. Для точных показателей мы заинтересованы в большом количестве замеров (репрезентативной выборке). Замеры не будут постоянно давать одинаковый результат, а мы будем получать некий разброс. Выстроив гистограмму, мы должны получить нормальное распределение полученных величин — тот самый «колокол», где значение горизонтальной координаты пика является истинным значением уровня радиации, а из характера формы мы можем получить полезные статистические величины, как, например, погрешность измерения. Именно этот показатель и будет отвечать за качество нашего изобретения.

    Но и с Нормальным Распределением существует проблема. При желании можно даже детский рисунок радуги сравнить с Нормальным Распределением по внешнему виду, но кроме как для создания «ореола научности» это не будет иметь смысла. Строго говоря, ни один анализ выборов в сети, ни одной партии, ни одной страны — не соответствует нормальному распределению. Или у вас ровный «колокол» или ваше распределение не попадает под этот термин.

    Что там у других стран с гауссианой?

    Чтобы доказать бессмысленность данного подхода, мы взяли на себя работу по построению нормального распределения для выборов в Польше — страны, которую часто используют как пример хорошей избирательной системы. В выборке участвовали все 25983 избирательных участка страны.

    Для пытливых: таблица с данными, внутри файла ссылка на первоисточник. Благодарю Opera.Rulez за помощь в сборе данных.

    Не очень колокольно, но все же напоминает нормальное распределение. Но это партия Польши не с самым большим количеством голосов, она проиграла. А как дела обстоят с ведущей партией?

    Блядь, это кадр из фильма «Челюсти»!

    Как видно, никаким «колоколом» здесь не пахнет, даже распределение ЕР больше похоже на Нормальное Распределение. А сколько «зубчиков» ?!

    А ведь Польша маленькая страна, в сотни раз меньше России, где намного меньше раздробленность людей по национальности, достатку и среде обитания. По сему, вопрос с гауссианой считаем нужным закрыть. Если кто-то сует вам в нос данное «математическое доказательство», то можете смело раскручиваться на месте как юла, раскинув руки, громко хохоча. Эти графики не означают ничего.

    График Голоса/Явка

    Осталось разобраться еще с одним графиком, который можно встретить в сети. Это отношение Голоса/Явка. Выглядит он так:

    С одной стороны этот график как бы намекает нам, что на некоторых участках явка невероятно высока, 90-100%, что намного реже встречается в других странах. Это нам может говорить о том, что на этих участках вбросили бюллетени.

    Или нам это может говорить о том например, что это военные части, куда всех загоняют голосовать без исключения. Например, в Польше, которую мы берем за образец, такое тоже бывает — явка 100%. А представьте сколько у нас в России военных частей? Сотни их. Можно ознакомится с мнением непосредственного участника таких голосований.

    Есть здесь и другой фактор — маленькие бедные области. Например Атяшевский район Мордовии, где за ЕР отдано 99% голосов. Это три десятка деревень в далеком отшибе от цивилизации. Какие вообще могут быть политические предпочтения в таких местах, как вы себе представляете? Там попросту не знают политической жизни. — Многопартийная система? — Ага, что-то слышал.

    Сколько еще таких мест? Уйма — будет мало сказать. Приехали на вездеходе в деревушку, завезли полезной утвари от правящей партии и сказали — приходите обязательно, да голосуйте за нас. Людям то что? Проголосовали и забыли. В этом нет ничего хорошего, но и криминального тоже. Вот так в некоторых местах жизнь течет, среда обитания слишком бедная и жестокая, чтобы жить лучше. Тут уже скорей вопросы к демократическому устройству нашей страны, которое предполагает то, что далеко не везде возможно.

    Говорят еще о том, что направляющая Голоса/Явка у ЕР отличается от других партий — она поднимается вверх. Но это говорит скорей о закономерности, чем о вмешательстве — иначе небыло бы ровной линии, а были бы скачки. Почему такая закономерность? Предыдущий абзац может быть на то подсказкой, а может быть и что-то другое.

    Мы не можем говорить о какой-то единой причине повышенной явки, но даже в этом случае можно легко найти объяснение данному феномену. При высоком проценте явки среди голосовавших значительно повышается процент «случайных обывателей», людей далеких от политики и, разумеется, совершенно ничего не слыхавших о новых мейнстримовых тенденциях в интернете критиковать правительство. В рамках современной политической и информационной системы России повышенные показатели ЕР при высокой явке (если таковые наблюдаются) являются скорее нормой, чем отклонением от нее.

    Так или иначе, здесь остается большое пространство для интерпретаций, с нами можно спорить, мы можем спорить в ответ — уже поэтому математическим доказательством этот график не является.

    Кто это вообще придумал?

    График Голоса/Явка относительно новое изобретение. Надо отметить, что, так называемый, независимый эксперт журнала Эсквайр, который придумал этот вид исследования — Сергей Шпилькин — физик. Не кандидат наук, и даже не работник своей профессии, а просто физик по образованию, работающий переводчиком — вот такой независимый исследователь социальных процессов. Уровень авторитетности мнения как бы намекает :)

    Но это не самое интересное. Самое интересное с пресловутой гауссианой. Потому что впервые, в качестве исследования выборов, мы смогли ее отыскать только в январе 2005 года на Украине, во время проведения оранжевой революции. Резервная ссылка.

    Хочешь не хочешь, а проведешь параллели.

    Добавки?
    8cinq.livejournal.com/32693.html

Ваш отзыв