Никита Мендкович (mendkovich) wrote,
Никита Мендкович
mendkovich

Categories:

Выборы и статистика

Пишу не ради политики, а чтобы помочь избежать типичных ошибок при анализе статистики.
Третий раз кидают ссылку на расчеты некоего Подмосковника, который попытался определить фальсификации путем анализа статистики явки на выборах.  Он обнаруживает, что уровень поддержки Единой России коррелирует с уровнем явки, т.е. в местах, где высокая явка – больше голосов за Единую Россию. Из этого автор делает вывод, результаты выборов сфальсифицированы. Он находит «лишние» - 13,6 млн. голосов за ЕР или почти 16,3% от всей явки.
В итоге, правда, выяснилось, что он несколько напутал с данными, и исключение голосов по предложенному им методу дает гораздо более низкую «фальсификацию» - 0,7% от общего числа голосов (данные и скрипты Хист-кая)*. Практически без влияния на общий итог.
Здесь не буду вдаваться в вопрос о фальсификациях выборов как явлении, есть оно или нет, а просто остановлюсь на некоторых ошибках при анализе статданных.
 
0)Оба автора допускают один и тот же просчет, который назову «ошибкой Есенина». Они автоматически трактуют аномалии в явке как свидетельство вброса. Точно также возникла версия об инсценировке самоубийства Есенина: ее сторонники любые непонятные им факты интерпретировали как итог манипуляций фальсификаторов. Вероятность такой ошибке тем выше, если исследователю неприятна та или иная общность.
Коммунисты – злодеи, повинные во многих злых делах, что им стоило и Есенина убить? И ЕР – нехорошая партия, она наверняка все это подстроила с голосами? Проблема не в том, могли или не могли коммунисты и единоросы сделать то, что им приписывается. Но даже если эта гипотеза симпатична, не надо спешить настаивать на ней.
 
1)Надо рассмотреть альтернативные версии. Т.е. мог ли Есенин все-таки сам повеситься при таких данных? В нашем случае речь идет о естественной корреляции между рейтингом ЕР и явкой, она может быть обусловлена двумя факторами:
-неравной вероятностью явки всех избирателей. Сторонники партии-лидера менее мобилизованы, потому что «наши итак победят». Если же в силу каких-то причин явка в данной местности выше (погода, инфраструктура, концентрация жилья и т.п.), то и на участке попадает больше сторонников фаворита. По аналогии, глубже залезешь – гуще зачерпнешь.
-аномалии явки и аномалии рейтинга. Например, явка была выше в сельской местности (вот и вот, например), там же – выше рейтинги партии-фаворита (уже обсуждалось, например, здесь).
Здесь приводится ряд примеров аналогичной корреляции явки и рейтинга партии-фаворита из мировой практики, которых комментируемые авторы не учли. 
Конечно, к этим гипотезам тоже не надо "прилипать", но о них надо в серьез подумать, не отмахиваясь из-за несовпадения с идейными ожиданиями.
 
2)Критически подходите к получающимся итогам, ищите несуразности. В нашем случае это в большей мере ошибка Подмосковника, который вел расчеты уже не первые выборы подряд, каждый раз находил аномалию и каждый раз трактовал ее как итог фальсификации. Хотя предположение, что «фальсификаторы» из года в год вбрасывает примерно одинаковый процент бюллетеней одинаково неравномерно, не вполне логично. Некая «презумпция идиотизма врага».  
 
2.1)Кроме того, получив вброс 16% бюллетеней по стране и соотнеся  его со своими графиками, он мог бы задуматься о том, насколько неудобно на небольшой группе участков добавлять более 30 или даже более 50%. Наконец, задаться вопросом, как такую общенациональную схему можно скрывать.
Кстати, существующий набор обвинений в фальсификациях опровергает модель, полученную на основе анализа явки. Она подразумевает вброс более 30% (или 50%) бюллтеней на участках с высокой явкой, т.е. в первую очередь в сельской местности. На деле – жалоб больше из городов, причем размер фальсификации ниже, а описываемый механизм отличается от модельного. Таким образом, получается, что ни одна из «рассчитанных» фальсификаций не была обнаружена при всей своей громоздкости.
Техническую неосуществимость некоторых методов фальсификации обсудил в своем интервью Чуров. Даю ссылку на оригинал, потому что по сети гуляют фразы вырванные из контекста.
Хист-кай допускает эти ошибки в меньшей мере, потому что оцениваемый им размер фальсификации гораздо меньше. Однако у него другая несообразность: он обнаружил «вброс» голосов за КПРФ. Если не впадать в наиболее одиозные теории заговора всех со всеми, то логично начать искать другое объяснение статистическим аномалиям.
 
3)Наконец, почти техническая деталь: оставляйте резерв для отступления. «Не фальсификация доказана» - «расчеты обнаруживают аномалию, которую я в силу тех-то и тех-то причин связываю с вбросом голосов в течение последних выборов в пользу партии такой-то».
Я, например, заключаю лишь, что в текущем виде рассчитанная модель фальсификации выборов содержит ряд недоказанных моментов и не сообразностей, каковая проблема требует решения. Возможность, тех или иных фактов фальсификации результатов выборов – не исключена, однако этой проблемы наш анализ не касается.

UPD: Еще один материал, где идет чисто математический разбор итогов, во многом повторяет мой, но содержит описание некоторых манипуляций с графиками и большой набор ссылок в конце.

*Подход Хист-Кая даже более радикален: он полностью вырезает пики явки, которые считает аномальными, Подмосковник - срезает лишь аномальную часть, правда, пользуется при этом произвольным "подгоночным коэффициентом". Впрочем, само срезание аномалий и гипотеза о фальсификациях - произвольны, поэтому я не указывают это как отдельную ошибку.
И подчеркну, что приветствую подход к анализу статистики явки. Это, может быть, и не помогает в поиске нарушений, но дает весьма большой материал для понимания тех или иных электоральных закономерностей.

UPD: По причине спам-атаки, опять ввожу временную премодерацию комментов не для френдов. Извиняюсь за неудобства.
Tags: политика, статистика
Subscribe

  • Экономика Таджикистана

    Статья написана и отправлена в редакцию еще до попытки переворота, поэтому посвящена политике импортозамещения и ее перспективах, а равно…

  • "Общественное порицание"

    Коллеги, вот напишу страшную вещь про историю с кафе "Фламинго", которое многие СМИ дружно и эмоционально осудили, не дав слова сотрудникам и…

  • Пара слов экономиста

    На тему текущей ситуацию - считаю нужным кое-что пояснить. Она достаточно сложная и неприятная, но, на мой взгляд, вовсе не безвыходная. Для падения…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 7 comments