Ага.
Не в первый раз вижу как с помощью статистики пытаются запудрить людям мозги. Ну тогда и я буду пудрить с еще большим остервенением!
Возьмем предоставленную Gray_cat-ом картинку и немного обработаем данные. Получится 4 картинки, номера которых указаны в лев.верх. углу каждого графика (в красных кружочках)
Картинка номер 1:
Красными линиями отображены средние значения посчитанные Gray_cat-ом:
Gray_cat>Первые 12 месяцев оккупации май03-апрель04 - 1.84/день Gray_cat>После - 2.33/день. Увеличение 26.4%.
Смотрим на картинку и делаем справедливый вывод:
Вывод №1: Да, увеличение есть, но оно не такое уж и большое!
Gray_cat> Как ни крути
А теперь всетаки как-нибудь "покрутим"!
Начнем пудрить мозги!
За рубеж взят апрель 2004, "попляшем" и мы вокруг него.
Картинка номер 2:
Проведем общий тренд для максимального и минимального значений для каждого из периодов (до и после апреля 2004) - на графике это синие линии. И общее среднее для каждого из периодов - красные линии.
На основе полученного графика делаем вывод:
Вывод №2: Да, увеличение потерь было, но это вполне естественно для времени ведения активных боевых действий! Зато после окончания активной фазы (май 2004) мы видим четко выраженное снижение потерь, а это свидетельствует о... (и дальше можно много словоблудия пустить по поводу нормализации жизни, мирном процесс и т.п.)
Картинка номер 3:
Возьмем все данные и.... выбросим часть этих данных. В статистике это называется уменьшение доверительного интервала. Обычно он равен 95% т.е. 5% данных не учитываются.
Всего я насчитал 18 точек перегиба и если это 100%, то 5% это... 1 точка которую мы можем "выбросить". Тут можно еще не слабо так помухлевать! Например следующим образом: будем рассматривать не точки перегиба, а дни от начала войны. Весь конфликт длится 2 года (без 4 месяцев) т.е. около 365*2 - 4*30 = 610 дней (лень считать точно). 5% от 610 это 30.5 дней которые мы можем "выкинуть". И эти 30 дней мы можем распределить как угодно по все числовой прямой - отбросим, хоть и не на много пики и спады и т.п.
Я кого-то убедил, что данными можно манипулировать вполне законно с точки зрения статистики?
Продолжаем дальше. Gray_cat сказал:
Значит "активные" столбики выбрасываем - Буш с авианосца обьявил о победе в активной войне 1 мая 2003. Хотя и в марте и в апреле большая американских жертв от смертников в халатах врезавшихся на легковых в блокпосты - будем считать их храбрыми солдатами, а не партизанами - март, апрель уходят. Ноябрь - наступательная операция где не иракцы атаковали, а их наоборот мочили - ноябрь уходит.
Правильно, подойдем именно с этим принципом к "выкидыванию" данных и не будем учитывать два резких пика (ноябрь-декабрь 2003 и апрель-июнь 2004) и один спад (февраль-март 2004).
Опять проведем линии максимумов и минимумов - синие линии на третьем графике. И красной линией - среднее значение (общий тренд), которое можно интерпретировать и как линейную апроксимацию наших данных.
По графику делаем вполне законный вывод:
Вывод №3: За все время присутствия ВС в Ираке число погибших неумолимо возрастает! И если в начале операции оно было 1.3-1.4 (две первые точи на графике), то к январю оно достигло 1.9-2.0 (две последние точи на графике) т.е. увеличилось на 30-45%!
(Для проверки: 1.9-1.3=0.6; сколько процентов составит 0.6 от 1.3? и 0.6=2.0-1.4 в процентах от 2.0?)
Увеличилось на 30-45% - не слабо, однако!!
В прошлом примере мы получили гипотезу о том, что потери (при линейной аппроксимации) имеют тенденцию к возрастанию. Чтобы проверить эту гипотезу на состоятельность мы должны определить значимые точки т.е. значения которые будут влять на среднее значение, а следовательно и на нашу гипотезу. Делается это путем сужения доверительного интрервала т.е. путем "выбрасывания" точек. Сузим его так как показано на рисунке 4. (Выбросили почти все резкие пики и спады.)
Синии линии - максимумы и минимумы, красная линия - среднее значение.
Из графика хорошо видно, что общая тенденция к возрастанию сохраняется! При этом красная линия с 4-го рисунка очень близка к красной линии с 3-го рисунка, что так-же подтверждает гипотезу, а следовательно
Вывод №4 будет аналогичен выводу №3.
Что и требовалось показать.