Степенные распределения: почему экстремальные события случаются чаще, чем вы думаете

simulator beginner ~6 min
Загрузка симуляции...
Степенной закон: P(x) ~ x^(-2,1)

При alpha=2,1 степенное распределение порождает экстремальное неравенство: наибольшее значение обычно в 100-1000 раз превышает медиану, а верхний 1% владеет 20-40% целого. Этот паттерн проявляется в размерах городов, частотах слов, богатстве и магнитудах землетрясений.

Формула

P(x) ~ x^(-alpha)
Zipf: f(r) ~ r^(-1)
Gini = 1/(2*alpha - 1) for Pareto distribution

Правило 80/20 и далее

В 1897 году итальянский экономист Вильфредо Парето заметил, что 80% земли Италии принадлежит 20% населения. Этот «принцип Парето» оказался частным случаем гораздо более глубокого математического паттерна: степенного распределения. Когда величина подчиняется P(x) ~ x^(-alpha), экстремальные значения — не редкие выбросы, а неотъемлемое свойство системы.

Замечательное открытие Ципфа

В 1949 году лингвист Джордж Ципф показал, что частоты слов следуют точному математическому закону: n-е по частоте слово встречается с частотой, пропорциональной 1/n. Слово «the» составляет около 7% всего английского текста, «of» — 3,5%, «and» — 2,8%. Та же ранго-частотная зависимость проявляется в размерах городов (Нью-Йорк примерно вдвое больше Лос-Анджелеса), доходах компаний и трафике веб-сайтов.

Тяжёлые хвосты меняют всё

Нормальные (гауссовы) распределения имеют тонкие хвосты — события далеко от среднего экспоненциально редки. Степенные законы имеют тяжёлые хвосты — экстремальные события лишь полиномиально редки, что делает их гораздо более частыми, чем подсказывает интуиция. Вот почему: сильнейшее землетрясение в миллионы раз мощнее среднего; богатейший человек в миллионы раз богаче медианного; а одна вирусная публикация может набрать больше просмотров, чем тысяча средних вместе взятых.

Попробуйте сами

Регулируйте показатель alpha и наблюдайте, как меняются ранго-размерный график и гистограмма. Меньший alpha означает более экстремальное неравенство. Переключайтесь между наборами данных, чтобы увидеть один и тот же математический закон, проявляющийся в совершенно разных областях. Коэффициент Джини и доля верхнего 1% количественно показывают, насколько неравными становятся величины со степенным распределением.

Частые вопросы

Что такое степенное распределение?

Степенное распределение имеет вид P(x) ~ x^(-alpha), где вероятность наблюдения значения x убывает как степень x. В отличие от нормальных распределений, степенные имеют «тяжёлые хвосты» — экстремальные события гораздо более вероятны, чем предсказала бы колоколообразная кривая. Размеры городов, частоты слов, магнитуды землетрясений и богатство — все подчиняются приблизительным степенным законам.

Что такое закон Ципфа?

Закон Ципфа утверждает, что частота элемента обратно пропорциональна его рангу. Самое частое слово («the») встречается примерно вдвое чаще второго («of»), втрое чаще третьего («and») и так далее. Джордж Ципф наблюдал этот паттерн в 1949 году в языках, размерах городов и многих других явлениях.

Что означает показатель степенного закона alpha?

Alpha контролирует степень неравенства. Меньший alpha означает более тяжёлые хвосты и более экстремальные значения. При alpha < 2 среднее бесконечно (теоретически). При alpha < 3 бесконечна дисперсия. Большинство реальных степенных законов имеют alpha от 2 до 3.

Почему степенные законы так часто встречаются в природе?

Степенные законы порождаются несколькими механизмами: предпочтительное присоединение (богатые становятся богаче), самоорганизованная критичность (модели песчаных куч), мультипликативные случайные процессы и оптимизация при ограничениях. Повсеместность степенных законов отражает глубокие математические принципы, а не какой-то один физический механизм.

Источники

Встроить

<iframe src="https://homo-deus.com/lab/network-science/power-law-distribution/embed" width="100%" height="400" frameborder="0"></iframe>
View source on GitHub