Волею судьбы я наткнулся на данные о зарплатах, премиях и сверхурочной работе многих госслужащих одного крупного портового города, от мэра до сторожа бассейна.
Не теряя ни минуты, я бросился копаться в цифрах.
Нет ничего интереснее, чем смотреть на зарплаты других людей, особенно когда ты можешь оправдать себя тем, что являешься Data Scientist! Как только прошли первые приступы зависти, я понял, что в датасете есть информация не только о крупных менеджерах, но и о рядовых сотрудниках самого низшего звена.
Оказывается, используя эти данные, можно воочию наблюдать основные закономерности распределения доходов в реальном мире.
Пользуясь случаем, приглашаю всех кабинетных экономистов в увлекательное путешествие в мир роскошных зарплат и скупой статистики! Сегодня мы поговорим о средней и медианной зарплате, индексе социального неравенства Джини, соотношении богатых и бедных (индекс Rich/Poor), непреодолимом разрыве в доходах (эффект Мэтью) и карьерном росте.
Сразу раскрою главную интригу – что это за данные и откуда я их взял.
Это реальная информация о зарплатах муниципальных служащих города Сан-Франциско ( на картинке ), который находится в Калифорнии, США.
В датасете указаны настоящие имена, занимаемые должности, зарплаты, премии, сверхурочные и премии некоторых (возможно, всех) сотрудников за 4 года — с 2011 по 2014 год включительно.
Данные не очень чистые и не полностью стандартизированы, но работать с ними можно.
Все это любезно предоставлено государственное управление в рамках проекта Прозрачная Калифорния .
Все суммы указаны в долларах за год до уплаты налогов.
Я намеренно пропущу этапы изучения и подготовки данных, а также построения графиков кода.
Желающие могут изучить все это в github .
Есть Python, Jupyter, Pandas и Seaborn. Итак, давайте начнем.
Распределение заработной платы
В наборе данных содержатся не только базовые доходы сотрудников, но и различные надбавки.Чтобы не вдаваться в подробности, будем рассматривать только базовый доход и общий доход с учетом всех надбавок и бонусов.
Вот как выглядит распределение базового дохода сотрудников за 4 года:
Эти четыре.
хм.
«морковки» символизируют распределение доходов на протяжении 4 лет. По оси Y — величина дохода, по оси X — плотность вероятности распределения доходов.
Поперечные пунктирные линии представляют собой 25%, 50% (медиана) и 75% квартили распределения.
Отчетливо видны несколько уплотнений – около $5000, $65000, $110000 и $170000. Вот как выглядят классы сотрудников: временные работники, линейный персонал, высококвалифицированные специалисты и топ-менеджмент. Похоже, что «пряник» медленно движется вверх, что может означать как рост уровня благосостояния, так и инфляции.
Теперь посмотрим на распределение совокупного дохода сотрудников:
Данные за 2011 год сильно отличаются от последующих.
Оказалось, что у нас нет данных о премиях за этот год. В целом данные за 2011 год оформлены по-другому, что сильно затрудняет их использование.
Кроме того, в этом году сменилось избранное правительство, из-за чего зарплаты людей, занимающих выборные должности, не рассчитываются за весь год. В другие годы мы видим, что слой премий «сглаживал» «пряник» распределения, практически устраняя четкое разделение сотрудников по классам.
То есть с учетом бонусов хороший линейный специалист зарабатывает сопоставимо с расслабленным экспертом.
Сан-Франциско – не дешевый город. Официальная минимальная зарплата — около $20 000 в год, субъективная стоимость жизни — от $40 000 в год. Непонятно, почему так много людей с зарплатой меньше МРОТ? Ответ кроется в признаке Статус – FT (Full-time) и PT (Part-time), т.е.
в выборку входят не только сотрудники, работающие полный рабочий день, но и сотрудники, работающие неполный рабочий день, в т.ч.
разовые работы.
Атрибут Статус указан только для 2014 года.
Вот как выглядит распределение общего дохода, разделенного на штатных и внештатных сотрудников:
Как видите, средний доход штатного сотрудника составляет около 130 000 долларов в год.
Давайте также ответим на вопрос, который стал предметом многих дискуссий в Интернете – как связаны средняя и медианная зарплаты? Существует мнение, что средняя зарплата существенно выше медианной за счет доходов топ-менеджмента.
Давайте проверим, так ли это:
На верхнем рисунке вы видите попытку привести распределение заработной платы в норму.
Наибольшее значение плотности распределения соответствует средней заработной плате, которая составляет 90 000 долларов США.
На нижнем рисунке показаны квартили распределения зарплат, средняя линия внутри прямоугольника — это медианная зарплата, равная 85 000 долларов.
Как видите, действительно, средняя зарплата выше медианной, но отнюдь не значительно.
Социальное неравенство
Самое волнующее в зарплатах – это вопрос их справедливого распределения.(от каждого по способностям, каждому по труду?) .
Мудрые предки оставили нам числовые показатели неравенства в распределении доходов.
Наиболее популярными являются индекс Джини и индекс R/P. Давайте поговорим о них более подробно.
Индекс Джини — статистический показатель степени расслоения величины.
В экономике его обычно используют для измерения расслоения населения по доходам.
Индекс Джини рассчитывается как соотношение площадей между Кривая Лоренца а диагональ y=x (зеленая область) равна площади всего треугольника ниже диагонали (синяя + зеленая области):
Показатель измеряется от 0 до 100, где 0 — полное равенство (все синего цвета), а 100 — все доходы на одного человека (все зеленого цвета).
Например , Джини России - 42,0, США - 45,0, Германии - 27,0, Китая - 47,3. Самый маленький коэффициент Джини в Швеции — 23,0, самый большой — в африканских банановых монархиях, где он может подниматься выше 60. На рисунке выше показана кривая Лоренца для доходов сотрудников, работающих полный рабочий день.
Индекс Джини у них равен 18,9, что указывает на почти коммунистический эгалитаризм.
Можно интерпретировать это так – если вам удалось попасть в штат мэрии Сан-Франциско, вы не будете обижены на свою зарплату.
А можно и так – если ты работаешь в мэрии, карьерная лестница у тебя невысокая.
Еще одним интересным индикатором стратификации является соотношение доходов богатых к доходам бедных.
Давайте посмотрим на темно-синий «треугольник» на картинке выше.
Его ширина составляет 20%, что составляет 20% самых богатых людей.
Высота темно-синего треугольника равна 31%.
Это означает, что на долю самых богатых 20% людей приходится 31% общего дохода.
Теперь обратите внимание на красный треугольник.
Ее ширина составляет 20% (самых бедных людей), а высота – 12% (доходов), т.е.
на долю беднейших 20% людей приходится 12% совокупного дохода.
Индекс Rich/Poor 20 отражает соотношение доходов 20% самых богатых и 20% самых бедных слоев общества.
Для штатных сотрудников мэрии Сан-Франциско коэффициент R/P 20 составляет 2,5. Это можно трактовать как высоту потолка роста по карьерной или социальной лестнице.
Теперь для сравнения посмотрим на кривую Лоренца для фрилансеров:
Мы видим разительное отличие от предыдущего графика.
Дуга кривой Лоренца сильно изогнулась вниз, а зеленая область увеличилась в размерах.
Богатый треугольник занимает почти половину высоты, а бедный треугольник почти не виден.
Индекс Джини составляет 53,6, а R/P 20 — 45. Это примерно соответствует бедным странам Южной Америки с выраженным расслоением между богатыми капиталистами и деревенскими мучачо.
?Эффект Мэтью
Мудрость поколений говорит, что « Всякому имеющему дастся и приумножится, а у неимеющего отнимется и то, что имеет. Другими словами, пропасть между бедными и богатыми постоянно увеличивается.Этот забавный феномен наблюдался протосоциологами на протяжении тысячелетий, а в последнее время его осознание стало доступным.
От ?Эффект Мэтью , как это называют экономисты, вывод состоит в том, что единственный способ увеличить свое богатство и оставить наследство своим детям — это принадлежать к верхушке общества.
Эту гипотезу очень неприятно осознавать, и было бы хорошо, если бы она оказалась ложной.
Так давайте опровергнем это! На рисунке ниже вы видите общий размер фонда оплаты труда муниципалитета Сан-Франциско за 3 года.
Он вырос с $3,70 млрд в 2012 году до $3,82 млрд в 2014 году, показав рост +3,2% от общего объёма.
Теперь давайте построим график среднего дохода самого высокого и самого низкого децилей (10% самых высоких и самых низких зарплат).
Как видно, средний доход в верхнем дециле увеличился на +3,0%, тогда как доход в нижнем дециле значительно снизился на -12,6%.
Это означает не только существование эффекта Мэтью, но и то, что он чрезвычайно силен и легко заметен невооруженным глазом.
Можно предположить, что этим объясняется сильный рост индекса Джини в США за последние 30 лет. Стоит отметить, что из-за отсутствия различия между полной и неполной занятостью в первые годы мы оценивали доход децилей по смешанной выборке штатных и внештатных работников.
Это могло бы внести существенные коррективы в результат, поэтому я в этом не уверен — размер разрыва выглядит слишком неправдоподобно.
Карьера
Раз уж мы заговорили о карьерном росте, давайте проверим – он существует или это фантазии? Поскольку желания разбираться в иерархии американских чиновников нет, будем считать, что карьерный рост сводится к росту зарплат. Набор данных содержит имена и фамилии людей, и ожидается, что они будут повторяться из года в год. Давайте посмотрим на доходы тех же людей в 2012 и 2014 годах, посчитаем рост в процентах и построим распределение роста в пересчете на один год:Слева – график плотности вероятности роста доходов, справа – график функции распределения роста доходов.
Во-первых, видно, что рост доходов 20% сотрудников лежит в диапазоне от 0 до 2%, что примерно покрывает инфляцию.
Чаще всего рост доходов составляет от 2% до 5%, он наблюдается в 50% случаев, это мода на темпы карьерного роста.
Далее примерно 15% людей смогли добиться роста в 5-10%, этот темп роста можно считать высоким.
И не более 5% людей показали выдающийся рост доходов более чем на 10% в годовом исчислении.
Также стоит отметить, что 10% сотрудников продемонстрировали отрицательный рост доходов, то есть их зарплаты снижались из года в год. Заметим, что для построения этого графика мне пришлось применить к выборке фильтры огрубления, чтобы отсечь «длинный хвост», образованный людьми, перешедшими из разовых контрактников в штат, тем самым увеличив свои доходы от муниципалитета в 50 раз.
-100 раз.
Эти фильтры могли существенно повлиять на распределение.
Заключение
Оказалось, что на примере даже такого маленького мира, как муниципалитет Сан-Франциско, можно изучать социологические и экономические закономерности.Можем отметить следующие моменты:
- зарплаты в муниципалитете очень скучные
- хороший специалист может зарабатывать не меньше, чем посредственный менеджер
- Медианная зарплата мало чем отличается от средней
- разрыв в доходах между богатыми и бедными увеличивается
- даже на спокойной госслужбе есть возможности для карьерного роста
Я не рекомендую делать на основании этой статьи далеко идущие выводы об экономической статистике в США и, тем более, в мире в целом.
Теги: #статистика #экономика #зарплата #кто читает теги? #Интеллектуальный анализ данных #Открытые данные #Визуализация данных