Gibrat`s law for (all) cities

advertisement
Gibrat’s Law for (All) Cities
JAN EECKHOUT
THE AMERICAN ECONOMIC REVIEW, 2004
Всеволод Андреев
Нижний Новгород, 2012
The law of proportionate effect will
therefore
imply that the logarithms of the variable
will be distributed following the
[normal distribution].
—Robert Gibrat (1931)
Распределение населения по географическим
районам, которое непрерывно меняется, не
является случайным.
Существует сильная тенденция к агломерации.
Реки, побережье и горы, возможно, сыграли
решающую роль при возникновении ранних
поселений.
В настоящее время эволюция поселений
представляет собой чрезвычайно сложный
сплав стимулов и действий, исходящих от
миллионов людей, предприятий и организаций.
Однако имеются существенные трудности в
описании мобильности населения.
Трудность порождается двумя надежными
эмпирическими закономерностями:
1. Крупнейшие города удовлетворяют закону
Зипфа.
2. Темп роста городского населения не зависит
от размера города: крупные города в среднем
не растут быстрее или медленнее, чем
маленькие города.
Пропорциональный процесс роста (вторая
закономерность) приводит к логнормальному
распределению, а не к распределению Парето
(т.е. закону Зипфа).
Это установлено Gibrat (1931) и первоначально
сформулировано астрономом Jacobus C.
Kapteyn (1903):
стохастический процесс роста, который является
пропорциональным, приводит к асимптотически
логарифмическому нормальному
распределению.
Цель статьи
•Новое решение проблемы, связанной с двумя
эмпирическими закономерностями. Это
обеспечивает точное описание мобильности
населения.
•Выдвижение и исследование теории равновесия
локальных внешних externalities.
Зачем это надо?
•Эффективно ли предоставлять субсидии из
федерального бюджета малым городам для
привлечения жителей?
•Каков эффект от финансирования
правительством местных перевозок в больших
городах?
Как решается?
Данные переписи 2000 года содержат сведения по 25359
населённым пунктам, включая большие и малые города,
деревни, ранжированные по населению от 1 до 8
миллионов. Ранее в литературе рассматривались только
усеченные распределения, т.е. верхний хвост
распределения из 135 крупнейших городов, что составляет
0,5% от текущей выборки и 30,2% от численности
населения.
Использование новых данных показало, что распределение
всей выборки по размерам логнормальное и не по Парето.
Кроме того, для наблюдений, для которых имеются данные
переписи за 1990 год, рассчитаны темпы роста городов.
Результаты подтверждают вторую закономерность, что рост
не зависит от размера города.
Как решается?
Предложена теория локальных externalities.
Как и в работе Lucas and Rossi-Hansberg (2002), города в этой модели
характеризируются локальными externalities– как положительными
производительными externalities, так и отрицательными
потребительскими externalities (потери свободного времени в
пробках).
Эти externalities являются локальными, т.е. они оказывают влияние на
население только в пределах города и обычно зависят от
численности населения города.
Однако, экономика отличается от Lucas and Rossi-Hansberg (2002),
так как мобильность между городами и внутри городов разная.
Локальные externalities в городах регулируют мобильность граждан
между разными городами (т.е., нет externalities между городами).
Как это случилось, что закон Зипфа
многократно подтвержден в
литературе, а в то время как
действительное распределение
логнормальное?
FIGURE 1. DENSITY OF
LOGNORMAL (PANEL A)
AND PARETO (PANEL B)
DISTRIBUTION
I. The Empirical Size Distribution of
Cities
A.The Data
В 2000 году 208 000 000 из 281 млн.
человек (74%) жили в общей
сложности в 25 359 местах.
TABLE 1—TEN LARGEST CITIES IN THE UNITED STATES
Rank
City
Population S
SNY/S
1
New York, NY
8,008,278
1.000
2
Los Angeles, CA
3,694,820
2.167
3
Chicago, IL
2,896,016
2.753
4
Houston, TX
1,953,631
4.099
5
Philadelphia, PA
1,517,550
5.277
6
Phoenix, AZ
1,321,045
6.062
7
San Diego, CA
1,223,400
6.546
8
Dallas, TX
1,188,580
6.738
9
San Antonio, TX
1,144,646
6.996
10
Detroit, MI
951,270
8.419
Note: SNY /S denotes the ratio of population size relative to New York.
TABLE 2—TEN LARGEST METROPOLITAN AREAS (MA) IN
THE UNITED STATES
Rank
MA
Population S
SNY/S
1
New York-Northern New Jersey-Long Island, NYNJ-CT-PA
21,199,865
1.000
2
Los Angeles-Riverside-Orange County, CA
16,373,645
1.295
3
Chicago-Gary-Kenosha, IL-IN-WI
9,157,540
2.315
4
Washington-Baltimore, DC-MD-VA-WV
7,608,070
2.787
5
San Francisco-Oakland-San Jose, CA
7,039,362
3.012
6
Philadelphia-Wilmington-Atlantic City, PA-NJ-DEMD
6,188,463
3.426
7
Boston-Worcester-Lawrence, MA-NH-ME-CT
5,819,100
3.643
8
Detroit-Ann Arbor-Flint, MI
5,456,428
3.885
9
Dallas-Fort Worth, TX
5,221,801
4.060
10
Houston-Galveston-Brazoria, TX
4,669,571
4.540
According to the Census Bureau definition, an MA “must
include at least one city with 50,000 or more inhabitants, or a
Census Bureau–defined urbanized area (of at least 50,000
inhabitants) and a total metropolitan population of at least
100,000 (75,000 in New England).”
In 2000, 80% of the entire U.S. population lived in 276 MAs.
B. The Size Distribution
FIGURE 2. EMPIRICAL AND THEORETICAL DENSITY FUNCTIONS
FIGURE 3. EMPIRICAL AND THEORETICAL CUMULATIVE DENSITY FUNCTIONS
Over the entire size distribution, the median city has a population of 1,338.
The sample mean (in ln, standard error in brackets) is
̂ 
7.28 (0.01) and the standard deviation is ̂  1.75.
The theoretical density function of the lognormal size distribution
is normal in lnS and given by
ˆ , ˆ  

1
exp  ln S  ˆ  2ˆ 2
ˆ 2

.A Kolmogorov-Smirnov (KS) test of goodness of fit of the empirical
density function against the lognormal with sample mean
̂  7.28 and sample standard deviation
̂  1.75 generates the KS test statistic D=0.0189,
and the corresponding p-value obtained is 1%.
C. Proportionate City Growth
FIGURE 4. SCATTER PLOT OF CITY GROWTH AGAINST CITY SIZE
Использованы данные о численности населения для мест (places) в
Соединенных Штатах по переписям 1990 и 2000 годов. Размер
выборки существенно меньше (19361 мест вместо 25359).
Выполняется непараметрическая регрессия роста от размера.
Регрессионное соотношение
gi  mSi   i , i=1, ..., 19361.
g i is the normalized growth rate, i.e., the difference between growth and
the sample mean, divided by the sample standard deviation;
Si is the log of the population size of a city.
Цель состоит в том, чтобы обеспечить приближение неизвестных
отношений между ростом и размером с помощью сглаживания,
без параметрического предположения о функциональной форме
mSi 
FIGURE 5. SURFACE PLOT: KERNEL DENSITY ESTIMATION
OF NORMALIZED GROWTH RATES BY DECILE OF THE
SIZE DISTRIBUTION
Each stochastic kernel is calculated using the bandwidth derived with the
automatic method corresponding to the Gaussian distribution (see
Bernard W. Silverman, 1986).
FIGURE 6.
CONTOUR PLOT:
KERNEL
DENSITY
ESTIMATION OF
NORMALIZED
GROWTH RATES
BY DECILE OF
THE SIZE
DISTRIBUTION
Темпы роста поразительно
стабильны по различным децилям.
FIGURE 7. KERNEL ESTIMATE OF POPULATION GROWTH
(BANDWIDTH 0.5)
FIGURE 9. CITY SIZE DISTRIBUTION AND LINEAR REGRESSION LINE
Спасибо за внимание!
Download