上級マクロ経済学
第2回 マクロ経済学のデータ
1 マクロ経済とデータ
マクロ生産関数
マクロ経済学で用いる生産関数は、次のような関数を仮定することが多い。 Y = F(L,K) ここで、YはGDP、Lは労働量、Kは資本ストックである。
- これらの変数は、マクロ経済の中で重要な役割を持つ。
変数の概要
- GDP
-
- 調査対象期間の生産物付加価値の合計
- あるいは、最終生産物の価値の合計
- 四半期データ、年次データが公開されている。
- 四半期データは季節性を持つ。
- 労働量
-
- 労働者数、労働時間数、あるいは両者の掛け合わせで労働投入量を計測する。
- 人口が増えれば労働量は増えやすい。
- 失業者が減れば労働量は増える。
- 残業が増えれば労働量は増える
- 資本ストック
-
- 生産に用いられる、土地、労働以外の要素をひっくるめたもの(資本)の総量。
- 資本は使われると減耗すると考えられる(資本減耗)。
- 資本減耗は減価償却として考えられる。
データの取得
- 国民経済計算(SNA)が内閣府から公開されている。
- 日本のGDP、労働量、資本ストックはここから取得可能。
- 基本は実質GDPを使うべき。
- 世界各国の比較をしたいなら、以下のウェブサイトからデータを集めたりする。
Penn World Table(PWT)はシンプルかつ抜けが少なく、データが集めやすい印象。
この講義でもPWTのデータを引っ張ってくる。
GDP
- 日本のGDPは右肩上がりに成長してゆき、近年は停滞。
労働力
- 労働力は上昇トレンドが続いたが、今後は低下してゆくだろう。
- 一人当たりの労働時間は減少を続けている。
- 国全体での総労働投入時間は近年横ばい。
資本ストック
- 継続して上昇してきているが、上昇率は小さい。
対数変換と変化率
ある時間によって変化する変数X_tを対数変換しよう。 \log X_t いま、X_{t}からX_{t+1}への変化率は、 \frac{X_{t+1} - X_{t}}{X_{t}} \approx \log X_{t+1} - \log X_{t} で近似できる。
導出はこちら
\begin{aligned} \log X_{t+1} - \log X_{t} &= \log \left( \frac{X_{t+1}}{X_t} \right) \\ &= \log \left( \frac{X_{t}+X_{t+1}-X_t}{X_t} \right) \\ &= \log \left( 1 + \frac{X_{t+1}-X_t}{X_t} \right) \\ \end{aligned} いま、g \equiv \frac{X_{t+1}-X_t}{X_t}とおけば、 \begin{aligned} \log X_{t+1} - \log X_{t} &= \log \left( 1 + g \right) \\ \end{aligned} ここで、\log(1+g) \equiv f(g)としよう。 f(g)をg=0近傍でテイラー展開し、一次関数で近似すれば \begin{aligned} f(g) &\approx \log 1 + \left. \frac{\partial \log (1+g)}{\partial g}\right|_{g=0} (g-0) \\ &= \frac{1}{1+0} g \\ &= g \end{aligned} ゆえに、 g = \frac{X_{t+1}-X_t}{X_t} \approx \log X_{t+1} - \log X_{t}
テイラー展開はg=0近傍、つまり成長率がほぼゼロの近辺での近似をしている。
したがって、成長率が0から離れるほど、近似精度は落ちる。
しかし、実用上はそこまで問題はないと言えるだろう。
GDP(対数)
対数変換したデータから、だいたいの変化率を測ることができる。
log_Y_in_bil._USドル | |
---|---|
Variable code | |
1950 | 5.491581 |
1951 | 5.598432 |
1952 | 5.688180 |
1953 | 5.736110 |
1954 | 5.796960 |
... | ... |
2015 | 8.535904 |
2016 | 8.513723 |
2017 | 8.517866 |
2018 | 8.513842 |
2019 | 8.522847 |
70 rows × 1 columns
2 データと記述統計
データの表現
1番目からN番目までのデータが得られたとしよう。 それぞれを、 \{ x_1, x_2, \cdots, x_N \} として表現する。
\{ \cdot \}は集合を表している。
集合の中のインデックスを使って、次のようにも表すことがある。 \{x_n \}_{n=1}^N
また、インデックスの値が明らかな場合、上記の表現はさらに省略されて
\{x_n \}_{n} と表される場合もある。
代表値
データの集合\{x_n \}_{n=1}^Nの特徴を表す値を、代表値という。
代表的なものは
- 平均値
- 中央値
- 最頻値
- 分散
- 標準偏差
平均値
データ\{x_n \}_{n=1}^Nの平均値\bar{x}は、次のように定義されます。
\bar{x} = \frac{1}{N} \sum_{n=1}^N x_n
中央値と最頻値
小さい順にデータを並べた時、ちょうど真ん中にある値。
データの数が偶数なら、真ん中に2つ値があるはずなので、その二つの平均値が中央値として定義される。
データの中で、最も出現する値を、最頻値という。
分散
データの散らばり具合を表す指標。
- 標本分散(不偏分散)
- s_x^2 = \frac{1}{N-1} \sum_{i=1}^N (x_i - \bar{x})^2
標準偏差
分散は単位が元のデータの2乗になっている。
標準偏差は分散を\frac{1}{2}乗して、散らばりの指標の単位を元のデータの単位に揃えたもの。
- 標本標準偏差(不偏標準偏差)
- s_x = \sqrt{s_x^2}
2データの関連性
データ\{x_n\}_{n=1}^N、\{y_n\}_{n=1}^Nが存在する時、2データの共分散と相関係数を次のように定義する。
- (不偏)共分散
- \sigma_{xy} = \frac{1}{N-1} \sum_{i=1} (x_i - \bar{x}) (y_i - \bar{y})
- 相関係数
- r_{xy} = \frac{\sigma_{xy}}{\sigma_x \sigma_y}
記述統計のまとめ方
論文、レポートにおいて使用するデータについては、記述統計量を記述統計表としてまとめて載せる。
例えば先に出たGDP、労働者数、労働時間、資本ストックを使う場合、以下のようにまとめることが考えられる。
平均 | 標準偏差 | 最大値 | 最小値 | |
---|---|---|---|---|
GDP(bil. USドル) | 2836.3 | 1787.2 | 5108.8 | 242.6 |
労働者数(mil.) | 59.0 | 8.6 | 70.0 | 39.4 |
労働時間(時間/年・人) | 1982.6 | 144.1 | 2175.3 | 1691.1 |
資本ストック(bil. USドル) | 12219.9 | 8666.2 | 23918.0 | 790.5 |
雑論とまとめ
- マクロ経済学的なデータは政府関係機関が調査・公開している。
- 関心のあるデータがあれば、まずは検索。
- 日本のデータならe-Statを最初にあたることになるかも。
- 海外のデータは別のソースを使う必要がある。
- いわゆる商業ベースのデータも最近は利用が活発だが、何しろ高い。
- データは確率変数としてみなす場合が多い。
- 統計の理論については、多くの話を端折っている。
- この講義は「マクロ経済学」なので、必要そうな部分をつまんでいるのみ。
- 関心のある人は、ちゃんと統計学の講義を受けたり、教科書を読んだりするべき。
- 特にデータサイエンス系の話に関心のある人は、大数の法則と中心極限定理をちゃんと覚えておくのはマストだと思った方が良い。
- 難しいし、実はそこに至るまでにはいくつかのステップが必要なので、急ぐ必要はない。