総務省 労働力調査 長期時系列データ(Excel)をpandasで読み込む
就業者数の推移が気になった
リーマン・ショック、民主党政権、第2次安倍内閣。ここ10年ぐらいの就業者数の推移が気になったのでグラフ化しました。
労働力データ取得
import pandas as pd import urllib.request as urllib2 link = 'http://www.stat.go.jp/data/roudou/longtime/zuhyou/lt01-a30.xls' socket = urllib2.urlopen(link) xls = pd.ExcelFile(socket) df = xls.parse(xls.sheet_names[0], skiprows=10, header=0, skip_footer=3) df.columns = ['A','B','C','D','E','F','G','H','I','J','K','L','N'] df = pd.DataFrame({'Total': df['E']})
日付はdate_rangeで生成
rng = pd.date_range('1/1/1953', periods=756, freq='M') df['Date'] = rng
グラフ化
import matplotlib.pyplot as plt import numpy as np x = np.array(df['Date']) y = np.array(df['Total']) plt.plot(x, y) plt.show()
2007年から2015年までの期間
x = np.array(df['Date'][648:]) y = np.array(df['Total'][648:]) plt.plot(x, y) plt.show()
- 2008年9月15日 リーマン・ブラザーズ破綻
- 2009年7月21日 鳩山内閣発足
- 2011年3月11日 東日本大震災
- 2012年12月26日 第2次安倍内閣発足
まとめ
安倍内閣の間に雇用が150万人増えていることが分かります。参考数値として鹿児島県の人口は約160万人。ほぼ同数の雇用が増えたということですね。政府は一億総活躍社会の実現を目指していますが今後の就業者数の推移が楽しみです。
参考
Time Series / Date functionality
Python pandas で日時関連のデータ操作をカンタンに