Y

キラキラネームはこの先ずっとキラキラネームなのか? 統計データから考えてみた

匿名ダイアリーを読んで悲しい気持ちになった

俺もキラキラネームだが、人生は暗いぞ。マジでやめろ。

人生は地獄だ。毎朝鏡を見て己のブサイクぶりに絶望し、名前を書くときに絶望し、自己紹介して絶望する。

若い人が苦しんでいるのを見ると僕も辛いです。ただ世の中の多くは変わり続けているので、将来はキラキラネームが当たり前(もしくは気にならない程度)になるのではないか.. むしろ彼らは時代の先端にいるのではないかと疑問を持ち、調べてみたいと思いました。

日本の名前データは無かったが、アメリカのはあった

まずは年代別名前データを探しましたが、日本の名前データはなさそうです。(ご存知の方教えて下さい!) 仕方ないのでアメリカのデータを探してみたらありました。しかも、1880年から2014年までの長期間のデータです。

Popular Baby Names

名前の多様性は増えている

さらにその名前データを利用を元にしたグラフを見つけました。「ある年に生まれた赤ちゃんの上位1000件の名前が、その年の名前全体に対して占める割合」をグラフにしています。昔に比べて多様性が増えているのが分かります。

Python for Data Analysis

スクリーンショット 2016-02-02 05.16.52.png

2010年〜2014年は横ばい

上記グラフには2010年〜2014年の結果が表示されていません。Python for Data Analysisに従って表示させたのが以下です。右肩下がりを予想していましたが、結果は横ばいでした。

スクリーンショット 2016-02-02 06.29.50.png

グラフ出力のコードは以下です。(Python for Data Analysisから必要なところをコピペしただけですが...)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

plt.rc('figure', figsize=(12, 5))

years = range(1880, 2014)

pieces = []
columns = ['name', 'sex', 'births']

for year in years:
    path = 'ch02/names1880-2014/yob%d.txt' % year
    frame = pd.read_csv(path, names=columns)

    frame['year'] = year
    pieces.append(frame)

names = pd.concat(pieces, ignore_index=True)

def add_prop(group):
    births = group.births.astype(float)
    group['prop'] = births / births.sum()
    return group
    
names = names.groupby(['year', 'sex']).apply(add_prop)

def get_top1000(group):
    return group.sort_index(by='births', ascending=False)[:1000]
    
grouped = names.groupby(['year', 'sex'])
top1000 = grouped.apply(get_top1000)

pieces = []
for year, group in names.groupby(['year', 'sex']):
    pieces.append(group.sort_index(by='births', ascending=False)[:1000])
    
top1000 = pd.concat(pieces, ignore_index=True)

top1000.index = np.arange(len(top1000))

boys = top1000[top1000.sex == 'M']
girls = top1000[top1000.sex == 'F']

total_births = top1000.pivot_table('births', index='year', columns='name', aggfunc=sum)

table = top1000.pivot_table('prop', index='year', columns='sex', aggfunc=sum)
table.plot(title='Sum of table1000.prop by year and sex', yticks=np.linspace(0, 1.2, 13), xticks=range(1880, 2020, 10))

plt.show()

多様化の原因は何か? 日本でも同じ傾向があるだろうか

Python for Data Analysisには、同じ名前でも複数の綴り方が出現したことなどが原因の1つではないかと書かれているので、日本も同じ傾向なのかは分かりません。(いろいろ調べないと簡単には分からない気がしてきました... 名前だけでなく例えば移民の子供が増えたとか他の要因も調べてみる必要がありそうです。)

まとめ

将来はキラキラネームが当たり前になるか.. 正直よく分かりません。本気で苦しんでいる人がいるはずだから安易に言わない方がよい気がする.. 日本人のデータも探してもっと調べてみます。

参考

俺もキラキラネームだが、人生は暗いぞ。マジでやめろ。

Python for Data Analysis

名前ランキング

2015年生まれの子供の名前

Popular Baby Names

TipMe

TipMe with IndieSquare