野球hackを見ていたら、野球以外にいいスポーツないだろうかと探していた。
そこで、ボウリング。東京オリンピックでは正式種目にならず残念。
今回データに使うのは
ではなく
でもなく
でもなく
でもなく
こちらです。各団体の回しものではございません。
なぜPBAを選んだかというと単純にほかの団体はpdfを扱っているのに対して、PBAはhtmlでデータが取れるということです。
ようするにpandasが使えてさくっとできる。ここが選んだ理由です。
今回抽出するデータは「トミージョーンズ」です
pandas.io.html.read_html(http://www.pba.com/bowlers/bowler/4646)
plt.plot(df_sample['Avg'])
くらいでさくっと表示可能です。
x軸は手入力なので全然美しくない。うまい方法がないか調べたが見つからず。
2002-2003とか書かれているデータがあるので、単純にもってこれないんだよね。
もっと細かいデータがとれると10ピン取得率とかいろいろ見れるんだけど。