Take's Software Engineer Blog

TOEIC200点&プロマネな私が社内公募を経て、ソフトエンジニア&英語部門へ異動して奮闘していく話をしていきます

朝活 pythonとpandasであるPBA選手のアベレージをグラフ化

野球hackを見ていたら、野球以外にいいスポーツないだろうかと探していた。

そこで、ボウリング。東京オリンピックでは正式種目にならず残念。

nageyo.com

今回データに使うのは

公益社団法人 日本プロボウリング協会

ではなく

www.jbc-bowling.or.jp

でもなく

nbfgr.jp

でもなく

ABBF - 全国実業団ボウリング連盟

でもなく

www.pba.com

こちらです。各団体の回しものではございません。
なぜPBAを選んだかというと単純にほかの団体はpdfを扱っているのに対して、PBAはhtmlでデータが取れるということです。

ようするにpandasが使えてさくっとできる。ここが選んだ理由です。

今回抽出するデータは「トミージョーンズ」です

www.pba.com

pandas.io.html.read_html(http://www.pba.com/bowlers/bowler/4646)
plt.plot(df_sample['Avg'])

くらいでさくっと表示可能です。

f:id:monokuma12:20160831070313p:plain

x軸は手入力なので全然美しくない。うまい方法がないか調べたが見つからず。
2002-2003とか書かれているデータがあるので、単純にもってこれないんだよね。

f:id:monokuma12:20160831070429p:plain

 

もっと細かいデータがとれると10ピン取得率とかいろいろ見れるんだけど。

div #breadcrumb div{ display: inline;font-size:13px;}