目次
統計
データ解析に重要な4つのS
項目 | 内容 |
---|---|
採集 | 入力、転記ミスはないか |
視覚化 | 数値だけで判断しない。グラフ、ヒストグラム、パレート図、散布図など |
層別 | 様々な角度から見る。男女別、年代別、月別、曜日別など |
相関 | 2種類のデータの関係性を見つける。年齢と年収、経済成長率と失業率など |
Python
基本統計量、ヒストグラム
基本統計量、分散と標準偏差
正規分布、確率密度関数
散布図と相関分析(1)
散布図と相関分析(2) 単回帰分析
重回帰分析
Tips
クーポン収集問題
- 6面サイコロの全ての目が出るまでにサイコロを平均で何回振る必要があるか
>>> p = 6 >>> sum([ 1.0 / (x/float(p)) for x in range(1,p+1)]) 14.7
YAGI Hiroto (piroto@a-net.email.ne.jp)
twitter http://twitter.com/pppiroto
Copyright© 矢木 浩人 All Rights Reserved.