1,340 バイト追加
、 2020年2月15日 (土) 07:29
==統計==
[数学][R]
{{amazon|479811958X}}
===データ解析に重要な4つのS===
{|class="wikitable"
!項目
!内容
|-
|採集
|入力、転記ミスはないか
|-
|視覚化
|数値だけで判断しない。グラフ、ヒストグラム、パレート図、散布図など
|-
|層別
|様々な角度から見る。男女別、年代別、月別、曜日別など
|-
|相関
|2種類のデータの関係性を見つける。年齢と年収、経済成長率と失業率など
|-
|}
===Python===
====[http://typea.info/blg/glob/2018/05/python-5.html 基本統計量、ヒストグラム]====
====[http://typea.info/blg/glob/2018/05/python-6.html 基本統計量、分散と標準偏差]====
====[http://typea.info/blg/glob/2018/05/python-7.html 正規分布、確率密度関数]====
====[http://typea.info/blg/glob/2018/06/python-1-1.html 散布図と相関分析(1)]====
====[http://typea.info/blg/glob/2018/06/python-2-1.html 散布図と相関分析(2) 単回帰分析]====
====[http://typea.info/blg/glob/2018/06/python-8.html 重回帰分析]====
==Tips==
*ギリシャ文字
*ヒストグラム範囲の決め方
===クーポン収集問題===
*6面サイコロの全ての目が出るまでにサイコロを平均で何回振る必要があるか
>>> p = 6
>>> sum([ 1.0 / (x/float(p)) for x in range(1,p+1)])
14.7