2018年11月11日日曜日

棒グラフの間に線を引く

アンケートを実施して、以下のような数値が集まったとします。
 
賛成
反対
どちらとも言えない
1
40
5
55
2
70
1
29
3
4
3
93
4
24
25
51

この数字の範囲を選択して
①挿入
↪②おすすめグラフ
↪③おすすめのグラフ
↪④積み上げ縦棒を選択すると

下の図のように積み上げ棒グラフが作成されます
それぞれの棒グラフの賛成、反対、どちらとも言えないの間に線を引きたいのですが、やり方が分からなくなってしまっていました。
そこで、色々調べてみたところ、以下のような方法で作成する事が確認できました

①デザイン
↪②グラフ要素を追加
↪③線
↪④区分線

下の図のように縦棒の間に線を補完する事ができましたね

データサンプル

テストデータ・ジェネレーター

データ分析の練習をやってみようにも…データがない!
多分皆様が最初にぶちあたるチャレンジだったりすると思います。

以下を用いてダミーデータを作成してみるのが一番お手軽かもしれません。
もちろん会社や、所属組織のデータを実際に使ってみるというのも手ですけどね。

疑似個人情報データ生成サービス
テストデータ・ジェネレータ
DB用テストデータ作成サービス(英語)

単純集計・クロス集計・多変量解析

データは単なるデータとして眺めると何これ?という話になってしまいがちです。
そこで、人間が解釈・理解しやすいように集計を実施した上でデータを理解し、多変量解析を通じてさらなる理解を深めていきます。

単純集計


クロス集計


多変量解析

統計学とは

統計学には2つの種類がある。

↳記述統計学

データを整理し、そのデータの特徴をできるだけ簡潔で明瞭にあらわす
数値や表、グラフなどを用いて、データの特徴や傾向をとらえる
例)国勢調査、クラスの試験の成績

↳推測統計学

一部(標本)のデータから全体(母集団)の状況を推測する

推測統計学には2つの手法がある

推定

例)全体の平均値がどこにあるか

検定

例)全体の平均値が想定した値と違うか、2つの群で平均値に差があるか

詳細にはAlbertさんの統計学とはや、馬場さんの記述統計の基礎、AVILENさんの記述統計学と推計統計学の違いを一読いただくと理解が深まると思います。



ビッグデータと統計学

ビッグデータとは

『一般的なデータ管理・処理ソフトウエアで扱うことが困難なほど巨大で複雑なデータの集合を表す用語』であり、用語自体はデータマイニングで一般的に使われてきました。

2011年代に入ってある種のトレンドを示すキーワードとして、新聞・雑誌などでも広く取り上げられるようになってきた
2011年頃からビッグデータとしてバズワード化しました。
Google trendでBig data、artificial intelligenceを世界で調べた結果と、ビッグデータ、人工知能で調べたグラフを添付してあります。



統計学はビッグデータ、人工知能の活用においても密接にかかわっています。

統計学とは

特定の集団について、データを集めて、そのデータの内容についての傾向や特徴を表し、その集団の傾向・特徴を見出すために解析をする学問のことを指します。

蓄積された数字などが羅列されたデータを眺めるだけで、そのデータの傾向や特徴を探ることは簡単なことではありません。そこで、データを集め、統計学の力を借りてデータの特徴を理解したり、訴求したりするため、グラフを描いたり、平均値(average)をはじめとするなんらかの値で表します。

予測(Prediction)とは

『**という条件がいくらになるとき、将来の売上高は○○円と予測できる』というように意味を持つ式(Formula)で示す必要があります。
データがあらわす傾向や特徴について、式などによって説明するもののことを統計学ではモデル(Model)と呼んでいます。また、統計学にもとづくモデルということで、統計モデル(Statistical Model)と呼ぶこともあります。

ビジネスへの適応

ビジネスに統計学を応用すると、同じデータ・分析手法を利用すれば、誰がやってもデータに潜む傾向や、特徴について、おおよそ同じ見解を見出すことができます。
商習慣、社会の業界の動向・常識や、経験、勘なども加味しながら、それぞれ補完しあって意思決定に役立てるという考え方が求められます。
Related Posts Plugin for WordPress, Blogger...