みんなのビッグデータ

2019年8月16日金曜日

Revolution Rはどこに行った…

Microsoft R OpenとMicrosoft R Serverに引き継がれたまでは追いかけられていたのですが、その後どうなったのかなと調べてみたら…

Machine Learning Serverというサービスになっていました。
https://www.microsoft.com/en-us/sql-server/machinelearningserver

Revolution R Enterprise
↳
Microsoft R Server(26/Jul/2016→19/Apr/2017) Microsoft R Server 8.0.5→Microsoft R Server 9.1.0

Machine Learning Server（ 03/Sep/2017→今）
Machine Learning Server 9.2.1
現在　Machine Learning Server 9.4.7

リリース時期やバージョンを見てもおおむね合ってると思います。

注意事項
残念な事にMachine learning serverのページの下のほうのDownloadをクリックすると…

古いバージョンのMachine Learning Server 9.2.1 Release date: 03/Sep/2017に飛ばされてしまいます。

ので、再度検索して最新バージョンとなるMachine Learning Server 9.4.7 を取得ください。

2018年11月11日日曜日

棒グラフの間に線を引く

アンケートを実施して、以下のような数値が集まったとします。

	賛成	反対	どちらとも言えない
1月	40	5	55
2月	70	1	29
3月	4	3	93
4月	24	25	51

この数字の範囲を選択して
①挿入
↪②おすすめグラフ
↪③おすすめのグラフ
↪④積み上げ縦棒を選択すると

下の図のように積み上げ棒グラフが作成されます

それぞれの棒グラフの賛成、反対、どちらとも言えないの間に線を引きたいのですが、やり方が分からなくなってしまっていました。
そこで、色々調べてみたところ、以下のような方法で作成する事が確認できました

①デザイン
↪②グラフ要素を追加
↪③線
↪④区分線

下の図のように縦棒の間に線を補完する事ができましたね

データサンプル

テストデータ・ジェネレーター

データ分析の練習をやってみようにも…データがない！
多分皆様が最初にぶちあたるチャレンジだったりすると思います。

以下を用いてダミーデータを作成してみるのが一番お手軽かもしれません。
もちろん会社や、所属組織のデータを実際に使ってみるというのも手ですけどね。

疑似個人情報データ生成サービス
テストデータ・ジェネレータ
DB用テストデータ作成サービス（英語）

単純集計・クロス集計・多変量解析

データは単なるデータとして眺めると何これ？という話になってしまいがちです。
そこで、人間が解釈・理解しやすいように集計を実施した上でデータを理解し、多変量解析を通じてさらなる理解を深めていきます。

単純集計

クロス集計

多変量解析

統計学とは

統計学には2つの種類がある。

↳記述統計学

データを整理し、そのデータの特徴をできるだけ簡潔で明瞭にあらわす
数値や表、グラフなどを用いて、データの特徴や傾向をとらえる
例）国勢調査、クラスの試験の成績

↳推測統計学

一部（標本）のデータから全体（母集団）の状況を推測する

推測統計学には2つの手法がある

推定

例）全体の平均値がどこにあるか

検定

例）全体の平均値が想定した値と違うか、2つの群で平均値に差があるか

詳細にはAlbertさんの統計学とはや、馬場さんの記述統計の基礎、AVILENさんの記述統計学と推計統計学の違いを一読いただくと理解が深まると思います。

ビッグデータと統計学

ビッグデータとは

『一般的なデータ管理・処理ソフトウエアで扱うことが困難なほど巨大で複雑なデータの集合を表す用語』であり、用語自体はデータマイニングで一般的に使われてきました。

2011年代に入ってある種のトレンドを示すキーワードとして、新聞・雑誌などでも広く取り上げられるようになってきた
2011年頃からビッグデータとしてバズワード化しました。
Google trendでBig data、artificial intelligenceを世界で調べた結果と、ビッグデータ、人工知能で調べたグラフを添付してあります。

統計学はビッグデータ、人工知能の活用においても密接にかかわっています。

統計学とは

特定の集団について、データを集めて、そのデータの内容についての傾向や特徴を表し、その集団の傾向・特徴を見出すために解析をする学問のことを指します。

蓄積された数字などが羅列されたデータを眺めるだけで、そのデータの傾向や特徴を探ることは簡単なことではありません。そこで、データを集め、統計学の力を借りてデータの特徴を理解したり、訴求したりするため、グラフを描いたり、平均値(average)をはじめとするなんらかの値で表します。

予測(Prediction)とは

『＊＊という条件がいくらになるとき、将来の売上高は○○円と予測できる』というように意味を持つ式(Formula)で示す必要があります。
データがあらわす傾向や特徴について、式などによって説明するもののことを統計学ではモデル(Model)と呼んでいます。また、統計学にもとづくモデルということで、統計モデル(Statistical Model)と呼ぶこともあります。

ビジネスへの適応

ビジネスに統計学を応用すると、同じデータ・分析手法を利用すれば、誰がやってもデータに潜む傾向や、特徴について、おおよそ同じ見解を見出すことができます。
商習慣、社会の業界の動向・常識や、経験、勘なども加味しながら、それぞれ補完しあって意思決定に役立てるという考え方が求められます。

2018年9月24日月曜日

KPI設定による業績アップと業績悪化

KPIの設定方法

非常に重要な事

★「より大きな経営目標との関連性があるか」

「その KPI は具体的か」
「測定が可能か」
「スタッフにとって達成可能なものか」
「期限が設定されているか」

KPIは設定した瞬間に社員が設定されたKPIに向かって最適化を開始します。
そのため、KPIの設定が間違うとというのか、より大きな経営目標にアラインしている必要があります。

しばしば部門KPIは達成しているのに会社の業績トータルは全く…
とかいう現象はKPIの設定が会社のゴールにアラインしていないか、部門KPIの達成が他の部門のKPIを侵害してしまうケースなので発生します

みんなのビッグデータ

navi

2019年8月16日金曜日

Revolution Rはどこに行った…

2018年11月11日日曜日

棒グラフの間に線を引く

データサンプル

テストデータ・ジェネレーター

単純集計・クロス集計・多変量解析

単純集計

クロス集計

多変量解析

統計学とは

統計学には2つの種類がある。

↳記述統計学

↳推測統計学

推定

検定

ビッグデータと統計学

ビッグデータとは

統計学とは

予測(Prediction)とは

ビジネスへの適応

2018年9月24日月曜日

KPI設定による業績アップと業績悪化

KPIの設定方法

非常に重要な事

★「より大きな経営目標との関連性があるか」

広告

ブログアーカイブ