スポンサーリンク

「Rではじめるデータサイエンス」を写経(1)ggplot2

以下の本を衝動買い、、、

ggplot2を作った人が著者らしい!

ちなみに、英語の本文は、以下のサイトで読むことができるらしい。

http://r4ds.had.co.nz/
image

まだ第1章を流し読みしただけですが、論文の図をかくのには、有用そうな本でした。

ちなみに、練習問題の解答例が、以下のサイトに掲載されています。

Exercise Solutions and Notes for “R for Data Science”
Jeffrey B. Arnold
https://jrnold.github.io/e4qf/

(環境)
Windows 8.1 Pro
R Studio 1.1.383

(1)tidyvereseパッケージのインストール

File > New File > R Notebook で、新規R Notebookを作成し、171215_ggplot2_007 という名前で保存。

image

画面右下の、「Packages」をクリック

image

「Install」をクリック

image

”Installl Packages”ウィンドウが現れるので、”tidyverse”と入力して、”Install”をクリック

image

“Yes”をクリック

image

1分くらいで、”tidyverse”その他のインストールが終わる。

image

tidyverseパッケージを用いる場合は、

library(tidyverse)

と記載する必要がある。

(2)mpgデータフレーム

ggplot2のmpgデータフレーム

image

image

mpg

image

displ 車のエンジンのサイズ、リットル単位
hwy 高速道路走行時の燃費、xマイル/1ガロン(mpg)

ggplotを作る

Hide

ggplot(data = mpg) +
  geom_point(mapping = aes(x = displ, y = hwy))

このプロットにより、エンジンサイズ(displ)と、燃費(hwy)は負の相関を示す。

ggplot()  座標平面を作成
geom_point() 散布図を作成

グラフ作成テンプレート

ggplot(data = <DATA>) +
  <GEOM_FUNCTION>(mapping = aed(<MAPPINGS>))

練習問題

Hide

library(tidyverse)
ggplot(data = mpg)

Hide

library(tidyverse)
mtcars

image

nrow(mtcars)
[1] 32

Hide

ncol(mtcars)
[1] 11

Hide

?mpg

drv
f = front-wheel drive, r = rear wheel drive, 4 = 4wd
つまり、drvは駆動を表す。

image

hwyとcyl(number of cylinders)の散布図

Hide

library(tidyverse)
ggplot(data = mpg) +
  geom_point(mapping = aes(x = cyl, y = hwy))

class vs drvの散布図

Hide

library(tidyverse)
ggplot(data = mpg) +
  geom_point(mapping = aes(x = class, y = drv))

なぜプロットが役に立たないのかは、、、drvの選択肢?が数値ではなく、順序もないから?

いや、classの選択肢?も数値でもなく、順序もない。

答えは分からず。

エステティックマッピング

Hide

library(tidyverse)
ggplot(data = mpg) +
  geom_point(mapping = aes(x = displ, y = hwy, color = class))

library(tidyverse)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, size = class))

image

library(tidyverse)
ggplot(data = mpg) +
  geom_point(mapping = aes(x = displ, y = hwy, alpha = class))

image

library(tidyverse)
ggplot(data = mpg) +
  geom_point(mapping = aes(x = displ, y = hwy), color = "blue")

 

とりあえずここまで。

 

 

スポンサーリンク

R

Posted by twosquirrel