読者です 読者をやめる 読者になる 読者になる

Pychef's Diary

I consider myself an engineer, aren't I?

『手を動かしながら学ぶ ビジネスに活かすデータマイニング』第9章に勝手に補足してみる

遂にid:TJOさんの『手を動かしながら学ぶ ビジネスに活かすデータマイニング』が発売されました。
子供の頃に、FFやドラクエが発売されるのを楽しみにしていたような気分で発売を待っていました!

手を動かしながら学ぶ ビジネスに活かすデータマイニング

手を動かしながら学ぶ ビジネスに活かすデータマイニング

厳密な数式うんぬんより、"イメージ"を大切にされているのが伝わってくる本ですね^^
今週末は出先で時間を見つけつつ、掲載コードを打っています。

さて、p.182 図9-7を描画しようとしたところ、コードが載っていないことに気づきました。図9-6では閾値を設けておらず、ごちゃごちゃしているため、support>=0.3で描画するエッジを限定しましょうという箇所です。

そこで簡単ではありますが、勝手にコードを補足したいと思います。ここでは図9-6がd.apなので、区別しやすいように図9-7はd2.apとして保存し、plotします。

d2.ap<-apriori(as.matrix(d),parameter=list(support=0.3))
plot(d2.ap,method="graph", control=list(type="items", layout=layout.fruchterman.reingold))

↓ こんなイメージになるかと。

f:id:pychef:20140824165506j:plain

p.182ではimportedのノードが一番上にきますが、ここではimportedが左にきています。これはRだけでなく、gephiやpajekでも共通しますが、ネットワークを描画するとき、必ずしも同じグラフが毎度できあがるわけではありません。

全体のバランスがあるべきグラフと同じであればOKです。

以上。