超入門! Rでできるビジュアル統計学 学会・論文発表に役立つデータ可視化マニュアル
第2版
著 | 藤井亮輔 |
---|---|
藤田医科大学医療科学部研究推進ユニット予防医科学分野講師 | |
鈴木康司 | |
藤田医科大学医療科学部研究推進ユニット予防医科学分野教授 |
- 【 冊子在庫 】
★2024年12月中旬 発売予定!★
Rの最低限の基本をマスターできる、待望の改訂版!
内容紹介
わかりやすいR本として好評な『超入門! Rでできるビジュアル統計学 学会・論文発表に役立つデータ可視化マニュアル』のフルカラー改訂版が登場。統計ソフトRのバージョンアップ、パッケージ(拡張機能)のバージョンアップを踏まえた内容の見直しを行い、新しいグラフ表現等も追加しました。
記述統計学とそれに基づいたチャートの意味、使い方、作り方をまとめ、理論を理解しつつ、実際的で具体的な作図方法、作図しながら検討する方法がわかるので、実際に論文や学会発表のときに使えるRを使った可視化の手順が分かります。
解説されることが少ない、基本的な図表の可視化表現の理論的な説明、可視化にあたって、美しいグラフを作るための統計ソフトRの具体的な操作方法など、Rをつかって研究や仕事をしている人はもちろん、臨床研究をする人、生命科学・社会科学研究者など、多くの方々に手に取っていただきたい一冊です。
好評姉妹本
序文
改訂にあたり
今回は貴重な機会に恵まれ、本書の内容について大幅な改訂作業に取り組むことができました。はじめに、2021年3月に出版した第1版も手にとり、そしてこの文章を読みながら第2版の内容も楽しみにして下さっている方には心から感謝しています。
可視化に関して、この3年間での最も大きな変化と言えば、大規模言語モデル(LLM)の登場でしょう。これにより、「なんとなく」言葉にすれば自分の思い通りのグラフを出力できるようになりました。プログラミング言語の学習に費やす時間はなんのためか、可視化を理解する必要性はあるのか、と思った人は多くいると思います。
我々は、このような動きは改めて「基本」の大切さを強調する出来事であると考えています。2024年2月、ChatGPTによって作成され科学雑誌に掲載された図(グラフではないですが)が不適切なものであるとして、論文自体が撤回(retraction)になる事案が発生しました。つまり、著者も査読者もその図の科学的正当性について評価できていなかったということです。改めて「基本」(正しい形)を理解していることの重要性を問う事件になりました。
本書は、プログラミング言語Rを基盤としたマニュアル書の側面が強調されることは仕方のないことではありますが、少なくとも最低限の「基本」を提供することを目的にしています。Rプログラムを目的に手にとっている方も、是非そのような部分もご覧頂けるとクオリティの高い可視化に繋がると思います。
さて、この改訂では1)図版のカラー化、2)Rコードや使用パッケージの刷新、3)モダンな可視化に対応する新規コラム、を目玉に、大幅に刷新しております。いずれの部分も企画を非常に練って、自信を持って作成したものばかりです。正直、第1版より可視化の「基本」+実践書としてもかなりパワーアップした第2版となったと自負しております。
それでは、第1版から継続している部分も追加した部分も皆さんにとって、学会活動や論文執筆の「基本」として貢献できることを祈っています!
2024年11月
藤井亮輔
鈴木康司
目次
改訂にあたり
はじめに
Part 1 Rの紹介と前準備
1.RとRStudioの基本
2.データの前処理
3.ggplot2の基本
4.データの種類について
本書で使用するsample.csvについて
本書で使用するパッケージのインストールについて
Part 2 質的な変数のグラフ
第1章 データタイプ1(質的な変数・一変量)
1.棒グラフ(Bar chart)
2.円グラフ(Pie chart)
第2章 データタイプ2〔質的な変数・二変量以上(サブグループ)〕
1.横並び棒グラフ(Grouped bar chart)
2.積み上げ棒グラフ(Stacked bar chart)
第3章 データタイプ3〔質的な変数・二変量以上(独立したリスト)〕
1.ベン図(Venn diagram)
2.サンキー図(Sankey diagram)
第4章 データタイプ4〔質的な変数・二変量以上(入れ子)〕
1.ツリーマップ(Treemap)
Part 3 量的な変数のグラフ
第5章 データタイプ5(量的な変数・一変量)
1.箱ひげ図(Box-whisker plot)
2.ヒストグラム(Histogram)
3.密度プロット(Density plot)
第6章 データタイプ6(量的な変数・二変量)
1.散布図(Scatter plot)
2.折れ線グラフ(Line graph/Line chart)
3.面グラフ(Area chart)
第7章 データタイプ7(量的な変数・多変量)
1.バブルプロット(Bubble plot)
2.ヒートマップ(Heatmap)
3.レーダーチャート(Radar chart/Spider web)
Part 4 地理空間データの可視化
第8章 データタイプ8(地理空間データ)
1.基本マップ(Background map)
2.コロプレスマップ(Choropleth map)
3.カルトグラム(Cartogram/Value-area map/Anamorphic map)
4.バブルマップ(Bubble map)
Column
グラフ描画の基本
カラーグラフの可視化
カラーを使わない可視化
日本語を使用したグラフを描く
各グラフの特徴を整理してみよう
Rでデータの不確実性を描く
広い範囲の読み手にデータを伝える可視化のコツ
地理空間データについて気をつけること
初めてRで地理データを活用したグラフを描きました
jpmeshパッケージによる地域メッシュの可視化
Training
1 練習データでグラフを描いてみよう!
2 練習データでグラフを描いてみよう!
3 練習データでグラフを描いてみよう!
参考文献
本書を進める上で参考になる図書
索引
あとがき
著者紹介