超入門!すべての医療従事者のためのRStudioではじめる医療統計
-サンプルデータでらくらくマスター-
著 | 笹渕裕介 |
---|---|
自治医科大学データサイエンスセンター講師 | |
大野幸子 | |
東京大学大学院医学系研究科生物統計情報学講座 | |
橋本洋平 | |
東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学 | |
石丸美穂 | |
東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学 |
- 【 冊子在庫 】
電子書籍書店で購入
Rの使い方が絶対わかる操作マニュアル誕生! 特設サイト公開中
内容紹介
■このページは旧版の情報となります■
改訂版の情報は下記のとおりです。
超入門! すべての医療従事者のためのRStudioではじめる医療統計(第2版) – 株式会社 金芳堂
本書は決して統計学の入門書ではない。統計ソフトRの基本的な操作を習得するためのマニュアルだ。だからp値の解釈や帰無仮説って何?χ2の意味は?みたいなものを期待してはいけない。「R難しいんですけどどうしたらいいですか。エクセルでいいですか。」と聞いたら、先輩や先生に「駄目、絶対」と言われたり、無料の■■や■■にお目当ての解析パッケージが含まれていなくて、Rにパッケージをインストールしないと仕事ができないのに、Rアレルギーを発症して操作法が頭に入らない人向けの本だ。
本サイトから入院患者についてのデータセットをダウンロードし、具体的にコマンドを入力し、出力を確認することを通して、基本的な統計解析ができるようになるだろう。データがどういう構造をしているのかという確認や、分析の前処理の仕方など操作の上でのマニュアルはきちんと書いてあるから、統計学の入門書とあわせて読めばストレスなく分析に入ることができる。
Rの何が難しいのだろうか?
一つはデータセットを読み込み、変数を作ったときのわかりにくさだ。ちゃんとデータを読み込んでいるのか、分析しやすくするために新しく作った変数はうまく行っているのかといったことが素のRではよくわからない。それは特定の検定のみを使いやすくしたフロントエンドソフト(名は秘す)でも同じこと。
そこでRStudioである。
読み込んだCSVがどういった構造なのかエクセルを立ち上げるまでもなくわかり、新しく作った変数の列の確認も容易だ。 パッケージや変数のヘルプを読んだり、出力した画像を保存するのにもRStudioはわかりやすい。もちろんRStudioはR言語でのプログラミング支援や、パッケージの追加に関しても素のRと完全に同等なので今後リアルワールドデータを分析したい、差の差分析や、感度分析をしたいなどといったアドバンスな統計解析に進みたい人ならこの本で統計解析をはじめるのがベストだ(あ、この本ではそういった難しい分析までは含んでいない)
素のRはデータハンドリングもわかりにくい。そこで多くのパッケージが作られてきた。今もっともデータハンドリングを改善するとされているのがtidyverseパッケージだ。そのtidyverseパッケージの使い方を初心者向けに解説している。もちろんすでにRは使っているが、tidyverseの導入に躊躇している中級者もぜひモダンなデータ操作法の快適さを知ってほしい。
RStudioとtidyverseをインストールし、データの取り扱いがわかれば、二項検定、多重検定、相関係数、生存曲線、回帰分析といった、医療統計学で頻出する解析手法用の関数使い方が書いてあるので多くの場合困ることはないだろう。
サポートサイト公開中
本書のサポートサイトを公開中。 R本体、RStudio、パッケージのバージョンアップによる不具合などのサポートを行います。本書の指示通りに行ってもうまくいかないときはご確認ください。
⇒特設サイト:超入門! すべての医療従事者のためのRStudioではじめる医療統計 サンプルデータでらくらくマスター
序文
本書の目的は臨床家が学会発表や論文執筆を行うにあたり、無料で使えるソフトウェアであるRを使って統計解析を行うことができるようになることです。
我々臨床家は日々の臨床の疑問を解決する目的などで臨床研究を行う機会があります。臨床研究に統計解析は必須ですが、一般的な市販の統計ソフトウェアは非常に高額です。また、最新の統計手法はこれらのソフトウェアには含まれていない場合が多いです。そのような問題点に直面した際に、わたしたちはRと出会いました。Rは無料であることに加えて、世界の統計家が最先端の統計手法をパッケージ化して配布しています。
わたしたちは縁あって東京大学の公衆衛生大学院へ進学し、臨床疫学・経済学教室でともに学びました。ある日、最新の統計手法を用いるためにRを使わなければならないことがありました。しかし医学研究を行う人に向けたRの入門書がほとんどなく、わたしたちは非常に苦労しながら、お互いにわからないことを相談しつつなんとか解析を行ってきました。
このような苦労をすることなく臨床家がRを使えるようになる手助けをしたいという思いがこの本を世に出す動機でした。本書はサンプルデータを使って練習することで、臨床研究を行う上で必要な統計手法を網羅的に学ぶことができるようになっています。学会発表や論文執筆の際に道標として使えるような内容になったと自負しています。
本書は2部構成となっています。Part1はRの基礎知識から臨床研究で一般的に使用される統計手法について解説します。そしてPart2はRの少し発展的な知識について解説します。本書は基本的に各統計手法をどのようにRで行うのかをパッケージの解説、サンプルデータを使ったスクリプトの例、スクリプトを実行した際の出力という順に並べて解説してあります。まず一通りの使い方を学び、ご自身のデータを使って統計解析を行う際には、必要なパッケージの解説ページのみを再度参照するのが効率のよい使用方法となっています。
本書がRを学ぼうとするすべての人にとって敷居を下げるものとなればわたしたちにとってこれほど嬉しいことはありません。
最後に本書が出来上がるまでには金芳堂のスタッフの方々を始め多くの方のお世話になりました。特に金芳堂の浅井健一郎様には何度も修正をお願いするなどご迷惑をおかけしましたが、文句の一つも言わずに対応いただきました。お礼申し上げます。
2019年1月
目次
第1章 RおよびRStudioのインストール
1 Rとは
2 RとRStudioのダウンロードとインストール
第2章 RStudio操作の基本
1 RStudioを起動してみよう
2 各ペインの機能
3 スクリプトを書いてみよう
4 RStudioを終了する
第3章 パッケージ利用の準備
1 パッケージとは
2 インストール方法
3 help
第4章 プロジェクトの作成とデータ読み込み
1 プロジェクト
2 データの読み込み
3 データの表示
第5章 データフレームの取り扱い
1 readr
2 dplyr
3 連続変数のカテゴリー化
4 日付データの取り扱い
第6章 データの概要の確認
1 データの俯瞰と要約
2 tableoneパッケージ
第7章 ggplot2
1 散布図
2 折れ線グラフ
3 ヒストグラム
4 箱ひげ図
5 グラフの保存
第8章 2群間の比較
1 統計手法の選択
2 連続変数の比較
3 カテゴリー変数の比較
第9章 3群以上の比較
1 多重比較法
2 統計手法の選択
3 連続変数の比較
4 カテゴリー変数の比較
第10章 重回帰・ロジスティック回帰
1 重回帰
2 ロジスティック回帰
第11章 生存時間分析
1 生存時間分析
2 データの整形
3 Survivalオブジェクトの作成
4 カプランマイヤー法とログランク検定
5 コックス回帰
第12章 データ作成
1 データの作り方のコツ
2 文字コード
3 変数名
4 変数の中身
5 最終手段
第13章 Rで使うデータ型とデータ構造
1 Rの代表的なデータ型
2 Rの代表的なデータ構造
第14章 相関係数
1 相関係数
2 複数の相関係数を同時に算出する
第15章 ROC曲線
1 ROC曲線とは
2 Rのスクリプト
3 ROC曲線の比較
Column コードが実行できません
執筆者一覧
■著者
笹渕裕介 自治医科大学データサイエンスセンター講師
大野幸子 東京大学大学院医学系研究科生物統計情報学講座
橋本洋平 東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学
石丸美穂 東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学