リハビリテーション医療のためのデータサイエンス 本当に使える「データ解析学」実践のすすめ
データサイエンスの立場からの「データのリテラシー能力」を身につける!
内容紹介
医療専門職(特にリハビリに携わる専門職)としてデータサイエンスの基本能力を備える必要性が高まっていますが、理工系や教養系のデータサイエンスの教科書は多数あるものの、医療系はあまり多くありません。本書は、そのリハビリテーション医療で必要なデータサイエンスの統計解析の実践書(入門書)となっています。また現在、文部科学省で教育強化分野として「データサイエンス」を取り上げており、教養科目として同分野の講義が展開していく予定があります。これまで統計学などを学んできている個人の自学習用としても、将来的には医療系の大学で用いる教科書としても活用できる内容として取りまとめました。
■サンプルデータ■
本文中に出てくる「表0-0(Excelファイル)」などExcelマークが付いた表は、データの上から5、6行だけの掲載となっています。元のExcelのデータは下記よりダウンロードいただけます。
https://www.kinpodo-pub.co.jp/1933-1_sample_data/
序文
最近、データサイエンスという用語を耳にする機会が増えたと思います。様々な計測機器が身近に存在し、パーソナルコンピューターも発達、普及して、多種多様な膨大データが用意に入手できるようになっています。これを利用しない手はないというのが、データサイエンスを日常化させた理由です。
様々なデータが入手できるのであれば、意思決定を行う資材として十分な威力を発揮するでしょう。しかし、その資材をどうやって解析したらよいかが問題です。
「データサイエンスは、私には縁がない」、「難しいから手が付けられない」と思うかもしれませんが、案ずるより産むが易しで、とにかく実践すれば身につきます。まず、本書の理論的な説明は無視して、改変Rコマンダーをインストールし、書いてある通りに解析を真似て出力してみる、ところから始めてください。意味については、後で考えても大丈夫です。私が最初、多変量解析の勉強を始めた時は、意味もわからないまま、とにかく本に書いてあることを、そのまま真似て解析することだけを繰り返しました。それが習得のための早道だと思います。
本書では、敢えて統計学の知識が十分ではなく、ちょっとだけ統計解析を実践したぐらいの執筆者に依頼しています(大変無礼ですが)。そのほうが、読者は馴染みやすいのではないかという理由です。多少表現が理解し難いところもあるかもしれませんが、ご容赦いただければ幸いです。しかし、より実践的な点が味になって惹きつけられるかもしれません……。
編集に関しては、著者陣にも多大なる協力をいただきました。改変RコマンダーのMac版の作成については、当研究生の遠藤龍之介君、池田裕一君、渡會爽君に協力いただきました。株式会社金芳堂編集ご担当の藤森祐介氏らには、〆切期限を辛抱強くお待ちいただけましたことに深謝申し上げます。
本章が皆さまのデータサイエンスアレルギーの克服に役立つことを願っています。
2022年12月3日 外の雪を眺めながら 研究室にて
対馬栄輝
目次
序文
編者・執筆者一覧
第1章 リハビリテーション医療におけるデータサイエンスの意義
Ⅰ データサイエンスとは?
Ⅱ データ解析学とは?
Ⅲ データリテラシーとは?
Ⅳ なぜリハビリテーション医療にデータサイエンスが必要?
第2章 データをとるとは?
Ⅰ どうやってデータをとるのか?
Ⅱ どうやって研究テーマを決めるのか?
Ⅲ 研究対象はどうやって決める?
Ⅳ 測定したデータは,どのような記録方法があるの?
Ⅴ データの測定手順の工夫ってあるの?
Ⅵ 「バイアス」という用語の意味は?
Ⅶ 研究デザインって何?
第3章 データの整理・基本的な改変Rコマンダーの操作
Ⅰ データの種類ってどんなものがある?
Ⅱ Excelへデータを入力する方法は?
Ⅲ 改変Rコマンダーの準備
Ⅳ 記述統計値って何がわかるの?
Ⅴ 平均と中央値,標準偏差の意味は何?
Ⅵ 正規分布って重要? どうやって判断するの?
第4章 グラフの種類・意味・観察
Ⅰ グラフを観察する
Ⅱ ヒストグラム
Ⅲ エラーバーグラフ
Ⅳ 箱ひげ図
Ⅴ 幹葉表示(ステムアンドリーフ)
Ⅵ ドットプロット
Ⅶ 散布図
Ⅷ モザイクグラフ
Ⅸ グラフを組み合わせてデータを見る方法
Ⅹ ピットフォール
第5章 データの違いを調べる―2群の差,対応のある2変数の差―
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 差の検定
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第6章 データの違いを調べる―3 群以上の差,共変量を考慮した差―
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 3群以上の差の検定
Ⅳ 共分散分析
Ⅴ ピットフォール
Ⅵ 考察
Ⅶ 解析方法のまとめ
第7章 データの違いを調べる―対応のある3変数以上の差―
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 反復測定分散分析の解析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第8章 データの関連度合いを調べる
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 相関の解析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第9章 データの関係度合いを調べる
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ カイ二乗検定の解析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第10章 現象の原因を見つける
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 重回帰分析の解析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第11章 群間の差を見つける
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 多重ロジスティック回帰分析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第12章 データを縮約する
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 主成分分析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第13章 感度と特異度を調べる:ROC曲線
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 判断指標の解析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第14章 判断指標を作ってみる:決定木分析
Ⅰ 解析の目的
Ⅱ 記述統計値・グラフの観察
Ⅲ 決定木分析
Ⅳ ピットフォール
Ⅴ 考察
Ⅵ 解析方法のまとめ
第15章 機械学習の紹介
Ⅰ 機械学習とは?
Ⅱ 学習方法と対応する統計手法
Ⅲ 過学習とは?
Ⅳ 機械学習の実際
索引
編者プロフィール