測れないものを測るには? 医療従事者のための評価スケール・予測モデルの考え方・活かし方
”痛み”などの定量化・数値化できない、測りたくても測れないものを、どのように扱って診断や予後を予測していくのかを考える。
内容紹介
一見別物に見える「評価スケール」と「予測モデル」だが、どちらも「世界中どこでも通用する厳密に定義された基準がないものを測ること」を共通の目的としている。また両者には、「信頼性」や「妥当性」が厳しく問われる点でも共通している。
現在の医療分野では「評価スケール」や「予測モデル」を数量化の手段として使用し、機器では測れないものを測り、診断や予後を予測している。
本書では、「予測モデル」を従来からの「評価スケール」の進化版と捉え、開発方法、検証方法、日常臨床における利用、臨床研究における統計処理方法などについて解説。1章では主に用語の解説、2~4章では「評価スケール」、5~7章では「予測モデル」、8章では「臨床家が求める予測モデルとはどのようなものか、今後どのような方向に向かうのか」を問題提起した。
また<付録>として、Rの使い方、分散分析と級内相関係数の関係、診断法の有用性の指標、一般化線形モデル、Cox比例ハザード回帰モデル、欠測値の多重補完法についても述べた。
専門分野での「評価スケール」。「予測モデル」の利用の有無にかかわらず、ぜひ全体を通して読んでいただきたい。
▶本書で用いたexcel数値例のデータファイルをダウンロードできます。
4章 主観的・経験的評価スケールの検証
1904-1_data_score1.csv:数値例4-2~4-5に使用
1904-1_data_score2.csv:数値例4-6に使用
7章 ロジスティック回帰モデル
1904-1_data_x.csv:数値例7-1~7-7に使用
8章 予測モデルはどこへ向かうのか
1904-1_data_x.csv:数値例8-1に使用
付録2 分散分析と級内相関係数の関係
1904-1_data_score1_t.csv:数値例 付2-1に使用
付録3 診断法の有用性の指標
1904-1_data_x.csv:数値例付3-1に使用
付録4 一般化線形モデル
1904-1_data_x.csv:数値例付4-1に使用
付録5 Cox比例ハザード回帰モデル
1904-1_data_s.csv:数値例付5-1に使用
付録6 欠測値の多重補完法
1904-1_data_x_missing.csv:数値例付6-1に使用
序文
本書は、前著「医薬研究者のための評価スケールの使い方と統計処理(2007年)」を基にしています。医療分野における評価スケールの使い方はこの15年間ほとんど変っていません。一方で、膨大な量の医療データや情報を利用して、診断や予後を予測する数学的モデルが盛んに開発されるようになりました。最近では医療分野にも人工知能(AI)を利用した意思決定支援ツールが組み込まれようとしています。
本書において、一見別物に見える「評価スケール」と「予測モデル」を同じテーブルに載せたのは、両者とも「真の値」、すなわち、長さや重さのように世界中どこでも通用する厳密に定義された基準がないものを測ることを目的としているからです。また、得られた測定値を、市販の測定機器によって得られたデータ並みに扱うことができるようにするために、いつ、誰が測っても同様の結果が得られるか(信頼性)、また、測りたいものを正しく測定しているか(妥当性)が厳しく問われるという点も共通です。
とは言え、「評価スケール」と「予測モデル」の開発方法は異なっており、用語や統計学的手法も別々に発展してきた歴史的な背景があります。両者の利用頻度も専門分野によって大きく異なっています。多くの読者にとって、「評価スケール」と「予測モデル」を併せて論じる必要性はないのではないかという迷いもありました。
しかし、コロナ禍での医療の逼迫に際して、医学知識のない一般人が、発熱や全身倦怠感、味覚障害などの心もとない症状を頼りに「感染している確率」を見積もることを強いられるという異常事態を目の当たりにして、「測定とは何か」という根源的な問いに思い至りました。
人間が未だ測定機器を持たなかった頃、長さや重さのような基本的な物理量でさえ、感覚として認知できていてもあるがままの状態で測ることはできませんでした。指や腕など自分の身体を使って、対象を均一な単位量に分割するという数量化の手続きを経て、生活に必要なさまざまなものの長さを「数えて」いました。現代の医療分野では、「評価スケール」や「予測モデル」を数量化の手段として使って、機器では測れないものを測り、診断や予後を予測しています。
本書では、「予測モデル」を従来からの「評価スケール」の進化形として捉え、1章では主に用語に関して、2章から4章までは評価スケール、5章から7章までは予測モデルについて解説し、8章では「臨床家が求める予測モデルとはどのようなものなのか、今後どの方向に向かうのか」という問題を提起しました。専門分野での「評価スケール」や「予測モデル」の利用の有無にかかわらず、ぜひ全体を通してお読みください。
本書の着想を得たのは、新型コロナウイルス感染症(COVID-19)のパンデミックが発生して間もない頃でした。ようやく脱稿した今、発生から2年が過ぎようとしていますが未だ収束には至っていません。そのほとんどの期間、テレワークで複雑な編集作業をして下さった金芳堂の一堂芳恵氏に深く感謝いたします。
2022年4月
奥田千恵子
目次
1.測定とは
2.主観的・経験的評価スケール
2.1 患者による評価
- A.痛み
- B.不安
- C.QOL
2.2 治療者・介護者による評価
- A.意識障害の重症度
- B.慢性疾患の重症度
- C.ADL
2.3 既存の評価スケールの利用方法
3.主観的・経験的評価スケールの開発
3.1 評価スケール開発の手順
3.2 データソース
3.3 質問項目および回答選択肢の作成
3.4 スケールの形成
3.5 スコアリング
4.主観的・経験的評価スケールの検証
4.1 信頼性
4.2 妥当性
5.機器測定データを組み込んだ評価
- A.肥満度
- B.運動耐容能
- C.運動負荷心電図
- D.急性疾患の全身重症度
6.予測モデルの開発と検証
6.1 データソース
6.2 欠測値の扱い
6.3 統計モデルの選択
6.4 モデルの性能
6.5 モデルの検証
7.ロジスティック回帰モデル
7.1 ロジスティック回帰モデルの基本
7.2 ロジスティック回帰モデルの構築
7.3 ロジスティック回帰モデルの性能
7.4 その他のモデルの当てはめ
8.予測モデルはどこへ向かうのか
8.1 機能学習モデル
8.2 電子健康記録への統合
8.3 ベッドサイドモデル化
8.4 TRIPOD声明
<付録>
1.Rの使い方
2.分散分析と級内相関係数の関係
3.診断法の有用性の指標
4.一般化線形モデル
5.Cox比例ハザード回帰モデル
6.欠測値の多重補完法