リアルワールドデータで臨床研究の質を高める実践法

リアルワールドデータで臨床研究の質を高める実践法

リアルワールドデータと臨床研究の活用法

RCTで得た結論が、実臨床の患者集団では再現しないケースが約40%に上るというデータがあります。


この記事の3つのポイント
📊
RWDとは何か

電子カルテや請求データなど日常診療で生まれるデータを臨床研究に活用する手法です。

🔬
RCTとの違いと補完関係

RCTが理想条件下の有効性を示すのに対し、RWDは実臨床での有効性(effectiveness)を明らかにします。

⚠️
バイアス対策が鍵

RWD研究の信頼性は交絡因子・選択バイアスへの対処法で大きく左右されます。


リアルワールドデータの定義と臨床研究における位置づけ

リアルワールドデータ(RWD)とは、日常診療の中で自然に蓄積されるデータの総称です。電子カルテ(EHR)、医療保険レセプトデータ、疾患レジストリ、ウェアラブルデバイスのデータなどが代表的な種類に挙げられます。これらは研究目的ではなく、診療や請求の記録として生まれるのが大きな特徴です。


従来の臨床研究では、厳格な組み入れ・除外基準のもとで患者を選定するランダム化比較試験(RCT)が「エビデンスの頂点」とされてきました。しかし現実には、RCTの対象患者は高齢者・合併症を持つ患者・多剤服用中の患者など、日常診療で多く出会う層が大幅に除外されています。これがRCT結果と実臨床とのギャップを生む主因です。


つまりRWDの役割はRCTを否定することではありません。


RCTが「この薬は有効か(efficacy)」を問うのに対し、RWDを用いたリアルワールドエビデンス(RWE)は「実際の患者にどれだけ効くか(effectiveness)」を問います。この2つは補完関係にあり、両方を組み合わせることでより信頼性の高い診療ガイドラインが作成できます。


日本では、医薬品医療機器法(薬機法)の改正を受け、2020年以降、RWDを用いた製造販売後調査や適応拡大申請での活用が規制当局(PMDA)から正式に認められています。国立がん研究センターや国立循環器病研究センターなどは、独自のレジストリデータを構築し、年間数十件規模のRWD研究を発表しています。


PMDA:リアルワールドデータの利活用に関するガイダンス(医薬品審査関連情報)


リアルワールドデータの主要な種類と臨床研究での使い分け

RWDにはいくつか種類があり、研究目的に応じて使い分けることが重要です。それぞれの特性を理解することが、研究設計の第一歩です。


  • 🏥 電子カルテ(EHR)データ:診断名、検査値、処方内容、バイタルサインなど詳細な臨床情報を含む。ただし施設間でコーディングの標準化が不十分な場合がある
  • 💴 レセプトデータ:日本では厚生労働省のNDB(ナショナルデータベース)が代表例。数千万件規模の患者情報を網羅するが、検査値などの詳細臨床情報は含まれない
  • 📋 疾患レジストリ:特定疾患の患者情報を研究目的で前向きに収集。臨床情報が豊富で長期追跡が可能
  • ウェアラブル・患者報告アウトカム(PRO):歩数、心拍数、睡眠など患者の日常生活データを収集。PROは患者自身が報告する症状・QOL情報


日本のNDBは2020年時点で累計約200億件のレセプト情報を保有しており、その規模は東京ドーム約1,600杯分のデータ量に相当するといわれます。これが利用できれば、希少疾患や長期アウトカムの研究が現実的になります。


NDBの利用は研究機関・大学・学術学会などが申請できますが、審査から利用開始まで通常6〜12か月程度を要します。研究計画段階で早めに申請スケジュールを組み込む必要があります。申請手順は厚生労働省のNDB公開情報ページで確認できます。


厚生労働省:NDB(レセプト情報・特定健診等情報データベース)の利用について


リアルワールドデータを用いた臨床研究のバイアス対策と統計手法

RWD研究の最大の課題は、バイアスと交絡因子への対処です。これが甘いと、結論の信頼性が根本から揺らぎます。


RCTでは無作為割り付けにより既知・未知の交絡因子が均等に分散されます。しかしRWD研究では介入(例:ある薬の投与)は医師の判断や患者の状態によって決まるため、そもそも比較群の背景特性が揃っていません。これを「適応による交絡(confounding by indication)」と呼びます。


つまり比較群の作り方が命です。


この問題に対処する代表的な統計手法が以下の通りです。


  • 📐 傾向スコアマッチング(PSM):介入を受ける確率(傾向スコア)が近い患者同士をマッチさせ、疑似的にRCTに近い状態を作る手法。最も広く使われている
  • 📐 逆確率重み付け(IPTW):傾向スコアの逆数を重みとして付与することで、集団全体を仮想的に均衡させる。マッチングよりサンプルサイズを活かしやすい
  • 📐 操作変数法(IV法):観察できない交絡因子の影響を除去するための手法。例えば地域差(医師の処方傾向の違いなど)を操作変数として使う
  • 📐 感度分析:分析のモデルや仮定を変えたときに結論がどれだけ変わるかを確認。結果の頑健性を担保するために必須


PMDAが2022年に公表したRWD活用ガイダンスでも、交絡調整の方法論を事前に研究プロトコルへ明記することを求めています。後付けの解析では、査読時に重大な指摘を受けるリスクが高まります。事前登録(UMIN、ClinicalTrials.gov等)を積極的に行うことが研究の信頼性向上につながります。


UMIN:臨床試験登録システム(観察研究・RWD研究の事前登録にも対応)


リアルワールドデータ活用で臨床研究が変わる:規制・倫理・個人情報保護の実務

RWD研究は有望ですが、倫理審査・個人情報保護の手続きを誤ると研究自体が中断に追い込まれます。手続きの全体像を把握しておくことが不可欠です。


2022年4月に施行された「改正個人情報保護法」と「改正人を対象とする生命科学・医学系研究に関する倫理指針(生命倫理指針)」により、RWDを用いた研究における情報管理の要件が大幅に厳格化されました。特に注目すべき変更点が2つあります。


  • 🔒 オプトアウト手続きの整備:既存診療データを研究に使用する場合、患者への個別同意が原則不要の場合でも、オプトアウトの機会提供と公開が必須になった
  • 🔒 第三者提供時の仮名加工・匿名加工:施設外にデータを提供・共有する場合、仮名加工情報または匿名加工情報への変換が必要。元データのまま外部送付は法令違反になる


倫理審査委員会(IRB)への申請では、データの取得方法・保管場所・アクセス権限・廃棄方法を明確に記載した「データ管理計画書(DMP)」の提出を求める施設が増えています。これが重要です。


また、2023年以降は厚生労働省の「医療情報基盤(医療DX)」政策の一環として、全国医療情報プラットフォームの整備が進んでいます。将来的には、施設横断的なRWD研究が現在より大幅に効率化される見通しです。倫理・法制度の動向は毎年変わるため、最新の指針を文部科学省・厚生労働省の合同ページで定期的に確認する習慣が求められます。


厚生労働省:人を対象とする生命科学・医学系研究に関する倫理指針(全文・Q&A)


医療従事者が見落としがちなリアルワールドデータ研究の独自視点:「データの欠損」は情報である

RWD研究において、多くの医療従事者が「欠損値は除外すればよい」と考えています。しかしこの判断が、研究全体の結論を歪める最大の落とし穴になり得ます。


欠損値には大きく3種類あります。「完全ランダム欠損(MCAR)」「ランダム欠損(MAR)」「非ランダム欠損(MNAR)」です。電子カルテデータで起こりやすいのはMARとMNARで、例えば「重症患者ほど検査値が記録されていない」「高齢患者ほど来院記録が途切れる」といったパターンが典型的です。


欠損が情報を持っているということです。


このような欠損を単純除外すると、残ったデータは「比較的健康で定期受診できた患者」に偏り、実臨床を代表しなくなります。解決策として、多重代入法(Multiple Imputation)が標準的に推奨されています。これはRStudioやSASで実装可能で、欠損パターンを統計的にモデル化して複数の完全データセットを生成し、それぞれで解析したうえで結果を統合します。


  • 📌 SAS:PROC MIとPROC MIANALYZEを組み合わせて実行
  • 📌 R:「mice」パッケージが広く使われており、コード例も豊富
  • 📌 欠損率が40%を超える変数は、代入精度が下がるため主要解析から除外するのが一般的


さらに見落とされがちなのが「構造的欠損」です。例えばレセプトデータでは、院外で起きた副作用や他院受診による処方変更が記録に残りません。これは欠損ではなく「記録されない設計」であり、研究の限界として考察に必ず明記する必要があります。


この点を論文に明記するかどうかが、査読通過率に直結します。Lancet DigitalHealthやJAMAなどの高インパクトジャーナルでは、欠損値の処理方法と感度分析の有無が採否判断の主要チェック項目になっています。欠損値の扱いは後回しにせず、研究設計の段階から計画に組み込むことが信頼性の高いRWD研究への近道です。


日本臨床疫学会誌:RWD・疫学研究の方法論に関する査読付き論文(J-STAGE経由)