医療 AI の大半が進んでいる方向
2026 年に臨床 AI を売り込むベンダーに聞けば、デモの流れはほぼ同じである。医師がマイクに話す。AI が文字起こしをする。AI が会話を SOAP(Subjective/Objective/Assessment/Plan、主観/客観/評価/計画)に構造化する。AI がオーダー、請求コード、退院サマリを下書きする。AI が電子カルテに書き込む。医師は昼食に出かける。
価値訴求は効率である。前提は、モデルが「十分に正確」になれば医師はループから外れてよい、ということだ。
iRehab Doctor AI は技術的には、この流れのすべての工程を実現できる。我々はそうは配線しないことを選んだ——技術が未熟だからではなく、その流れが届けるものが、医師が本当に必要としているものではないからである。
本当の臨床ニーズ:様式の統合ではなく、問診の圧縮
医師が何かを記録できるようになる前に、目の前の患者をまず解読しなければならない。患者が構造化された訴えを持って入ってくることは稀である。彼らが持ち込むのは流れそのものだ——ここが痛い、あそこが痺れる、前回の薬が効いたか分からない、家族に何か言われた、もう片方の膝が気になる。
どの専門科にも、本当に重要な情報を圧縮した独自のスキーマがある。整形外科は通常、四つの欄に収束する:どの部位か、どの程度の重症度か、外傷か変性か、どのくらい続いているか。総合診療は主訴、発症、重症度、レッドフラッグに集約する。腫瘍内科は腫瘍型、ステージ、治療歴、現在の経過で走る。欄は違っても、パターンは普遍である。これらの欄が埋まると、診断仮説は医師の頭の中で自動的に組み上がり、次の一手——画像、注射、紹介、安心させる——がほとんど自動的に落ちてくる。
15 分の診療のうち最初の 5 分は、臨床推論ではないことが多い。それは翻訳である——患者の口語の奔流を、専門科が実際に使う四つか五つの欄へ圧縮する作業である。
この翻訳のステップこそ、AI が引き受けるべきものである。退院サマリを書くことではない。請求コードを生成することでもない。過去 2 週間の患者報告データ——VAS(Visual Analog Scale、視覚的アナログ疼痛スケール 0-10)の推移、創部写真、運動記録、PROM(Patient-Reported Outcome Measure、患者報告アウトカム指標)スコア——を、患者が席につくまでの 2 分間に、専門科にとって意味のあるサマリへ圧縮することである。
iRehab で医師の画面に現れるのは、こう見える(POD = Post-Operative Day、術後日数):
POD 14、右膝。VAS 6 → 3。3 日前に家族が撮った創部写真——軽度発赤。昨日処方運動の 70% を完了。
四つの欄。5 秒で読み切る。診断が形になる。残り 10 分は患者のものだ。
iRehab が実際に作ったもの:翻訳機、そして確認者
iRehab Doctor AI は、明確な順序で積み上がった二層構造である。
翻訳機層。受診前に、システムは患者の長期的な報告データ——症状日誌、VAS 推移、創部写真、運動完了率、PROM スコア——を、専門科にとって意味のあるサマリへ圧縮する。様式を統合するのではなく、コンテクストを統合する。医師が Doctor PWA(Progressive Web App、プログレッシブウェブアプリ)を開いたとき、そこにあるのは 37 項目のテンプレートではなく、四つの欄で描かれた臨床像と、その上に組み上がった AI 提案の SOAP 下書きである。
確認者層。医師は下書きを読み、必要な箇所を編集し、確認する。その確認だけが、下書きをカルテに変える。
翻訳機層はユーザー価値が生きる場所である——5 秒の読解が、口語の奔流を解読する 5 分間に取って代わる。確認者層は説明責任が生きる場所である。どちらの層も構造的支柱である。どちらかを外せば、製品は臨床的に成立しなくなる。
業界の一般的な反射神経は、この二層をトレードオフとして提示する:自動化を増やす代わりに安全性を犠牲にする、という構図である。我々はそう見ない。翻訳機は出発点を引き上げることでその場所を得ている。確認者は終着点を人間の手に留めることでその場所を得ている。どちらの層も他方の摩擦ではなく、別々の仕事をしている。
Draft-Only Enforcement——翻訳機のガードレール
翻訳機がこれほど有用なら、次に出てくる合理的な問いはこうだ——確認のステップも AI が省略できるか? 我々の答えは固く否であり、これは製品レベルで強制される規則として実装されている。我々はそれを Draft-Only Enforcement(下書き限定原則)と呼ぶ:
AI が生成するいかなる医療文書も下書きとして記録される。下書きは、有資格の医師が手動で確認を行うまで、患者の正式な記録に入ることは決してない。
具体的には:
- AI は評価、処方、手術記録、請求を生成できる——だが送信はできない。
- AI は欄を埋め、コンテクストを提示し、最良の出発点を提供できる——だが自ら電子カルテに書き込むことは決してない。
- 文書は一つの操作で保存できない。Draft → Confirm は二つの別の操作であり、合体させることはできない。
技術的にはこれは些細な制約である。難しいのは工学ではない。四半期ごとにモデルがより正確になり、あらゆる製品的直感が「二つ目のステップを削れ」と主張する中で、その二つ目のステップをそこに留めておく規律である。
なぜなら、Draft → Confirm が一つの操作に崩れた瞬間、臨床責任の鎖は弱まるのではなく、断ち切られるからである。そして臨床システムのレジリエンスは、その鎖の健全性にすべて宿っている。
この規則の背後にはもう一層の原則がある。もし AI がカルテ作成、処方、手術のすべてにおいて医師を完全に代替できるとしたら、それは技術の勝利ではない。それは、医師という免許を持ち説明責任を負う職業そのものが再定義されているというシグナルである。技術がそこに到達しているとは、我々は考えない。到達していたとしても、倫理が生き延びるとも思えない。
「統合」の三つの誤読
医師が「書類の統合」を求めるとき、たいてい三つの意味のうちのどれかである。そのどれもが正しい答えではないと見ることで、「翻訳機+確認者」という形がなぜ答えなのかが浮かび上がる。
統合 = 自動化。「全部 AI に書かせて、俺は触らない。」完成した文書には医師の名前が載っているが、医師はそれを読んでいない。責任の鎖は名目上は無傷で、実際は切れている。
統合 = 単一フォーム。「全部の項目を一画面に置いて、タブを切り替えなくて済むようにしてくれ。」Cerner や Epic(米国の二大電子カルテ)が 30 年やってきた。項目数は増えた。打鍵時間は減らなかった。本当の問題——一診療あたりの認知負荷——は UI レイアウトの問題ではない。
統合 = 「AI が書き終わった=終わり」。もっとも深い誤読である。医療文書は成果物ではない。それは臨床判断の証拠記録である。「内側半月板修復後、MRI フォローを検討」という一文に価値があるのは、名前のある医師が自分の免許をその裏に置いたからである。AI が書き、医師が読まずに署名したなら、その記録は証拠の重みを持たないテキストにすぎない。
医師が本当に必要としているのは、合体したフォームではない。5 秒で要点に届くことである。翻訳機、そして確認者。
オーバー生成という失敗モード
臨床 AI のデモを十分な数見ていると、ひとつのパターンが浮かび上がる。誰もが口にする不安は「モデルがまだ十分に正確ではない」ことだ。実際に運用で現れる失敗モードは正反対である——オーバー生成 (over-generation)。患者の断片的な発話——三つの別々の主訴、家族が口をはさんだ一言、別の関節についての脱線——を、モデルは流暢で、構造が整い、文法的に綺麗な散文にふくらませる。アウトプットは美しく読め、医師の時間を浪費する。
診療の速度は作文を褒美にしない。15 分の診察に、医師が磨き上げられた段落から「決定を動かす三つか四つの欄」を掘り出す余裕はない。主治医がカルテの余白に書きつけるあの圧縮された、略語だらけの短い断片は、文体の癖ではない——訓練された臨床の目がもっとも速く読み取れる形式である。
だから iRehab の受診前ドラフトは二つのフォーマットで出力し、電報体 (telegraphic shorthand) をデフォルトにしている。通順版は文書エクスポート用に保持される。医師が診察室で実際に使う画面に最初に表示されるのは電報体である——四つの欄、一行、enum コードはそのまま保存され、医師はそれらを文ではなく臨床シグナルとして読み取る。
オーバー生成は AI 産業の自然な反射である——ベッドサイドにいない製品チームにとって、より長い出力は「価値がより大きい」と読まれる。臨床では、その反射は誤っている。問診を圧縮するとは、入ってくるものを縮めることだけではない。出ていくところでまた展開しようとする衝動に抗うことである。
原則を上流へ押し上げる
Draft-Only Enforcement は医師を守るための原則として始まった。それが、患者をも守る原則に変わりつつある——AI が医師の同意なしにカルテを送信できないというルールはそのまま、AI が患者本人の同意なしに患者自身の問診サマリを送信できないというルールでもある。
責任の鎖は医師だけを守るのではない。システムのすべての関節を守る。
結論
医療 AI の主流は、医師の仕事を一つのステップに圧縮する——AI が仕上げ、人間が署名する。iRehab は同じ仕事を、別々の役割を担う二層へと切り分ける。翻訳機は、受診前の数分間に、数週間分の患者データから専門科にとって意味のある信号を抽出することでその場所を得る。確認者は、最終的な臨床判断——そしてその背後の免許——を人間の手に残すことでその場所を得る。
AI が翻訳する。人間が確認する。二つ目のステップは摩擦ではない。一つ目のステップが安全である理由そのものである。
本稿は術後フォローアップのケース——数週間の longitudinal データを持つ患者を圧縮する——に焦点を当てた。初診のケース——履歴なし、一言の口頭主訴だけ、臨床訓練が必要な質問を投げられない患者——については、姉妹編 診前ブリーフ:患者が「腱か神経か」を答えられないとき を参照されたい。
