대부분의 의료 AI가 향하는 방향
2026년에 임상 AI를 영업하는 어떤 벤더에게 물어도 데모의 흐름은 거의 같다. 의사가 마이크에 말한다. AI가 음성을 받아쓴다. AI가 대화를 SOAP(Subjective/Objective/Assessment/Plan, 주관적/객관적/평가/계획)로 구조화한다. AI가 지시, 청구 코드, 퇴원 요약을 초안으로 작성한다. AI가 EHR(Electronic Health Record, 전자의무기록)에 기록한다. 의사는 점심을 먹으러 간다.
가치 제안은 효율이다. 전제는 모델이 "충분히 정확해지면" 의사가 루프에서 빠져도 된다는 것이다.
iRehab Doctor AI는 기술적으로 그 흐름의 모든 단계를 구현할 수 있다. 우리는 그렇게 배선하지 않기로 했다 — 기술이 부족해서가 아니라, 그 흐름이 전달하는 것이 의사에게 진짜로 필요한 것이 아니기 때문이다.
진짜 임상적 필요: 양식 통합이 아니라 문진 압축
의사가 무엇인가를 기록하기 전에, 먼저 앞에 앉은 환자를 해석해야 한다. 환자가 구조화된 주호소를 들고 오는 경우는 드물다. 그들은 한 덩어리의 흐름을 가지고 들어온다 — 여기가 아프다, 저기가 저리다, 저번 약이 효과가 있었는지 모르겠다, 가족이 뭐라고 했다, 다른 쪽 무릎도 마음에 걸린다.
각 진료과에는 정말 중요한 정보를 압축한 자기만의 스키마가 있다. 정형외과는 보통 네 칸으로 수렴된다: 어느 부위, 얼마나 심한가, 외상인가 퇴행성인가, 얼마나 지속됐는가. 가정의학과는 주호소, 발병, 중증도, 위험 신호로 접힌다. 종양내과는 종양 유형, 병기, 치료력, 현재 진행 궤적 위에서 돈다. 칸은 다르지만 패턴은 보편적이다. 이 칸들이 채워지면 진단 가설은 의사 머릿속에서 자동으로 조립되고, 다음 단계 결정 — 영상, 주사, 의뢰, 안심시키기 — 은 거의 자동으로 떨어진다.
15분 진료의 앞 5분은 보통 임상 추론이 아니다. 그것은 번역이다 — 환자의 구어 흐름을, 진료과가 실제로 쓰는 네다섯 개의 칸으로 압축하는 작업이다.
이 번역 단계야말로 AI가 맡아야 할 일이다. 퇴원 요약을 쓰는 것이 아니다. 청구 코드를 만들어 주는 것도 아니다. 지난 2주간 환자가 보고한 데이터 — VAS(Visual Analog Scale, 시각적 통증 척도 0-10) 추이, 상처 사진, 운동 기록, PROM(Patient-Reported Outcome Measure, 환자 자가보고 결과 척도) 점수 — 를 환자가 앉기 전 2분 안에 해당 진료과가 의미 있게 쓰는 요약으로 압축하는 것이다.
iRehab에서 의사 화면에 뜨는 모습은 이렇다 (POD = Post-Operative Day, 수술 후 경과일):
POD 14, 오른 무릎. VAS 6 → 3. 가족이 3일 전 찍은 상처 사진 — 경미한 홍반. 어제 처방 운동의 70% 완료.
네 칸. 5초 안에 읽힌다. 진단이 형성된다. 남은 10분은 환자의 것이다.
iRehab이 실제로 만든 것: 번역기, 그리고 확인자
iRehab Doctor AI는 명확한 순서로 쌓인 두 개의 층이다.
번역기 층. 진료 전에, 시스템은 환자의 종단적 보고 데이터 — 증상 일지, VAS 추이, 상처 사진, 운동 완료율, PROM 점수 — 를 해당 진료과에 맞는 요약으로 압축한다. 양식을 통합하는 것이 아니라 맥락을 통합한다. 의사는 Doctor PWA(Progressive Web App, 점진적 웹 앱)를 열었을 때 37개짜리 템플릿이 아니라, 네 칸으로 그려진 임상 그림과 그 위에 얹힌 AI가 제안한 SOAP 초안을 본다.
확인자 층. 의사는 초안을 읽고, 고쳐야 할 곳을 고치고, 확인한다. 오직 그 확인만이 초안을 공식 기록으로 바꾼다.
번역기 층은 사용자 가치가 사는 곳이다 — 5초의 읽기가 구어 흐름을 해석하는 5분을 대체한다. 확인자 층은 책임이 사는 곳이다. 두 층 모두 구조를 지탱한다. 어느 한 층이라도 빼면 제품은 임상적으로 말이 되지 않는다.
업계의 일반적인 반사는 이 두 층을 트레이드오프로 제시한다: 자동화를 더 얻으려면 안전을 내주어야 한다는 식이다. 우리는 그렇게 보지 않는다. 번역기는 출발점을 끌어올려서 자기 자리를 얻는다. 확인자는 종착점을 사람 손에 남겨서 자기 자리를 얻는다. 어느 층도 다른 층의 마찰이 아니며, 서로 다른 일을 하고 있다.
Draft-Only Enforcement — 번역기의 가드레일
번역기가 이 정도로 유용해지면, 다음에 나오는 합리적 질문은 이것이다 — 확인 단계도 AI가 생략할 수 있는가? 우리 답은 단호한 아니오이며, 이는 제품 레벨에서 강제되는 규칙으로 구현된다. 우리는 그것을 Draft-Only Enforcement(초안 한정 원칙)이라고 부른다:
AI가 생성한 어떤 의료 문서도 초안으로 표시된다. 면허를 가진 의사가 수동으로 확인을 수행하기 전까지, 초안은 환자의 공식 기록의 일부가 되지 않는다.
구체적으로:
- AI는 평가, 처방, 수술 기록, 청구를 생성할 수 있다 — 그러나 제출할 수는 없다.
- AI는 칸을 채우고, 맥락을 드러내고, 최선의 출발점을 제시할 수 있다 — 그러나 스스로 EHR에 기록하는 일은 없다.
- 문서는 한 번의 동작으로 저장될 수 없다. Draft → Confirm은 두 개의 동작이며, 합쳐질 수 없다.
기술적으로 이는 사소한 제약이다. 어려움은 엔지니어링이 아니다. 분기마다 모델이 더 정확해지고, 모든 제품 본능이 두 번째 단계를 없애라고 말할 때, 그 두 번째 단계를 그 자리에 남겨두는 규율이 어렵다.
왜냐하면 Draft → Confirm이 하나의 동작으로 붕괴하는 순간, 임상 책임의 사슬은 약해지는 게 아니라 끊어지기 때문이다. 임상 시스템의 회복탄력성은 그 사슬의 온전함에 전부 깃들어 있다.
이 규칙 뒤에는 또 한 층의 원칙이 있다. 만약 AI가 차트 작성, 처방, 수술 모두에서 의사를 완전히 대체할 수 있게 된다면, 그것은 기술의 승리가 아니다. 면허를 가지고 책임을 지는 직업으로서의 의사가 재정의되고 있다는 신호다. 우리는 기술이 거기까지 도달했다고 생각하지 않는다. 도달했더라도 윤리가 살아남을 것이라고 보지 않는다.
"통합"의 세 가지 오독
의사들이 "문서 통합"을 요청할 때 보통 세 가지 중 하나를 의미한다. 그 셋 중 어느 것도 올바른 답이 아닌 이유를 보면, "번역기-그리고-확인자"라는 형태가 왜 답인지가 분명해진다.
통합 = 자동화. "전부 AI에게 쓰게 하고 나는 손 안 댄다." 완성된 문서에는 의사 이름이 붙어 있지만, 의사는 그것을 읽지 않았다. 책임의 사슬은 명목상 온전하고 실제로는 끊어져 있다.
통합 = 단일 폼. "모든 칸을 한 화면에 두어 탭을 옮기지 않게 해 달라." Cerner와 Epic(미국 양대 EHR)이 30년간 해 왔다. 칸은 늘었다. 입력 시간은 줄지 않았다. 진짜 문제 — 진료당 인지 부하 — 는 UI 레이아웃의 문제가 아니다.
통합 = "AI가 끝냈으니 끝". 가장 깊은 오독이다. 의료 문서는 산출물이 아니다. 그것은 임상 판단의 증거 기록이다. "내측 반월상 연골 봉합 후, MRI 추적 고려"라는 문장이 가치를 갖는 이유는 이름 있는 의사가 자기 면허를 그 뒤에 걸어 두었기 때문이다. AI가 쓰고 의사가 읽지 않고 서명한다면, 그 기록은 증거력이 없는 텍스트일 뿐이다.
의사에게 진짜로 필요한 것은 합쳐진 폼이 아니다. 5초 만에 핵심에 닿는 것이다. 번역기, 그리고 확인자.
과잉 생성: 진짜 실패 모드
임상 AI 데모를 충분히 많이 보면 하나의 패턴이 떠오른다. 모두가 입에 올리는 불안은 모델이 "아직 충분히 정확하지 않다"는 것이다. 실제 배포에서 드러나는 실패 모드는 정반대다 — 과잉 생성(over-generation). 환자의 조각난 말 — 세 가지 다른 주호소, 가족이 끼어든 한마디, 반대쪽 관절에 관한 옆길 — 을 받아들고 모델은 그것을 유창하고 구조가 잘 잡힌 문법적으로 깔끔한 산문으로 부풀린다. 출력물은 아름답게 읽히고, 의사의 시간을 낭비한다.
진료의 리듬은 작문을 보상하지 않는다. 15분 진료에는 의사가 다듬어진 단락 속에서 "결정을 움직이는 서너 개의 칸"을 캐내기 위한 여유가 없다. 주치의가 차트 여백에 휘갈기는 그 압축되고 약어로 빽빽한 단문 조각들은 문체의 취향이 아니다 — 훈련된 임상의 눈이 가장 빠르게 읽어낼 수 있는 형식이다.
그래서 iRehab의 진료 전 초안은 두 가지 형식으로, 전신 속기(telegraphic shorthand)를 기본값으로 출력된다. 통순체는 문서 내보내기용으로 보존된다. 의사가 진료실에서 실제로 사용하는 화면에 먼저 로드되는 것은 속기체다 — 네 칸, 한 줄, enum 코드는 원형 그대로 보존되어 의사가 그것들을 문장이 아니라 임상 신호로 읽게 한다.
과잉 생성은 AI 업계의 자연스러운 반사다 — 병상에 있지 않은 제품팀에게 더 긴 출력은 "가치가 더 크다"고 읽힌다. 임상에서는 그 반사가 틀렸다. 문진 압축은 들어오는 것을 줄이는 것에 그치지 않는다. 나가는 쪽에서 다시 펼치려는 충동에 저항하는 것이다.
원칙을 상류로 밀어 올리기
Draft-Only Enforcement는 의사를 보호하기 위한 원칙으로 시작되었다. 그것이 환자를 보호하는 원칙으로 확장되고 있다 — AI가 의사의 동의 없이 의사의 기록을 제출할 수 없다는 동일한 규칙이, AI가 환자 본인의 동의 없이 환자 자신의 문진 요약을 제출할 수 없다는 규칙이기도 하다.
책임의 사슬은 의사만 보호하는 것이 아니다. 시스템의 모든 관절을 보호한다.
결론
의료 AI의 주류 방향은 의사의 일을 하나의 단계로 압축한다: AI가 끝내고, 사람이 서명한다. iRehab은 같은 일을 서로 다른 일을 하는 두 개의 층으로 나눈다. 번역기는 진료 전 몇 분 안에 수주간의 환자 데이터에서 진료과에 맞는 신호를 추출해 자기 자리를 얻는다. 확인자는 최종 임상 판단 — 그리고 그 뒤의 면허 — 을 사람 손에 남겨 자기 자리를 얻는다.
AI는 번역한다. 사람은 확인한다. 두 번째 단계는 마찰이 아니다. 첫 단계가 안전한 이유 그 자체다.
이 글은 수술 후 추적 사례 — 여러 주의 종단 데이터를 압축할 수 있는 환자 — 에 초점을 맞춘다. 초진 사례 — 이력이 없고, 구어 주소 한 줄뿐이며, 임상 훈련이 필요한 질문을 할 수 없는 환자 — 에 대해서는 자매편 진료 전 브리프: 환자가 '힘줄인지 신경인지'를 모를 때 를 참고하라.
