2019.2.5 サイトリニューアルしました!

Python

医療現場に機械学習を活用するにはまだ早い?

投稿日:

Pocket

 

さぼ
どうもさぼ(@ce_sabo)です。

 

長らく更新が止まっていました。

去年の8月あたりからPythonを使って、「医療現場に機械学習を応用しよう!」と意気込みいろいろやってきたのですが、最近感じたことをまとめていきたいと思います。

今回のテーマ=僕の主張はタイトルの通りです。

そう感じた理由を含めて考察していきたいと思います。

今回は自分にとっての単なる思考の整理として書きますが、同じことを考えている人で「機械学習はなんでもできる」と思い込んでいる人の参考になればよいかと思います。

 

背景

 

そもそもなぜ医療に機械学習を活用しようと思ったか?

といいますと、

単に「既存の統計モデルと機械学習モデルで結果は異なるのか」を知りたかったり、

僕自身、統計を勉強してきて(独学でしかも浅い知識ですが)、医療系の研究でよく使われる差の検定や多変量解析では、例えばOutcomeが”死亡”であるとしたら、死亡の要因が推定できたりするのですが、いつ死亡するのかなどの「未来の予測」はできない。と感じていて※1、機械学習は「未来の予測ができる」と知って、「やってみたい!」と思ったからです。

そして、機械学習と既存の統計モデルの比較や死亡の未来予測などは研究のテーマ的にも新規性(臨床工学界隈では)も当てはまるし、いいなと。

久々に目を光らせていました。

※1 既存の統計モデルは過去または現在までの結果から、死亡に繋がりそう原因や要因などを排除して、未来の死のリスクを下げるというアプローチ(僕のイメージ)で、機械学習はそういうアプローチもできるけど未来の予測もできる(イメージ)。ただ、未来を予測するモデルは単に自分が知らなかっただけで、「時系列分析」など昔からある統計モデルもある。

 

機械学習を実装する

 

機械学習の本を買って実際動かしてみたり、ネットにある様々な機械学習の記事を参考(ほぼコピペ)にしたり、CEぷらす内でチームを組んでデータ分析コンペのkaggleに参加してみて機械学習をなんとなくですが、実装できるようになりました。

コードも思ったよりも難しくなく、ググれれば諸先輩方がきれいにまとめた記事や図をみればたいていのことはわかりました。

機械学習を実装するまでの全体の流れや概要が分かったので、今度はPubMedなどで機械学習を医療に活用している論文を探して色々読んでみました。

「よし、イケるぞ。」と思いました。

 

実際やってみるとできない

 

ところがでどうでしょう。実際、医療現場に活用させようとできそうなものを考えました。

まったく。ではないですが、僕が考える限りでは機械学習を医療現場に活用するための「データ」はそこにはありませんでした

PubMedで見つけた機械学習を使った透析患者の死亡リスクを予測する研究1)を見つけてやってみようと思いましたが、研究計画の段階で「サンプルサイズが機械学習をやるうえで足りない」ということに気が付きました。

僕が所属しているCEMLの部長に相談してみると、「固有データのような粒度が粗いデータはより多くのデータが必要になり良い予測精度が出ない」という判断となり、やめました。

部長曰く、「センサーデータのような粒度が細かいデータの方が収集しやすく、データの個数も取りやすいのでやりやすいかも」とのことで、データの粒度の細かさから考えてもよいかもしれません。

 

そもそも医療現場はデータの整備ができていない

 

ここ数か月間、色々院内でできることを考えてきましたが、見出しのような結論に至りました。

(僕のサーベイ不足か技術不足がほとんどですが…。)

機械学習はそもそも”予測に必要な情報”がないと機能しないので、まずは"予測に必要な情報"を整備する、データベースを構築して、取得可能な状態にする。ことが必要なのではないかと考えました。

透析支援ソフトを導入でしたら、粒度が細かいデータ(例えばBVMのデータや透析中の圧力データ)をデータベースに保存する仕組みを作ると手っ取り早いかもしれません。

電カルは軽く調べましたがデータの取得にいろいろと制限がありそうで、標準化や法整備?が必要ではないかと思いました。

DPCデータを活用できるような病院などは診療報酬や診断に関わるデータ分析ができそうでおもしろそうです。しかも国がやっている政策ですしね。かなりニーズはあるかと思います。

医療情報系の学会等でけっこう盛り上がってる印象にあります。

参考:DPCデータの提供に関するホームページ-厚生労働省

 

おわりに

 

今回はつらつらと機械学習について経験したことと感じたことを述べました。

「機械学習はなんでもできる」

「機械学習はどんな現場にも適応できる」

と少しでも思った方の参考になればよいかと思います。

 

 

Reference

1)Oguz Akbilgic, Yoshitsugu Obi,Praveen K. Potukuchi,Ibrahim Karabayir,et al, Machine Learning to Identify Dialysis Patients at High Death Risk. Kidney Int Rep. 2019 Sep; 4(9): 1219–1229.

 

-Python

Copyright© CEさぼの備忘録 , 2020 All Rights Reserved.