MITで医療ビッグデータ解析 - 医大生Kのブログ

こんにちわー。

本日はとあるきっかけで出席できたMITの講座についてざっくりですが見てきたものを紹介したいと思います。

最近は日本でも厚生労働省がレセプトデータを集積したナショナルデータベース（NDB）をオープンソース化したり、国立がん研究センターでは全国がん登録のデータ集積をしたりと医療においても何かとビッグデータが話題となっていますが、、、、

もちろんアメリカでもそれは同様です。

MITでは去年（2017年度）よりデータハッカソン形式の講座をスタートさせています。

Googleが協力しているため学生はGoogle cloud, Google Healthcare APIが使用可能みたいです。

解析するデータはBeth Israel Deaconess病院のICU データで（MIMIC data）、Githubで共有されているコードを使用し、R studioで解析を行います。

※ほかにも自分でコードを打ち込んだりとやり方はあるみたいですが、とりあえずはこれだけ知っていたら大丈夫らしいです。

学生同士でチームを作り、MITの先生方が考えた課題を選んで取り組んでいき、学生同士はSlackを使いプロジェクトを進行させているようでした。

3か月の期間で実際に論文発表までもっていくのがコースの目標のようです。

実際にコースを受けてみた感想としては、、、、

めちゃくちゃ実践的！！！！

ハッカソンだから当然っちゃ当然なんでしょう。

On the job trainingで学びながらプロジェクトを進めていくってような感じでした。

日本には国民皆保険制度のためにNDBのレセプトデータがあり、これは他国にはない優位性ですが、実はデータの信頼性という点においては少し問題もあるみたいです。

一方でICUデータは持続的なモニタリングにより客観性のあるデータが集積されるので、データ自体の信頼性が高いみたいです。

つまり、マシーンラーニングやニューラルネットワークといったビッグデータ解析の方法論だけでなく、ビッグデータ解析を前提にしたデータ集積といのもまた重要な点だと感じました。

ただ、正直なところそもそも日本語でも理解できるか怪しいところを英語で聞くのはとてもつらく、理解できなかったところも多かったですがとても興味深いコースで大変勉強になった事は間違いないです。

日本でもMIMIC dataの集積等が始まることに期待したいですね。

コースの詳細については書いていない事も多いのでもし詳細知りたい方がいらっしゃれば気軽にどうぞ。

注釈）

ハッカソン（英語: hackathon 、別名:hack day ,hackfest ,codefest ）とはソフトウェア開発分野のプログラマやグラフィックデザイナー、ユーザインタフェース設計者、プロジェクトマネージャらが集中的に作業をするソフトウェア関連プロジェクトのイベントである[1]。個人ごとに作業する場合、班ごとに作業する場合、全体で一つの目標に作業する場合などがある。時にはハードウェアコンポーネントを扱うこともある。ハッカソンは1日から一週間の期間で開催することがある。いくつかのハッカソンは単に教育や社会的な目的を意図に開催する。使用に耐えるソフトウェアの開発や既存のソフトウェアを改善することを目標としている場合もある。また、使用プログラミング言語、オペレーティングシステム、アプリケーション、API、主題や参加プログラマーの人数を定める場合がある。