医療現場で生成される多様なデータの相当な部分は自然言語文であり,今後もそれはただちに変わりそうにありません.しかし,電子カルテの記述内容の具体については,医療従事者に一任されてきた面が多く,その結果として,非文法的かつ断片化した表現が多く含まれています.このため,病院ごとに異なった形で行われているカルテから,医療情報を抽出し,標準化することは困難な状態です.本研究グループでは,カルテを自動解析し,利活用するための研究を行っています.
平成13年度に政府が発表した 「保健医療分野の情報化にむけてのグランドデザイン」にて,電子カルテシステムの普及が課題の一つとして掲げられて以降, 急速に医療のIT化が進み,その結果,かつてない大量の臨床データが電子化された状態でストックされつつあります.しかし,カルテは個人情報の塊ともいえ,大規模にカルテを共有し解析するためにはこれらの匿名化や標準化が必要となります.
本研究室では,このカルテの大規模解析技術を研究開発しています.開発された技術は,日本内科学会,日本循環器学会などの症例検索システムとして運用されています.