NTCIR-10 医療言語処理(MedNLP)パイロットタスクとは

日本語の医療文書から重要な情報(個人情報や医療情報)の抽出を行う,NTCIR-10のパイロットタスクの1つです。

背景

近年,医療文書の保存は紙から電子ファイルに急速に移行しつつあり,これによって医療分野における情報処理技術は重要性が増しています。このパイロットタスクでは,日本語の医療文書から重要な情報の抽出を行います。これは,医療サービスの支援技術を発展させるためには欠かせない基礎技術です。

私たちオーガナイザーの最終的な目標は,医療産業で利用できる(診断や診療,治療に役立つ)実用的なツールやシステムの開発を促進したり支援したりすることです。本パイロットタスクの目的は,短期的には医療分野における情報抽出の基礎技術を評価することですが,長期的にはこうした技術の洗練を達成するための場を作ることです。つまり,研究者や企業を集め,交流や議論を活性化させ,そして解くべき問題やそのための要素技術を明らかにすることです。

タスク

医療文書から重要な情報を抽出する,次の3種のタスクを設定しています:

匿名化タスク

文章に次の各タグを付与するタスクです:

<a> :年齢(age), < t> :日時(time), <h> :病院名(hospital), <l> :場所(location)
<p> :個人名(person), < x> :性別(sex)

症状と診断タスク

文章に次の各タグを付与するタスクです:

<c> :症状(complaint)と 診断(diagnosis)

自由タスク

上記の2タスク以外に,与えられたデータを用いて何が出来るか,実用的で創造的なアイデアを歓迎しています。自由な発想をもとに,ぜひみんなで議論しましょう。

データセット

医師によって書かれた模擬患者の病歴要約が本パイロットタスクのためのデータとなります:

入力データ例:原文


工場に勤めている64歳の男性。

2025年月8月2日(来院5日前)頃から腹痛が生じるとともに,食欲不振,嘔気・嘔吐出現した。

体幹は温かいが,末梢は湿潤冷汗でショック状態。

明らかな運動麻痺はみられず。

翌日,意識障害出現し,腎機能障害の増悪を認めて徐々に尿量低下し,8月9日18時10分に心肺停止。

8月9日21時44分死亡確認。


出力データ例:タグ付き


工場に勤めている<a>64歳</a><x>男性</x>

<t>2025年月8月2日(来院5日前)頃から</t><c>腹痛</c>が生じるとともに,<c>食欲不振</c><c>嘔気</c><c>嘔吐出現</c>した。

体幹は温かいが,末梢は<c>湿潤冷汗</c><c>ショック状態</c>

明らかな<c modality=”negation”>運動麻痺</c>はみられず。

<t>翌日</t><c>意識障害出現</c>し,<c>腎機能障害</c>の増悪を認めて徐々に<c>尿量低下</c>し,<t>8月9日18時10分</t><c>心肺停止</c>

<t>8月9日21時44分</t><c>死亡確認</c>


スケジュール

参加登録開始 2012-11-01
参加登録〆切 2012-11-30
サンプルデータ(開発用)の送信 2012-12-10
テストデータ(評価用)の送信 2013-01-25
提出〆切 2013-02-01
Overview paperの下書きをタスクオーガナイザーから参加者へ送信 2013-02-15
システム概要の下書きの提出〆切* 2013-03-01
システム概要の最終版の提出〆切* 2013-05-01
NTCIR-10ワークショップ開催 2013-06-18/21

(*パイロットタスクで使用した手法の概要を書いたもの。査読無し。)

参加方法

こちらのリンクから参加登録をしてください。

参加登録を済ませると,NTCIR-10 MedNLP参加者メーリングリストへ追加されます。

想定しているタスク参加者

医療もしくは情報分野に従事しているすべての方が対象となります。

引用先

引用にあたっては下記の論文を引用して下さい:


Mizuki MORITA, Yoshinobu KANO, Tomoko OHKUMA, Mai MIYABE, Eiji ARAMAKI:
Overview of the NTCIR-10 MedNLP task,
In Proceedings of NTCIR-10, 2013. (2013/06/18, Tokyo, Japan)

実行委員会

森田 瑞樹 [Chair](東京大学知の構造化センター医薬基盤研究所

荒牧 英治 [Chair](東京大学知の構造化センターJSTさきがけ

狩野 芳伸(JSTさきがけ国立情報学研究所

宮部 真衣(東京大学知の構造化センター

大熊 智子(富士ゼロックス

アドバイザー

増市 博(富士ゼロックス

お問い合わせ先