============================================   NTCIR-11 MedNLP-2 参加者募集 ~ 医療分野の言語処理シェアドタスク ~ ============================================ ・唯一の日本語の医療言語処理コンテストです. ・参加者には模擬カルテのアノテーション付きデータを提供します. * データの一部は,コンテスト終了後の利用も可能です. ・参加者自身が設計できる「自由タスク」があります. ■ ホームページ 日本語: http://mednlp.jp/ntcir11/index-ja.html 英語: http://mednlp.jp/ntcir11/ * 今月末よりコーパスの一部がダウンロードできます. ■ スケジュール 参加登録開始 2013/11/05 コーパスリリース 2014/01/05 フォーマル・ラン 2014/03 ワークショップ開催 2014/12/09-12 ■ 参加方法 以下のリンクから参加登録をしてください http://research.nii.ac.jp/ntcir/ntcir-11/howto-ja.html ■ 背景 近年,従来の紙を媒体とするカルテが急速に電子化されつつあります.カル テの電子化に伴い,紙カルテの時代には事実上不可能であった,大規模な医 療情報の利活用が期待されています.これに伴い,病名や医薬品名などの専 門用語や,それに対応するコードの標準化,データ記録形式の標準化などが 必須となり,それを効率よく行うために言語処理技術が注目されています. ■ 目的 以上のような背景から,我々は研究に利用することが可能な日本語のアノテー ション済み医療文書を構築し,また,これを用いた解析タスクと共に研究コ ミュニティに提供しています. 本タスクの目的は,短期的には医療分野における情報抽出の基礎技術を評価 することですが,長期的にはこうした技術の洗練を達成するための場を作る ことです.研究者や企業を集め,交流や議論を活性化させ,解くべき問題や そのための要素技術を明らかにします. ■ タスク 次の3種類のタスクを設定しています: (1) 病名・症状抽出タスク (テキストから病名と症状を抽出します) (2) 病名・症状正規化タスク(病名と症状にコードを振ります) (3) 自由タスク(参加者自身が設計したタスクでも応募可能です) それぞれ独立に参加できます. たとえば,(1)のみ,(2)のみ,(3)のみ,または,(1)+(2) や(1)+(3)などの参加が可能です. ■ データセット 医師によって書かれた模擬患者の病歴要約,及び,国家医師試験の臨床実地 問題をカルテ風に整形したデータが配布されます.後者は,ワークショップ 終了後の利用も可能です. ■ 実行委員会 荒牧 英治 [Chair](京都大学, JSTさきがけ) 森田 瑞樹 [Chair](東京大学, 医薬基盤研究所) 狩野 芳伸(JSTさきがけ, 国立情報学研究所) 大熊 智子(富士ゼロックス) ■ 協催 富士ゼロックス