NTCIR11::MedNLP 2
The Second Medical NLP Shared Task
唯一の日本語医療言語処理コンテストです
[   English    |    Japanese   ]

IMPORTANT NOTICE

・出力結果の提出先 :

出力結果の提出は以下のメールアドレスまで添付ファイルにてお願いいたします。
mednlp.office@gmail.com

・提出フォーマットについて :

提出フォーマットはtraining data(mednlp2-train_v0.xml)のフォーマットと同一形式になります。
ただし、typoタグの付与は不要です。
*注:modality属性は付与されていなくても評価しますが、なるべく付与していただくことを奨励します
(より詳細な評価のため)。

(e.g. 1) TASK 1にはcタグとモダリティ(modality="negation", "suspicion", "family")を付与してください。
(e.g. 2) TASK 2にはcタグとモダリティ(modality="negation", "suspicion", "family")、およびICD属性(icd="XXXX")を付与してください。

・提出ファイルのフォーマット検査:

ご提出後、提出ファイルのフォーマット検査をいたします。
万が一提出ファイルのフォーマットに不備等があった場合は、直接お知らせいたします。

・Task2について:

これまでTask 1のbestシステムの結果を配布するとお伝えしていましたが、検討した結果、Task 1の結果がすべて提出されたあとにgold standard(正解データ)を配布することにいたしました。あしからずご了承ください。

・各タスクの提出数上限について:

  • TASK 1については3つまでの出力結果が提出できます。
  • TASK 2は、下記のように2つの形式の入力に対してそれぞれ3つまでの出力結果が提出できます:
    1) 入力:Task 1のテストデータ(test.xml)にICD コード属性を追加する
    2) 入力:Task 1の提出フェーズ終了後にオーガナイザが提供するgold standardデータに対し、ICDコード属性を追加する
    *1)においてModality属性の付与はTask 1と同様に任意とします。
     ただし、gold standardにはmodalityがすでに付与されています。
    *両方の提出 [計6つまで] を奨励しますが、どちらか一方でも構いません。



  • ご質問などございましたら、お気軽にお問い合わせくださいませ。
    mednlp.office@gmail.com



     What's new ?

    Welcome to MedNLP 2

    MedNLP 2は、日本語の医療文書から重要な情報(個人情報や医療情報)の抽出を行う, NTCIR-11のコアタスクの1つです。

    近年,従来の紙を媒体とするカルテが急速に電子化されつつあります. カルテの電子化に伴い,紙カルテの時代には事実上不可能であった, 大規模な医療情報の利活用が期待されています. これに伴い,病名や医薬品名などの専門用語や,それに対応するコードの標準化, データ記録形式の標準化などが必須となり, それを効率よく行うために言語処理技術が注目されています. 本タスクの目的は,短期的には医療分野における情報抽出の基礎技術を評価し, 長期的にはこうした技術の洗練を達成するための場を作ることです. 研究者や企業を集めて交流や議論を活性化させ,解くべき問題や、 そのための要素技術を明らかにします. このタスクでは,日本語の医療文書から重要な情報の抽出を行います. これは,医療サービスの支援技術を発展させるためには欠かせない基礎技術です. 私たちオーガナイザーの最終的な目標は, 医療産業で利用できる(診断や診療,治療に役立つ) 実用的なツールやシステムの開発を促進したり支援したりすることです.

    Task

    次の3種類のタスクを設定しています:

    (1) 病名・症状抽出タスク (テキストから症状を抽出します : Named Entity Recognition (NER))

    (2) 病名・症状正規化タスク(症状に病名コードを振ります : Normalization/Coding)

    (3) 自由タスク(参加者自身が設計したタスクでも応募可能です : Free)

    それぞれ独立に参加できます.
    たとえば,(1)のみ,(2)のみ,(3)のみ,または,(1)+(2) や(1)+(3)などの参加が可能です.

    Dataset

    医師によって書かれた模擬患者の病歴要約が本パイロットタスクのためのデータとなります:

    実際のサンプルデータ(10件)はこちらをご参照ください.(別窓が開きます)
    アノテーション・ガイドラインはこちらからダウンロードしてください.(別窓が開きます)  

    入力データ例:原文

    工場に勤めている64歳の男性。
    2025年月8月2日(来院5日前)頃から腹痛が生じるとともに, 食欲不振,嘔気・嘔吐出現した。
    体幹は温かく、ショック状態。
    明らかな運動麻痺はみられず。
    翌日,意識障害出現し,腎機能障害の増悪を認め, 8月9日18時10分に心肺停止。
    8月9日21時44分死亡確認。

    出力データ例:タグ付き (ICD属性とmodality属性を含む)

    工場に勤めている64歳の男性。
    <t>2025年月8月2日(来院5日前)頃</t>から <c icd="R104">腹痛</c>が生じるとともに, <c icd="R630">食欲不振</c>, <c icd="R11_">嘔気</c> ・ <c icd="R11_">嘔吐</c>出現した。
    体幹は温かく、<c icd="R579">ショック状態</c>。
    明らかな <c icd="G839" modality="negation">運動麻痺</c> はみられず。
    翌日, <c icd="R402">意識障害</c>出現し, <c icd="N289">腎機能障害</c>の増悪を認め, <t>8月9日18時10分</t>に <c icd="I469">心肺停止</c>。
    <t>8月9日21時44分</t> <c icd="R99_">死亡確認</c>。

    Important Dates

    Jan. 20, 2014
    Task Participants' Registration Due
    Feb. 10, 2014
    Annotation Guideline distribution
    Mar. 10, 2014
    Training Corpus distribution (Please submit the Agreement to download the corpus)
    Mar. 20, 2014
    Dry Run (Recommended but optional)
    Jul. 11, 2014
    Distribution of Test-data for TASK 1 (NER) & TASK 3 (Free)
    Jul. 18, 2014
    Submission due for the system output for TASK 1 (NER)
    Jul. 25, 2014
    Distribution of test-data for TASK 2 (the output result that received the highest f-score in Task 1)
    Aug. 1, 2014
    Submission due for the system output for TASK 2 (Normalization/Coding) & TASK 3 (Free)
    Aug. 1, 2014
    Early draft overview papers by TOs released to participants
    Sep. 1, 2014
    Draft participant paper submission due
    Oct. 1, 2014
    Task overview paper submission due
    Nov. 1, 2014
    All camera-ready copy for the Proceedings due
    Dec. 9-12, 2014
    NTCIR-11 Conference, NII, Tokyo, Japan

    Registration

    以下のリンクよりご応募ください。(別窓が開きます)
    http://research.nii.ac.jp/ntcir/ntcir-11/howto-ja.html

    応募詳細は こちら をご覧ください。(別窓が開きます)

    Organizer etc.

    Organaizer

    荒牧英治 [Chair] (京都大学JSTさきがけ
    森田瑞樹 [Chair] (東京大学医薬基盤研究所
    狩野芳伸 (JSTさきがけ国立情報学研究所
    大熊智子(富士ゼロックス

    Adviser

    増市博(富士ゼロックス

    Annotator

    四方朱子
    久保圭
    島本裕美子

    Misc

    † カルテ文書にみられる用語とその説明は こちら になります。

    † メーリングリストを開設しました。 こちら からお申し込み下さい。

    Link