抽出ルールの変更
奈良先端科学技術大学院大学
医療言語処理グループ
概要
現在のルールを変更したい場合に,ルールファイルを変更,または編集することができます.
それらの方法を記述します.
ルールファイル
- ICDコード用の場合は,AEX_ICD内の「S_rule_mecab.tsv」
MedDRA用の場合は,AEX_Med内の「S_rule_MedDRA.tsv」です.

ルールファイルのレイアウト
-
[No,][症状][ICD/MedDRA][カテゴリー][SearchNo][検索文字列][除外文字列]
の順でタブ区切りになっているので、エクセルで読み込むと内容を確認することができます。

※ここでは、ICDコード用を例に説明します。
- ルールファイルを選択します.
「ファイル(F)」→「ルールファイルの指定(R)...」を選択してください.

- ルールファイルを選択し,「開く(O)」をクリックします.

- 選択したルールファイル名が右上に表示されていれば,変更完了です.

- ファイルレイアウト
1行7項目のタブ区切りデータです。編集する際は必ずテキストエディタで編集してください。
注意)保存形式は「UTF-8」「改行=LF」
・ICDコード用ルールファイル
[No,]・・・大項目番号(3行目以降は省略可能)
[症状]・・・大項目の症状(3行目以降は省略可能)
[ICD] ・・・ICDコード
[カテゴリー]・・・病名
[SearchNo]・・・ルールファイル作成時の通番
[検索文字列]・・・病名が推測される症状の文字列【例:インフルエンザ】
[除外文字列]・・・検索文字列で間違えて抽出されると予想される文字列【例:予防接種】
・MedDRA用ルールファイル
[No,]・・・大項目番号(3行目以降は省略可能)
[症状]・・・大項目の症状(3行目以降は省略可能)
[MedDRA] ・・・「PT()」の()内にMedDRA(例:PT(下痢))
[カテゴリー]・・・病名
[SearchNo]・・・ルールファイル作成時の通番
[検索文字列]・・・病名が推測される症状の文字列【例:インフルエンザ】
[除外文字列]・・・検索文字列で間違えて抽出されると予想される文字列【例:予防接種】
- [検索文字列]と[除外文字列]の書き方
1.病名が推測される症状の文字列を考えます。
【例:病名が下痢の場合の症状は、「下痢、げり、おなかを下す、おなかがゆるい」など】
2.同じパターンのものをまとめる場合「|」or 、「+」andを使用することができます。
【例1:(下痢|げり)、例2:おなか+(下す|ゆるい)】
3.Mecabの単語の区切れで半角スペースを入れる必要があります。
→Mecabの単語の区切れの調べ方
【例1:( 下痢 | げ り )、例2:おなか + ( 下す | ゆるい )】

- 保存
保存形式は「UTF-8」「改行=LF」で保存してください。
謝辞
本研究は、国立研究開発法人日本医療研究開発機構(AMED)、2016年〜2018年、医薬品等規制調和・評価研究事業 「患者の自覚症状により副作用の早期発見を可能とする方策に関する研究」 (研究代表者:望月眞弓、研究分担者:荒牧英治、若宮翔子)により実施されました。
使用上の注意
本ソフトウェアは、可能な限り細心の注意を払って作成しています。しかし、完全に間違いがないことを保証しておりません。結果的に本ソフトウェア及びデータを使用して何らかの問題が発生した場合。提供元である本研究室は一切の責任を負いません。そのため、研究利用等でご使用になる場合には自己責任でご活用いただくようお願いいたします。
Copyright NAIST.