研究概要

ソーシャル・コンピューティング研究室は, 奈良先端科学技術大学院大学において,
今後必要となる新しい情報学の先端研究を推進することを目的とし,2015年9月に設置されました.
当研究室では,新しい学問領域を開拓すべく,学際的な研究及び教育を行っています.

ソーシャルメディアで病気を予防する

感染症の流行は,毎年,百万人を越える患者を出しており,常に重要な国家的課題となっています.
本研究室では,代表的なソーシャルメディアであるTwitterからインフルエンザなどの感染症の予測/現状把握を行っています.
本研究は,Twitter応用の代表的研究として,多く引用され(被引用数270本; 2016現在),高く評価されました.
また,この技術を応用した製薬会社のサイト「カゼミル」は,
世界最高峰の広告コンクールであるCLIO Healthcare Awards でのGold Awards (最高賞)など多くの賞を受賞しました.

現在,本研究は,新システム「NAIST-ARS (All Range Surveillance System)」として,
AMED「迅速・網羅的病原体ゲノム解析法の開発 及び感染症危機管理体制の構築に資する研究」に採択され,実用化に向けて研究が推進されています.

言葉を測り 認知症の兆候を捉える

世界に類をみない超高齢化社会を迎える本邦にとって,高齢者への医療対策は重要な課題です.
とりわけ,認知症は,その予備軍(MCI)も含めると4人に1人の割合となり,
その医療費は10兆円規模と算定されます(平成22年 厚生労働省).
認知症の対策には,治療法の確立もさることながら,一方で早急に症状を発見し,
その進行を遅らせることで,健康な期間を延長し,介護が必要となる期間を短縮することも重要です.

本研究では,簡便かつ負担のない検査として,記述した文章や発話内容から認知症を予期する研究を行っています.
これの研究は,音声収録,動作測定,3壁面に画像を投影可能な会話フィードバック環境である
「スマート茶室」を用いて行っています.

日本語カルテの言語処理コンテスト

人工知能技術を活かすためには基盤となる大量の良質なデータが必須です.
医療分野において,もっとも大量のデータとしては,日常診療で医師が記述している電子カルテ文章があります.
ただし,この膨大なデータも現在はただ蓄積されるだけであり,研究利用はほとんどなされていません.
というのも,カルテの記述様式については医師に一任されており,その表現の多様性から分析が困難であるからです.
例えば,「頭痛」や「吐き気」などの症状一つとっても様々な表記ゆれがあります.
このような自由な日本語を医療データベースとして利用するためには,医師の記述する文章から医療表現を抽出し,それを標準的な用語に変換する技術が必須となります.
日本の資産である過去の患者のデータを医療に活かすことは,(我が国で行うべき)重要な研究課題であると考えています.

近年,電子カルテの普及につれ,医療分野での言語処理の重要性が増しています.
欧米では,技術を効率よく,かつ,再現性をもって開発するために,研究者が共有可能な標準データの整備,及び,標準データを用いたコンペティション形式のワークショップが開催され,リソースが集積されつつあります.
しかし,非英語,特に日本語において,このようなデータはなく,医療文書の解析技術の開発に興味はあるがデータを持っていない研究者や,解析技術を適用する場を持っている企業の新規参入の障壁となってきました.
以上のような背景から,本研究では,研究利用が可能な日本語のアノテーション済み医療文書を構築し,これを用いた解析タスクと共に研究コミュニティに提供しています.

本研究室が提供する日本語カルテデータは,現在,非英語言語での唯一の研究利用可能なカルテデータであり,
本データを用いたワークショップには,2011年には国内12グループ(27システム),2013年にも12グループ(45システム)が参加しました.
海外(7グループ)や企業(7グループ)からもの参加も多く,本邦における医療言語処理における基盤を提供しています.