ドメイン適応を用いた評判分析手法

ICML2011のドメイン適応の論文のメモ書き.数式番号が1つも使われていない,珍しい論文.
Domain Adaptation for Large-Scale Sentiment Classification: A Deep Learning Approach

概要

  • 評判分析,評判抽出のためのドメイン適応手法の提案
    • Deep Learningというアプローチを採用
    • 特徴の上位概念(製品の質,コストパフォーマンス等)を学習する
  • 大規模データ解析,大量のドメイン適応を同時に行うことが可能

Domain Adaptation

Deep Learning

  • 特徴の階層構造を学習 (今回のタスクの場合)
    • Ex. 特徴そのものではなく,製品の質,値段,顧客サービス等の要素を探索する
  • Stacked Denoising Auto-encoders(SDA)などの手法
    • 特徴の中間表現へのEncoder / Decoder を学習する
    • PCAみたいな事をやっていると思えば良い

評判分析でDeep Learningを用いることの利点

  • 多くのドメインで共通の概念が存在する(製品の質,値段等)
  • 上記の概念を表す代表的な単語があらかじめ予測できる
  • 評判分析以外のタスクでも,Deep Learningによって面白い知見が得られている
  • ドメインごとに別々の転移学習をする必要がない (一度,全ドメインで共通の階層構造を学習すれば良い)
  • rectifier unitsを用いることで,疎な中間表現を得ることも可能

アルゴリズム

  • ドメインのデータをもちいて,教師なしSDA.階層構造を学習
  • ラベル付データの中間表現を用いて,分類器を学習および予測