研究

Yahoo!のニュースコメント欄からスパムを排除するには

論文紹介のコーナー.*1 今回紹介するのは,KDD'2011のUnbiased Online Active Learning in Data Streams (Wei Chu, Martin Zinkevich, Lihong Li, Achint Thomas, and Belle Tseng). Yahoo! Labsのグループによる研究です.(その後,第一著者はMicrosoftへ…

適当な仕事をしている注釈者を発見せよ!

NIPS2011の論文を紹介していくコーナー. 今回対象とする論文は,Ranking annotators for crowdsourced labeling tasks. 概要 本論文は,標本のラベル付を複数人にしてもらう時に,標本をきちんと見ず,適当な注釈を行なっている人を見付け出すためのスコア…

NIPS2011気になった論文リスト

NIPS2011のAccepted Papersが公開されました。(まだタイトルのみですが) http://nips.cc/Conferences/2011/Program/accepted-papers.php いつもどおり、備忘録です。 Active Learning, Crowd, Submodular, Manifoldといったキーワードが流行しているように…

デマをデマと見抜けない人はTwitterを使うのは難しい

Twitterにおけるデマ検出手法を論じた研究が,ついにEMNLP2011に出てきたので紹介します. 論文:Rumor has it: Identifying Misinformation in Microblogs[Qazvinian et al., 2011] Twitter上のデマに関する興味深い統計情報も幾つか含まれているので,興味…

EMNLP気になった論文メモ

上の2つは特に気になった論文. Approximate Scalable Bounded Space Sketch for Large Data NLP Amit Goyal and Hal Daume III. pdf Rumor has it: Identifying Misinformation in Microblogs Vahed Qazvinian, Emily Rosengren, Dragomir R. Radev and Qi…

クラウドソーシング時代の能動学習

例によって,ICML2011からActive Learning from Crowdsのメモ書きです. クラウドと銘打ってはいますが,結局のところ複数アノテーターがいるときにどのように能動学習を行うとよいか,という手法提案の論文になっています. 概要 アノテーターが複数いる場…

ドメイン適応を用いた評判分析手法

ICML2011のドメイン適応の論文のメモ書き.数式番号が1つも使われていない,珍しい論文. Domain Adaptation for Large-Scale Sentiment Classification: A Deep Learning Approach 概要 評判分析,評判抽出のためのドメイン適応手法の提案 Deep Learningと…

分散型オンライン学習

ICML2011のOptimal Distributed Online Predictionをざっくりと読んだので,メモ書き. 論文 概要 既存のオンライン学習アルゴリズムをミニバッチに拡張,分散学習を可能にする 勾配ベースのオンライン学習手法は全て拡張可能 勾配ベースのオンライン学習手…

Bandit Feedback下での多クラス分類アルゴリズム

ICML2011のMulticlass Classification with Bandit Feedback using Adaptive Regularizationをざっくりと読んだのでメモ. 論文 概要 Bandit Feedbackでの多クラス分類問題における新たなアルゴリズムを提案 アルゴリズムは,Second-order Perceptronとupper…

オンライン学習による線形識別器

オンライン学習による線形識別器(Online Linear Classifiers ~PerceptronからCWまで~)というタイトルで研究室内の勉強会発表を行いました. 勉強会で使用したスライドを以下に公開します. (スライドが表示されない場合は,一度リロードを行うと表示されるよ…

ICML2011気になった論文リスト

ICML2011のAccepted paperが公開されています. http://www.icml-2011.org/papers.php個人的に気になった(あとで読みたい)論文リストを以下にまとめていきます. オンライン学習,多クラス分類問題,スパース化,転移学習系の論文が多めです. Efficient S…

Twitterの被RT数を増やすには

恒例の現実(論文)から逃避するためのブログ執筆です. WWW2011のBest Poster Awardを受賞した"Predicting Popular Messages in Twitter" [Hong+, 2011] を読んだのでそのメモを書き留めます.結果から言ってしまうと, Follower数を多くすればいいよ! 被R…

Gmail優先トレイ論文メモ

元論文 “The Learning Behind Gmail Priority Inbox”, Douglas Aberdeen, Ondrey Pacovsky, Andrew Slater, LCCC : NIPS 2010 Workshop on Learning on Cores, Clusters and Clouds. http://research.google.com/pubs/archive/36955.pdf Gmail Priority Inbo…

PRML9章の勉強会用スライド

PRML9章(混合モデルとEM)の勉強会用スライドを公開します。 今回のスライドは出来が悪いので参考にはなるとは思えませんが、なにか使い道があればどうぞです。SlideShare上ではスライドのレイアウトが崩れていますが、一度pdfファイルをダウンロードして、手…

FOBOS解説スライドを作成しました

大学院の専攻全体で行われた輪講で、「L1正則化を導入したOnline学習手法」というタイトルで論文紹介を行ないました。 解説スライド FOBOS View more presentations from Hidekazu Oiwa このスライドを制作するにあたり、中川研究室の皆様には校正・アドバイ…

ICML読み会

http://www.r.dl.itc.u-tokyo.ac.jp/study_ml/pukiwiki/index.php?schedule%2F2010-10-21 研究室の機械学習勉強会で、ICML2010の輪読の発表を行ったので、スライドを載せておきます。僕が担当したのは、以下の7論文です。 Online Learning Implicit Online …