SCIS&ISIS2018参加レポート

f:id:vasilyjp:20181228093455p:plain

こんにちは、ZOZO研究所の岩本です。 2018年12月5日から12月8日にかけて富山で開催された学会SCIS & ISIS 2018に、同じく研究所の岩崎と参加してきました。

SCIS & ISISについて

SCIS & ISISはソフトコンピューティングと知能システムに関する国際学会です。 SCISとISISはそれぞれ別の学会ですが、今年は共同で開催されました。 また、ISWSというワークショップも同時に同じ会場で開催されていました。

今回はこの学会に参加して他の方の発表を聞いたり、研究成果をポスターで発表したりしてきました。

学会のプログラムは主に、招待講演、トークセッション、ポスターセッションに分かれています。 招待講演では国内外の大学教授の方などがホールでいくつかのテーマについてお話しされていました。 トークセッションでは、いくつかの部屋で20分程度の発表が並列して行われます。 ポスターセッションでは会場に20枚ほどのポスターが掲示され、参加者は興味のあるポスターの前に行って発表者から説明を受けたり、内容に関するディスカッションを行ったりします。

ポスターセッションでは自分たちも発表していたため他の発表を見ることが出来ませんでしたが、招待講演とトークセッションでは色々な興味深い話を聞くことが出来ました。 また、現在共同研究を行っている九州工業大学の古川研究室からも、4人の学生さんがトークセッションとポスターセッションで発表をされていました。

このレポートでは、今回私たちが行った発表の紹介と、その他の発表の中で特に興味深かったものを紹介したいと思います。

ZOZO研究所のポスター発表について

ZOZO研究所からは「Visualization of User-item Rating Matrix by Hierarchical Tensor SOM Network(階層型Tensor SOMネットワークによるユーザー・アイテム評価行列の可視化)」というタイトルでポスター発表を行いました。著者は岩本海童、岩崎亘、古川徹生(九州工業大学)です。ここでは、簡単にその概要をご紹介します。

現在、岩崎と岩本(私)のチームは九州工業大学との共同研究で、大規模な関係データの可視化を研究しています。 関係データの可視化と言ってもイメージが難しいと思うので、例を使って説明してみます。 何人かの人にいくつかのアイテム(例えば食べ物など)の好みについて質問したアンケートデータがあるとします。 このようなデータを解析すると、「どんな人がどんなアイテムを好んでいるのか」や「ある人と好みが似ている人たち」「あるアイテムと好む人の傾向が似ているアイテム」を直感的に可視化することが出来ます。

しかし、ユーザーやアイテムの数が多い場合には、個別のユーザーやアイテムだけではなくもう少し俯瞰的な視点でデータを見たいことがあります。 例えば、「甘い食べ物が好きなのはどのユーザーなのか」「30代のユーザーはどんな食べ物が好きなのか」などです。

そこで、私たちは関係データと一緒にユーザー属性情報とアイテム属性情報を解析してみました。 属性情報とは、例えばユーザーの場合は性別や年齢層、アイテムの場合はカテゴリーや価格帯などです。

その結果、「あるアイテムはどんなユーザー属性の人に好まれているのか」や「あるユーザー属性の人は、どんな属性の商品が好きなのか」といった情報を視覚的に確認できるようになりました。特に後者が重要です。先行研究ではユーザー属性だけを利用していたのですが、今回はユーザーとアイテムの両方を一緒に解析し、それらの関係を可視化しました。 そうすることにより、ユーザーとアイテムそれぞれについて、個別のデータレベルの視点と属性レベルの2つの視点から関係データを視覚的に見ることができるようになりました。

文章だけだとよく分からないと思うので、可視化の様子の一例を簡単に図にしてみました。

実際はこのように静的なものではなく、フォーカスするものを切り替えながら、インタラクティブに可視化された結果を確認できます。 (それを表現するにはポスターでは限界があったので、発表ではiPadで可視化のデモを行いました)

f:id:vasilyjp:20181228093654p:plain

今回の発表では寿司の好みに関するアンケートデータを利用しましたが、最終的にはこの手法を使ってZOZOの購買データやWearのコーディネートのデータを可視化したいと考えています。 膨大なデータを可視化することで、今まで知ることのできなかったデータの一面が発見できるかもしれません。

また、今回発表したポスターで、ポスターセッションアワードを頂きました。 全く予想外の出来事で、大変嬉しく思います。

ポスター発表の様子

こちらはポスターの前で参加者に研究を説明しているところです。インタラクティブな可視化を見ていただくためにiPadでのデモンストレーションも行いました。

f:id:vasilyjp:20181228093732j:plain

ポスターの前に立つ私です。

f:id:vasilyjp:20181228093751j:plain

その他の発表の紹介

ここでは、学会で視聴した発表の中から特に印象的だったものをいくつかを紹介します。 なお、見出しの下の斜体の文は、発表者名と私が訳したタイトルです。

Cognitive Mechanism of Humor in Riddles: Examination of Relationship between Humor and Semantic Structure of Riddles

Asuka Terai, 「謎かけのユーモアの認知メカニズム:ユーモアと謎かけの意味構造の関係の調査」

謎かけを自動生成して、その面白さと使われている単語との関係を調べる研究です。

ここでは、「AとかけてBと解く。その心はC(C')」(AとBはそれぞれ名詞で、CとC'は同音異義語でそれぞれAとBに関係がある)というような限定したスタイルの謎かけを扱います。 AとBの単語をランダムに選び、それぞれに意味が近い単語CとC'をWikipedia日本語版のコーパスとword2vecを使って選ぶことで、謎かけを生成します。

あらかじめ用意したいくつかの謎かけについて、ユーモアがあるかどうかのアンケートを行い、またA-C, B-C', C-C'間の単語の類似度を調べました。 その結果、A-CとB-C'の類似度が共に高い謎かけは高評価が得られやすかったそうです。しかし、生成した謎かけはA-CとB-C'が共に高くなることはあまりなかったそうです。

感想

ビジネス寄りの実用的な研究が多い中、こういうある種の「遊び」に関する研究はすごく面白いなと思います。 もっと複雑な文章の謎かけを生成したり、あるいはユーモアに関してもっと多角的に研究(ユーモアの種類、地域や世代などによる感性の違いなど)してみたりすると面白そうだと思いました。

Non-parametric Continuous Self-Organizing Map

Ryuji Watanabe, 「ノンパラメトリックで連続な自己組織化写像」

九州工業大学の渡辺さんの発表です。 (現在行っている共同研究にも関連する内容です)

自己組織化写像(self-organizing map, SOM)は高次元のデータの低次元表現を離散的に求める手法です。 この研究では連続した空間での低次元表現を求められるようにSOMを改良しました。 また、求められる低次元表現はデータ点だけに依存する(ノンパラメトリック)ようになっています。 その結果、ユニット数を増やした高解像度なSOMと同じような表現を得られることが実験から確認できたそうです。

感想

離散化した写像を求めるSOMを、連続かつノンパラメトリックに拡張する流れがとても自然で美しいです。 データ数が増えた場合にいかにメモリと計算時間を節約するかが実用に向けた課題だと思います。

Visualized Onomatopoeia Thesaurus Maps based on Deep Autoencoder

Daiki Urata, 「深層オートエンコーダーによる類似オノマトペのマップ」

オノマトペの類似度を可視化する研究です。

オノマトペを音声に変換したものをオートエンコーダーにかけて2次元の表現を得ます。 それを2次元上に表示すると、似た音のものや、同じカテゴリー(汁をすする音、飲み物を飲む音など)のものが近くに配置されるそうです。

未知のオノマトペに対しても、同様に2次元の表現を得て、そこからもっとも近くにあるオノマトペのカテゴリーをそのオノマトペのカテゴリーとします。 その結果、高い精度で未知のオノマトペのカテゴリーを推定できたそうです。

感想

オノマトペの研究というのを初めて知ったので、とても興味深かったです。 ファッションを表現する際にもオノマトペを使うことがあるので、雰囲気や質感を表す言葉から服やコーディネートを提案できたら面白いなと思いました。

An Extreme Learning Machine Based Pretraining Method for Multi-Layer Neural Networks

Pavit Noinongyao, 「エクストリームラーニングマシンに基づく多層ニューラルネットワークの事前学習の手法」

エクストリームラーニングマシン(ELM)はある種のニューラルネットワークですが、勾配法を使わず、1層目の重みをランダムに初期化し2層目の重みを逆行列を使って決定的に求めます。 このELMをベースにしたオートエンコーダーを用いると、多層ニューラルネットワークの事前学習を行うことができます。 この研究では、通常のELMとは逆に2層目をランダムに初期化し1層目を計算するbackward-ELMという手法を提案し、事前学習の手法として有用であることを実験により示しました。

感想

ELMという手法について詳細を知らなかったのですが、勾配法を使わずに一気に重みを計算するというのはとても大胆だなと思いました。 時間があるときに詳しく調べてみたいです。

参加した感想

実は、今回は私にとって初めてのポスター発表でした。

私は人の前で話すのがあまり得意ではないのですが、視聴者の方々が優しく聴いてくださり、説明が不十分なところを適宜質問していただいたのでなんとか研究の内容をお伝えできたように思います。 また、今回は可視化の研究であり、iPadでのデモンストレーションにより視覚的に相手に訴えることができたというのも良かった点かなと思っています。

ポスター発表は1人(または少数の人)を前にして相互にコミュニケーションしながら発表を行うことができます。 これは多くの人の前で行う口頭発表にはない良さですが、一方で事前に頭の中で発表する内容をよく整理しておく必要があることに気づきました。 次にポスターで発表する機会があれば、もっとスムーズに説明できると良いなと思っています。

招待講演やトークセッションでは、色々な分野の発表を聞くことができて、大変勉強になりました。 また、今回の学会では自分の英語の能力の足りなさを実感しました。 今後、もっと英語の発表を聴いて良く理解したり、もっと英語で情報を伝えられるようになりたいと思いました。

おまけ

上に書いていない学会や富山の様子を写真で一部ご紹介します。

九州工業大学の学生さんたちによる発表

古川研究室から4人の学生さんがトークセッションとポスターセッションで発表されていました。

f:id:vasilyjp:20181228093839j:plain

晩餐会

学会の最終日の前日の夜に、晩餐会が行われました。 運営の方の挨拶や学会の歴史についての紹介が行われた他、杖道のパフォーマンスも行われました。

f:id:vasilyjp:20181228093903j:plain

富山の食べ物

富山名物の、富山ブラックと呼ばれるラーメンです。 元々、肉体労働者に食べてもらうために作られたこともあり、かなり醤油の塩味が効いています。 味が濃すぎるあまり途中でライスを注文しましたが、1杯では全然足りませんでした。

f:id:vasilyjp:20181228093934j:plain

そして、富山といえば何と言っても海の幸です。 私たちも学会の期間中、何回かお刺身や焼魚などの海の幸を味わいました。 また、魚と一緒に飲む富山の日本酒も美味しかったです。

f:id:vasilyjp:20181228093957j:plain

最後に、岩崎と私で会場前でパシャリ。 お疲れ様でした。

f:id:vasilyjp:20181225170946j:plain

おわりに

ZOZO研究所では、ファッションに関する研究を行なっています。 私と岩崎のようにデータの可視化を研究しているチームもあれば、コーディネートの研究をしているチームもあり、日々さまざまな課題に取り組んでいます。 あなたも一緒にZOZOのデータ資産を活用して「似合う」を研究しませんか? ご興味のある方は下のリンクからご連絡いただき、ぜひ一度オフィスに来てください。 研究所のオフィスは青山と福岡にあります。

www.wantedly.com

www.wantedly.com

カテゴリー