こんにちは、ZOZOテクノロジーズで機械学習の研究開発をしている松井・真木です。2019 年 9 月末にコペンハーゲンで行われた推薦システムのトップカンファレンスである RecSys 2019 に参加してきたので、本稿では参加報告と気になった論文の紹介をします。
続きを読む
こんにちは。MLOpsチームリーダーのsonotsです。
先日のプレスリリースで発表しました通り、ZOZOTOWNに「類似アイテム検索機能」を追加しました。この機能の技術要素について先日開かれた Google Cloud Next '19 in Tokyo で、本プロジェクトからは2件発表してきました!
技術要素が気になる技術オタクの皆様におかれましては、ぜひ資料と動画をご覧ください!
筆者(そのっつ)の発表になります。発表の概要は以下になります。
ZOZOのAIプロダクトであるZOZO画像検索の概要とアーキテクチャについて紹介します。GKE(Google Kubernetes Engine)とgRPCを使った機械学習APIサーバの構築、Cloud Composerを使った定期的なモデルの更新について話します。特に、Kubernetesを用いてgRPCマイクロサービスアーキテクチャで構築されているHTTP APIサーバを本番レベルに引き上げるために行った工夫について共有します。
筆者は今回はじめてKubernetesを触ったのですが、Kubernetesクラスタを本番レベルに引きあげるために正直な所とても苦労しました。この発表は、まさしく少し前の私が教えて欲しかったものを全て盛りこんだものとなっています。今Kubernetesの検証を進めていて、これから本番導入を考えているタイミングの方に役立つ資料・発表になっていると自負しています。
補足:正式な資料はGoogleから10月に公開されるそうです。ここにはひとまずGoogleに許可をとった資料を載せておきます。正式資料が公開され次第差し替える可能性があります。
Googleの佐藤氏と福岡研究所の西原、家富の発表です。発表の概要は以下になります。
Cloud TPUは、ディープラーニングの学習と推論に特化した回路設計により従来に比べ大幅に高い価格性能比を実現するグーグルのAIプロセッサです。また、低遅延のインターコネクト技術で2048コアのTPUを結ぶCloud TPU Podは、AIスーパーコンピューティング環境を低価格クラウドサービスとして提供。このセッションでは、ZOZOTOWN画像検索プロジェクトでのCloud TPU導入事例を交え、その実力を解説します。
筆者も聴講しましたが、Googleの佐藤氏からTPUの概要を教えていただいた後に、生々しい現場の話をきけて同じ会社ながら非常に参考になるセッションでした。TPUに関してはまだ学習環境だけの利用となっており、本番での定常的な利用はできていないのですが、これから導入されていく予定です。
ZOZOTOWNへの画像検索機能の導入は以前から温めていたアイデアで、ついに満を持してリリースできました。
まだまだ改善は進めていく予定ですし、アレやコレやといった新しいAI案件も抱えています。是非一緒に働きましょう。ご興味のある方は、以下のリンクからぜひご応募ください!
こんにちは! Google I/O 2019から3週間ほど経ちましたが、全国各地でGoogle I/O報告会が行われておりまだまだGoogle I/O熱はまだまだ続きそうですね。 Google I/Oには弊社からも3名(@rllllho, @ysk_ur、山田)が参加しました。 参加レポートはすでに多くあるため、この記事では実際に参加したメンバーがGoogle I/Oのおすすめのセッションをピックアップしてご紹介します!
ZOZO研究所の後藤です。本記事ではGoogle Cloud TPUを使った計量学習の高速化の事例を紹介します。
深層学習を用いたプロダクトを開発・運用する上で、モデルの学習にかかる膨大な時間はボトルネックの1つです。 ファッションにおける深層学習を用いた画像認識技術にも同じことが言えます。 今回はファッションの分野において定番のタスクであるStreet2shopの課題設定に対し、Google Cloud TPUを用いて計量学習の高速化を試みます。 Street2shopは、スナップ画像から商品部分を切り出す物体検出のパートと、切り出した画像と類似した商品を検索するクロスドメイン画像検索のパートに分けられます。 今回の取り組みでは、後者のパートで利用する画像間の距離を測るためのモデルの学習の高速化を行います。
続きを読む
(Icon Credit *1)
こんにちは。スタートトゥデイ研究所の後藤です。
今回は、集合を入力として扱うネットワークモデルの紹介をしたいと思います。機械学習の多くのモデルは、固定長の入出力や順序のある可変長の入出力を扱うように設計されます。画像データやテーブルデータは各サンプルの入出力の次元を合わせて学習しますし、自然言語処理のコーパスや時系列データは入出力の順序を保持して利用します。
その一方で、可変長で順序のない集合データを扱うモデルの研究は最近になって取り組み始められたばかりです。我々が研究しているファッションの領域において、入力データを集合として扱いたくなる状況がたびたびあるため、理解を深めておきたい問題設定です。
続きを読む
スタートトゥデイ研究所リサーチャーの中村です。 今回は、コーディネートからスタイルを自動抽出する技術に関するアイデアの紹介です。こちらは、企業研究所による研究発表カンファレンス (CCSE2018)でも同様の内容で発表させていただきました。 そのときに使用した資料はこちらです。
続きを読む
データサイエンティストの中村です。
webで発生するトランザクション(購買など)の中には、確率分布を仮定することで抽象化できる物があります。
今回は、トランザクションが発生する現象をモデリングする手法のひとつであるBG/NBDモデルと、この手法にもとづいて将来発生するトランザクションの回数を予測するためのライブラリであるlifetimes
を紹介します。