運用改善

Kubeflow PipelinesからVertex Pipelinesへの移行による運用コスト削減

こんにちは、技術本部 データシステム部 MLOpsブロックの平田(@TrsNium)です。約2年半ぶりの執筆となる今回の記事では、MLOps向け基盤を「Kubeflow Pipelines」から「Vertex Pieplines」へ移行して運用コストを削減した取り組みを紹介します。 目次 目次 …

AWSで構築するSelenium自動テスト環境とその運用

はじめに こんにちは、Selenium 4の正式版がなかなかリリースされなく、ソワソワしている品質管理部・自動化推進ブロックの木村です。 私が所属する品質管理部は、ZOZOTOWNやWEARなどの開発プロジェクトに対してテスト・検証を行い、完成品がユーザーの手に…

Istioサーキットブレーカーで備えるマイクロサービスの連鎖障害

はじめに こんにちは。SRE部 ECプラットフォームSREチームの大澤です。 先日、SREチームにてBFF機能を司る「ZOZO Aggregation API」の導入について紹介しました。 techblog.zozo.com BFFは複数のバックエンドと通信するアーキテクチャであるため、通信先のバ…

トラブルの原因特定率を劇的に向上させるSQL Serverロギングの仕組み作り

SQL Serverにおいて詳細な後追い調査を実施するために整理しておくと良い情報収集の仕組みをご紹介します。

GitHub Actionsとtfupdateを使ってTerraformおよびTerraform Providerのバージョンアップを自動化する

はじめに こんにちは。SRE部MLOpsチームの築山(@2kyym)です。 Infrastructure as Code(IaC)が一般的になり、またパブリッククラウドをフル活用したインフラ構築が当たり前となりつつあります。そんな中で、インフラの構成管理にTerraformを用いているチ…

マルチAZ化から学んだ無停止でインフラを変更するために考慮すべき3点

はじめに こんにちは。ブランドソリューション開発部の蔭山です。普段はFulfillment by ZOZO(以下FBZ)というサービスを担当しています。FBZはZOZOTOWNの倉庫や物流システムをブランドさんの自社ECでご利用いただけるサービスです。 先日、FBZが稼働してい…

【オンラインMeetup イベントレポート】マイクロサービス化に取り組む、16年目のZOZOTOWN

こんにちは、ZOZOテクノロジーズ 技術戦略室の池田(@ikenyal)です。 ZOZOテクノロジーズでは、7/28にZOZO Tech Meetup〜マイクロサービス化に取り組む、16年目のZOZOTOWN〜を開催しました。 zozotech-inc.connpass.com 本イベントでは、ZOZOテクノロジーズ…

Flex Slotsを用いたBigQueryのコストパフォーマンス改善と運用

こんにちは、SRE部の谷口(case-k)です。私たちのチームではデータ基盤の開発や運用をしています。1年ほど前からBigQueryのコストパフォーマンス改善を目的にFlex Slotsを導入しています。 本記事ではFlex Slotsの導入効果や運用における注意点、ワークフロ…

ZOZOTOWN検索機能のマイクロサービス化への取り組み

はじめに こんにちは、検索基盤部 検索基盤チームの可児(@KanixT)です。以前は通勤に片道2時間ほどかかっていましたが、フルリモートワークの環境になり空いた時間で生後4か月の娘の子育てに奮闘中です。 本記事では、検索基盤チームが取り組んだZOZOTOWN…

WEARの画像アップロード機能リプレイスによるパフォーマンスと運用保守の効率化

こんにちは、WEAR部 運用改善チームの三浦です。普段は WEAR の運用改善を行っていますが、最近は新規プロジェクトの開発にも携わっています。 本記事では、WEARのS3への画像アップロード機能をインフラ・バックエンド両面からリプレイスを行い、パフォーマ…

使い勝手の良いSplunkダッシュボードの作り方

こんにちは。EC基盤本部 SRE部の渡邉です。去年の今頃はリモートワークによる運動不足を解消するために毎朝ロードバイクで走っていたのですが、3か月目に突入したころ急に飽きてしまいました。継続することの大切さを痛感しています。 さて、以前公開した記…

KubeflowによるMLOps基盤構築から得られた知見と課題

はじめに こんにちは。SRE部MLOpsチームの中山(@civitaspo)です。みなさんはGWをどのように過ごされたでしょうか。私は実家に子どもたちを預けて夫婦でゆっくりする時間にしました。こんなに気軽に実家を頼りにできるのも全国在宅勤務制度のおかげで、実家…

React + microCMSで実現するZOZOTOWNキャンペーンページのノーコード化

ZOZOTOWNではキャンペーンページを高頻度で公開しています。このページ作成のノーコード化をReactとmicroCMSを用いて実現しましたのでご紹介します。

AWXを用いたZOZOTOWNオンプレミス環境における自動化の取り組み

こんにちは、SRE部ZOZO-SREチームに2020年新卒入社した秋田です。普段はZOZOTOWNのオンプレミスとクラウドの運用・保守・構築に携わっています。 ZOZOTOWNのオンプレミスは17年の歴史があり、BIG-IP、FortiGate、vSphereなどの様々なベンダーの製品が稼働し…

KamonによるAPM導入 - Akka gRPCを用いたScalaアプリケーション編

計測プラットフォーム部バックエンドチームの鈴木です。 この記事では、Akka gRPCを利用しているScalaアプリケーションのZOZOMATに対してKamonを通じてAPMを導入した際に得られた知見、うまくいかなかった内容やその対応策を紹介します。

リアルタイムマーケティングシステム検証環境の構築ビフォーアフター

はじめに こんにちは。2020年5月に入社しましたMA基盤チームの辻岡です。 MA基盤チームでは、マーケティングに関わる様々なプロダクトやシステムの施策開発・運用を行っています。その中の1つにリアルタイムマーケティングシステムというものがあります。 こ…

CloudFormation Resource ImportによるRDSバージョンアップ時の定義差分を解消する一手法

こんにちは。ZOZOテクノロジーズSRE部の西郷です。普段はAWSを用いてマルチサイズプラットフォーム事業(以降MSPと記載します)のシステム構築や運用に携わっています。 このMSPのシステムではRDBにAmazon Aurora PostgreSQLを採用しています。DBを含むネッ…

Splunkのアクセスログ解析でWEARのAPIを201件(約5万行)削除した話

こんにちは、WEAR部運用改善チームの佐野です。 私たちのチームでは、WEARの日々の運用業務を安全かつ効率的に行えるよう改善をしています。今回は、年初から行っていた不要APIの削除作業についてご紹介します。 背景 残念なことに長い間WEARでは不要になっ…

カテゴリー