HadoopからSparkへの移行

こんにちは。配信/インフラチームの佐々木です。今回は、adstirの集計システムをHadoopからSparkに移行したお話をしたいと思います。以前の構成 adstirでは以前はAWS上のEMRでHadoopを使って集計していました。一つの集計のフローとしては以下のようになりま…
続きを読む

EC2上のMySQLからRDSへの移行

こんにちは。配信/インフラチームの佐々木です。少し前の話になりますが、Bypass(DSP)のRDBをEC2上のMySQLからからRDS(Aurora)に移行しました。データ容量が膨大なためmysqldumpを利用した移行は出来ず、色々苦労しましたのでそう言った点を記載します…
続きを読む

こんにちは。技術開発部・配信/インフラチームの二階堂です。弊社DSP「Bypass」ではDynamoDBを利用しております。今回はその機能の一つであるDynamoDBストリームを紹介したいと思います。 DynamoDBストリームとは DynamoDBストリームはDynamoD…
続きを読む

技術開発部の安井です。前回に引き続き、treeliteの紹介をしたいと思います。今回はtreeliteの予測速度について検証しようと思います。ドキュメント上では2~6倍のスループットが出ると書かれています。この点に関して実際にpython上とgolang上の2つの言語環境で検証し…
続きを読む

こんにちは。技術開発部部長の川住です。弊社DSP「Bypass」はシステムをAWSに移行してから5年以上が経過しました。近年ではEC2インスタンスをVPC (Virtual Private Cloud) 内に作成し運用していますが、AWSへの移行当初にVPC外（EC2-Clas…
続きを読む

はじめまして。技術開発部の安井です。現在は弊社で運営しているDSPにおける広告効果の分析や機械学習モデルの構築/運用を行なっています。 DSPと機械学習詳細なDSPに関する説明は省きますが、DSPではSSPから受け取った広告リクエストに対して以下の事項を決定して広告オークション…
続きを読む

こんにちは。技術開発部・配信/インフラチームの二階堂です。弊社のプロダクトでは連携している効果測定ツールに対して、S2Sで通知を行う場合があります。この通知処理を以前まではEC2上に配置したデーモンプログラムで行っていたのですが、処理の共通化・高速化・インフラ費用削減などの目…
続きを読む

こんにちは。技術開発部部長の川住です。弊社プロダクトにて、「オリジナル画像を適切な大きさに縮小してから読み込む仕組み」を作る必要が生じたので、遅ればせながらLambda@Edgeを使ってみたので、利用時のポイントを紹介したいと思います。 Lambda@Edgeとは？ Lambd…
続きを読む

今週もまた台風が近づいておりますね。初めまして、今年新卒で入社した技術開発部の程です。週末は同僚と登山に行く予定なのに台風直撃の知らせを聞いて下がり気分です。自然ばかりはITの技術だけではどうにもならないので仕方ないですね。さて、私、現在は自社DSP、Bypassの開発に…
続きを読む

こんにちは。技術開発部の赤井橋です。弊社では現在adstirログ基盤のリプレイスを計画しており、その一貫としてAWS Glueでのデータ変換（json → parquet）、及び変換データのAthenaでの検索を試しました。 Glueとは https://aws.amazon….
続きを読む