パーソナライゼーションを必要とする大規模なユーザ・ベースを持つあらゆるWebアプリケーションは、ユーザ・プロファイルから始まります。
実際、ユーザー・プロファイル・ストアは、NoSQLキーバリュー・データベースの最初の「キラー・アプリケーション」の1つです。
なぜなら、大規模なユーザー・ベース(数十万から数百万のユーザー)へのサービスは、「インターネットをブレイクさせた」(あるいは、少なくともリレーショナル・データベースをブレイクさせた)最初の課題の1つだったからです。
ユーザー・プロファイル・ストアが数百万、数十億、そして現在では数兆レコードに及ぶため、即座にレスポンスを得るには、リアルタイム・データ・プラットフォームに独自の機能セットが必要になります。
ユーザー・プロファイル・ストアの新しい要件
ユーザー・プロファイル・ストアは、小売業やeコマースで消費者との効果的なエンゲージメントを強化するために使用される行動属性と組み合わされた、現在、過去、および派生するユーザー/消費者データで構成されます。
しかし、ユーザー・プロファイルへの高速アクセスに依存する業界は多岐にわたります。
銀行、電気通信プロバイダー、eコマース企業、小売業者に対するユーザー/消費者の期待は非常に高いです。
ユーザーがウェブサイトを訪問したとき、そのユーザーをどのように取り込むのがベストかを判断する時間は一瞬しかありません。
彼らは以前あなたのサイトを訪れたことがあるのか?なぜ戻ってきたのか?何かを買いたいのか?返品したいのか?苦情を申し立てる?以前の訪問のフォローアップ?
コンピュート・パワーとワークロードに関しては、以下のようなデータがあります:
- Xander (formerly AppNexus) :Visa、Nasdaq、ニューヨーク証券取引所が1ヶ月に行うトランザクションよりも多くのトランザクションを1日で実行。ほとんどの月で100%の稼働率。
- Adobe :ユーザー・エクスペリエンス・プラットフォームは、1秒間に10万件のイベントを処理し、イベントごとに1000から1万件のセグメント評価を実行。エッジでのレイテンシは100ミリ秒以下である必要がある。
- The Trade Desk :1日あたり8000億のクエリーを処理。1秒あたり1000万のクエリーを8ミリ秒以下のレイテンシーで処理。
このような要件を考えると、ユーザー・プロファイル・ストアに対するデータベース・ビジネス要件には、大規模で継続的に更新されるデータセットに対するリアルタイムのオペレーション、24時間365日の可用性、ビジネス・システムとの容易な統合、何千もの連鎖的なデータベース・インタラクションを同時に処理できる拡張性などが含まれます。
アドテクノロジーの変革: 5ナインでは不十分な場合
多くのアドテクノロジーのユースケースでは、ユーザーについて可能な限りすべてを発見し、アルゴリズムのルールを適用して、わずか数ミリ秒でレスポンスを決定、構築、レンダリングする必要があります。
このようなユーザー情報は、インターネットアクセスパターン、個人データ、ショッピング習慣、クレジットスコア、デモグラフィックなどを含むCookieストア(まもなく廃止予定)に存在します。
このクッキー・ストアにアクセスし、意思決定エンジンとレンダリング・エンジンに供給するために、1つのインバウンド・トランザクションが何百、あるいは何千もの連鎖的なデータベース・インタラクションをもたらすかもしれません。
来るべき「クッキーの黙示録」について多くのことが語られていますが、アドテックは、アドテックの基盤技術であるユーザープロファイルストアの究極の実験場として際立っています。
アドテックとゲームソリューションのグローバルディレクターであるダニエル・ランズマン氏によると、「アドテックでは、ユーザープロファイルストアはアイデンティティのすべてです。」と述べています。
アドテクノロジーのIDワークロードについて多くの人が気づいていないのは、それが地球上で最も過酷なリアルタイムのワークロードであるということです。
ある企業は、1日に約100億から120億のトランザクションを処理しています。
また、1秒間に5,000万件のクエリを処理しているという企業もあります。
AppNexus:現在マイクロソフトの傘下にあるAppNexusのSVP兼GMであるティモシー・スミス氏は、「私が考えたいのは、私たちはVisaやNasdaq、NYSEが1ヶ月で処理する量を1日で処理しているということです」と語りました。
「世界の株式市場に話を戻すと、24時までに7つの市場が閉まることはありません。終業のベルもなければ、オフラインで計画を立てる時間もない。常に稼働させ続けなければならないのです。だからこそ、稼働率100%対99.999%が目標なのです。毎日少なくとも99.9(ダウンタイムは86.4秒)を提供できなければ、本当に大変なことになります。そして通常は99.99(これは8.64秒)で、多くの月は100%です。年間を通して100%ではありませんが、かなり近いです」。
アイデンティティ・グラフとAdobe Experience Platform
企業がユーザーや顧客を追跡する方法の性質は、予想外の方法で拡大しています。
先日開催されたAerospike Summitで、Adobeのエンジニアリング担当副社長であるSandeep Nawathe氏は、Adobe Experience Platformを通じて顧客にリアルタイムサービスを提供することについて語りました。
エクスペリエンス・プラットフォームのアーキテクチャの一部は、IDの解決です。
大規模なユーザー・ベースとのやり取りを必要とするユースケースには、ユーザー・プロファイル・ストアが必要です。
しかし、データ量が膨大なため、必要な結果を瞬時に得るためには、データをリアルタイムでセグメント化する必要があります。
Adobeでは、1秒間に10万件のセグメンテーション・イベントが発生し、イベントごとに1000から1万件のセグメント評価が行われるピークを観測しています。これらのイベントは、エッジで100ミリ秒以内に処理される必要があります。
ユーザープロファイルのマルチモデル化
ユーザー・プロファイル・ストアは、高速で効率的なキー・バリュー・データ・モデルによってうまく機能し始めたものの、プロファイル自体の性質も変化しています。
AdobeのNawathe氏も、1つのユーザー・プロファイルが最大20の異なるデータセットを必要とする可能性があり、1人のユーザーがアイデンティティ・グラフで表現するために最大50の個別のアイデンティティを必要とする可能性があることを説明しました。
アイデンティティ・グラフは、特にウェブ・クッキーが過去のものになれば、アイデンティティの解決とターゲティングの異なる方法のために、アドテクとマーテクが必要とするテクノロジーの次の波の1つとして人気が高まっています。
AdobeとPaypalはAerospike Databaseを使って独自のアイデンティティ・グラフを実装していますが、エアロスパイクが最近、Aerospike Graphという形でグラフ・データモデルとグラフ・クエリのサポートを追加したことは、よい機会です。
顧客と関連付けられる新しいデータセットが常に追加されるため、ドキュメントモデルも便利になるでしょう。
さまざまなデータモデルをサポートするために、ベストオブブリードを追求するか、マルチモデルアプローチを追求するかについては、各自で結論を出していただきたいですが、グラフ、キーバリュー、ドキュメントデータにAerospikeを使用することには大きな利点があります。
Aerospike Real-time Data Platformは、拡張性、効率性、低レイテンシー、低TCOを実現しています。
TransUnionとIDデータ検証/照合
Signal社(TransUnion社が買収)は、ID解決プラットフォームを開発しました。
このプラットフォームは、オンライン、CRM、オフラインのソースなど、膨大な量のデータを持つマーケティングチームによって使用されます。
これらのデータをすべてTransUnionのTruAudienceプラットフォームに取り込み、インターネット上の既存顧客をターゲットにするために使用することができます。
Signal社は、ビジネス・プロセスの事実上すべての要素を遅らせるレイテンシの問題から、既存のデータ・ストアを置き換えました。
Aerospikeが魅力的であった主な要因は、総所有コストが、我々が評価した競合製品よりもはるかに低かったことです。
– Transunionの元エンジニアリング担当副社長、Jason Yanowitz氏
初期導入時、Signal社は毎秒800万件のトランザクションをテストし、p50が10マイクロ秒であることを確認しました。
p99は3,900ミリ秒から23ミリ秒に短縮され、システム全体の信頼性も向上しました。また以前は6日かかっていた処理が14時間で済むようになり、3時間かかっていたものが3分で済むようになったのです。
結論
エアロスパイクは、アドテクノロジー分野で活躍する多国籍企業の多くに導入されています。
Aerospikeは、1秒あたり数百万、1日あたり数十億という規模のユーザープロファイル、不正検知、ID解決業務の奔流に耐えることができます。 すべての人がそのような規模で作業する必要はありませんが、ほとんどすべての人がデータベースでIDを管理し解決するという課題に取り組んでいます。
最適なユーザー・プロファイル・ストアと即時のID解決は、ほとんどの大規模ウェブ・アプリケーションにとって基本的な課題です。
この2つの領域は、待ち時間が長くなると、ユーザーがアプリケーションを使い始める前に、ユーザーエクスペリエンスに直接影響を及ぼし、破壊してしまう可能性があります。
上記の企業は、顧客の旅が始まる前に終わらないようにするために、これらの重要なユースケースを強化するためにAerospikeを選択しました。