AEROSPIKE

お問い合わせ
< BLOGに戻る

グラフデータで完璧なゴールデンレコードを実現

  • Twitter
  • Facebook
  • Instagram
  • note
  • Qiita


過去10年間、アドテック業界では、Apple、Mozilla、Googleといった主要なブラウザ提供者によるサードパーティーCookieの廃止に関して、大きな焦点が当てられ、不安や憶測が飛び交ってきました。

アドテック分野での技術的な地位を占めるAerospikeは、この話題に関していくつかのブログを発表しています。

例えば、「AdTech業界におけるアイデンティティの年」、「AdTechにおけるグラフデータベースとシグナルの損失」、「クッキー、ID、そしてその先!」などです。

AppleとMozillaが早い段階(2017年、2019年)で対応を進めた一方で、Googleは長らく抵抗してきました。

Googleは2020年にCookieを廃止する意向を最初に発表しましたが、その実施を何度も延期し、現在はその方針を後退させています。

消費者の追跡や行動の追跡にCookieを使用してきた広告主からの圧力を受けているのです。

しかし、GoogleがCookieの廃止を遅らせているため、今のところCookieの廃止に関して何もしなくてもよいと結論づける人もいるかもしれません。

しかし、それは非常に危険な考え方です。

広告主はすでに、AppleなどによるCookieやデバイスIDの廃止により、オープンインターネットの47%がターゲティングできなくなっている現状に直面しています。

それでも、Googleがこのテーマに関して方向性を何度も変更していることを考えると、最終的にはCookieがなくなる可能性が依然としてあります。

そうなった場合、アドテック企業は、その未来に向けた戦略と方向性を持つ必要があります。

そうしなければ、50%以上の収益損失や、より積極的な競合他社に対する市場シェアの喪失が起こる可能性があると言う人もいます。

最も先見の明のあるアドテック企業は、より広範なソースからのより豊富なデータコレクションを使用して、ターゲットペルソナを識別しモデル化する新しい方法を開発しています。

また、個人のアイデンティティを超えて、製品、ウェブサイト、企業などの他の重要なエンティティをモデル化することにも注目しています。

ユーザーや顧客のアイデンティティの解決は、アドテック企業が顧客が製品、ウェブサイト、企業、その他のエンティティとどのように関連しているかを合理化しようとする中で、ますます高度になっています。

そして、エンドユーザーのシームレスな体験を維持するために、これらの関係をリアルタイムで解決するプレッシャーも高まっています。

ゴールデンレコードを求めて

顧客、企業、または製品に関する情報を含むデータベースは、アプリケーションやチャネル、データストア間で、ますます断片化されサイロ化される傾向にあります。

これにより、マスターデータマネジメントの分野で長年使用されてきた「ゴールデンレコード」と呼ばれるものの作成に対する注目が高まっています。

アドテックの文脈では、ゴールデンレコードとは、エンティティ(ユーザー、顧客、製品等)の統一された、正確で一貫した表現したものを指します。

これは、さまざまなソースのコレクションからデータを集約して、エンティティのより詳細で強力なモデルを作成する包括的なプロファイルです。

しかし、最も重要なエンティティのためのそのゴールデンレコードを作成することは、非常に困難に思えるかもしれません。


ソースデータには、不完全または矛盾した情報を含む異なる記録が存在する場合があり、それらの照合は難航する可能性があります。

例えば、「2nd Avenue」と「2nd Ave」といった住所のような、異なるが同等のデータを解決する実践的な課題もあります。

結果として、関連するレコードをリンクして統一されたビューを作成し、より良い洞察を得ることは容易ではありません。

効果的なエンティティ解決は、効果的な広告ターゲティングとパーソナライゼーションにとって重要になってきています。

すべての重要なエンティティのための豊かなゴールデンレコードを作成することで、広告主はターゲットキャンペーンのためのより正確で関連性の高いオーディエンスセグメントを作成できます。

また、ユーザーの興味と好みにより適合するように広告の関連性を向上させることもできます。

さらに、より正確な指標や測定に基づいてキャンペーンのパフォーマンスを最適化し、広告配信をデータに基づいて調整することが可能になります。

産業規模でのエンティティ解決

アドテック企業やマーケターは、複数のアプリケーションやチャネルを通じて、パーソナライズされたメッセージを消費者に届けるために、より効果的な広告キャンペーンを実施しようとしています。

この課題に対処するため、アドテック企業は、複数のデータベースにまたがる複雑なSQLクエリを使用してカスタムデータ解決プロセスを構築することが考えられます。

また、開発者が機械学習(ML)モデルをトレーニングし、記録のマッチングや不整合の解決を行うこともあります。

しかし、これらのソリューションの構築には数ヶ月かかり、開発リソースを消費し、維持に多くのコストがかかります。

アドテックは、クッキーレスの世界で最先端のエンティティ解決の問題を解決するためのヘッドスタートを必要としています。

そのようなシステムに必要な将来の状態には、以下の体系的な方法が必要です。

  • データの並列化された高速取り込み
  • エンティティレコードを保存するためのグラフデータモデルの使用
  • リアルタイムグラフデータベースからのエンティティデータストレージのリアルタイム配信
  • 異種のデータソースを合理化するためのスケールアウトソリューション
  • ソースレコードの高度なデータレコードパターンマッチング


現在、アドテック企業が利用できる2つの主要技術があります。


1つは、Amazonが提供するエンティティ解決のためのパッケージ化されたクラウドソリューション。

もう1つは、Aerospikeのスケーラブルなマルチモデルデータベースです。

リアルタイムのアイデンティティ解決をキー・バリューデータモデルでサポートし、トランザクショナルグラフデータベースも使用可能です。

また、これらの技術を活用するための計画も必要です。

AWS Entity Resolution

AWS Entity Resolutionは、複数のアプリケーション、チャネル、およびデータストアにわたって保存された関連レコードを照合およびリンクするのに役立つML駆動のサービスです。

AmazonはAWS Entity Resolutionを、エンティティ課題に対応するデータマッチングサービスとして次のように説明しています。

「AWS Entity Resolutionは、複数のアプリケーション、チャネル、データストアに保存された顧客、製品、ビジネス、またはヘルスケアに関連するレコードを簡単にマッチング、リンク付け、強化するのに役立ちます。柔軟で構成可能なルール、機械学習、またはデータサービスプロバイダーマッチング技術を使用して、ビジネスニーズに基づいてレコードを最適化することができます。」


AWS Entity Resolutionの設計者たちは、S3バケットからAerospikeのようなNoSQLデータベースまで、さまざまなストレージオプションをサポートする先見の明を持っていました。

リアルタイムグラフデータのためのAerospike Graph

多くのアドテック企業は、グラフデータモデルを使用して、インターネット全体でのオーディエンスターゲティングを可能にするアイデンティティおよびエンティティ解決に取り組もうとしています。

グラフデータベースは、顧客情報、製品コード、ビジネスデータコードなどの関連するセットを正確にリンクするためのモデルを提供します。

将来的にクッキーが決定的な信号として利用可能になる場合、グラフデータベースと機械学習が、エンティティデータの提供に最も適した技術になる可能性が高いです。

Aerospike Graphは、最も要求の厳しい大規模プロパティグラフデータベースワークロードの要件を満たし、上回るように設計された、開発者向けの高度にスケーラブルなグラフデータベースです。

リアルタイムで混合トランザクションワークロードに応答する能力があり、エンティティデータを表現するためのより表現力のあるグラフデータを提供する手段として役立ちます。

始めてみよう

AWS Entity Resolutionと Aerospike Graphの組み合わせにより、様々なエンティティおよびアイデンティティ解決のユースケースに対して、通常は煩雑な最新のゴールデンレコード作成プロセスがより効率的かつ効果的になります。


本ブログは2024年8月8日「Achieving the perfect golden record with graph data」の翻訳です。

PAGE TOP