カテゴリーアーカイブ: デジタル広告

Googleの新しい広告システム「FLoC」はどのような仕組みで動作するのか?

サードパーティーCookieに代わる広告の仕組みとして開発が進められているGoogleのAPI「FLoC」は、OracleVivaldi電子フロンティア財団などからその内容が批判されています。なぜGoogleがFLoCを開発しようとしているのかや、実際にFLoCはどのような技術なのかという、その仕組みをエンジニアの大津繁樹氏が解説しています。

◆なぜFLoCが開発されているのか?
FLoCは、規制対象となっているサードパーティーCookieの代わりとなる、新しい広告の仕組みの1つをいいます。

既存のデジタル広告は、インターネットにおけるユーザーの行動を広範に追跡し、ブラウジング履歴などから属性・所在地・興味・関心を割り出して、それらの情報を基に広告を表示する「行動ターゲティング」という手法を用いています。この行動ターゲティングを行う上で必要不可欠なのが、サードパーティーCookieです。

しかし、上記のような手法はユーザーのプライバシーを侵害することから、近年、サードパーティーCookieは規制対象となっています。このため、世界最大の広告企業としてサードパーティーCookieを中心に据えた広告システムを構築してきたGoogleは、新たに、サードパーティーCookieを利用しない仕組みを構築する必要性に迫られました。

この新しい広告の仕組みを提案・開発・実験しているのが、プライバシーサンドボックスです。プライバシーサンドボックスでGoogleは、サードパーティーCookieを利用しないことに加え、フィンガープリントといった個人の特定につながる技術を利用したり、個人の追跡を行ったりしないことを明言しています。

プライバシーサンドボックスではこれまでに複数の提案が行われてきましたが、FLoCは新しい仕組みとして有望なAPIだと考えられ、Chrome 89からテストが行われています。

◆FLoCとは?
FLoCはFederated Learning of Cohorts(連合学習のコホート)の略ですが、Chrome 89のオリジントライアルの中では、連合学習は利用されていないとのこと

2021年5月時点ではChrome 2.1版のFLoCでテストが行われていますが、このFLoCについての技術は以下の通り。なお、FLoCはまだ開発中であり、今後、これらの技術は変更されていく可能性があるとのことです。

◆FLoCの技術の詳細はこんな感じ
簡単に説明すると、FLoCはユーザーを数千人単位のグループ(コホート)にわけて、コホートIDを割り当てるというもの。一般的に、デジタル広告は以下3つの情報を組み合わせて表示されますが、FLoCは(2)のために利用されます。

(1)ファーストパーティーCookieおよびコンテンツの情報
(2)何に興味を持つ人が広告を見るかといった一般的な情報
(3)ユーザーの取った特定の行動

サードパーティーCookieを利用したデジタル広告の場合、ユーザー個人の行動や情報を第三者企業が知り、分析やターゲティングに利用することができます。しかし、FLoCではユーザーの閲覧行動をブラウザ内の処理で数値化し、それを数千人単位のグループにまとめた状態で行動ターゲティングに利用するため、第三者企業がユーザー個人の情報にアクセスすることはありません。この方法であれば、今よりもユーザーのプライバシーに配慮し、かつ既存のシステムと同様に行動ターゲティングの効果を上げることができると考えられています。

大津氏はChromeのFLoCアルゴリズムをGoに移植したFLoC Simulatorを作成。FLoCの処理を以下のようにまとめています。

FLoCとはなにか – ぼちぼち日記
https://jovi0608.hatenablog.com/entry/2021/05/06/160046

GitHub – shigeki/floc_simulator: FLoC Simulator
https://github.com/shigeki/floc_simulator

FLoCの処理は大きく分けて、以下の4つから構成されているとのこと。

1.navigation時にFLoC対象のページ履歴にフラグを付ける
2.7日間に一回、履歴からSimHashを計算し、Chrome SyncでGoogle側に送る
3.(FLoCバージョンで1回実施) Google側でユーザのSimHashをまとめ上げてクラスター化する。ブロックするCohort Idを特定し、クラスターファイルを生成し、全Chromeユーザーへ配布する
4.サイトのFLoC APIの実行に伴い、SimHashとクラスターデータから Cohort Id を計算し、出力する

図にするとこんな感じ。

1:navigation時にFLoC対象のページ履歴にフラグを付ける

FLoCはユーザーが訪れた全てのウェブページをもとにユーザーコホートを作成するわけではなく、ウェブページが以下3つの条件すべてを満たした場合に、ユーザーの閲覧履歴にあるウェブページにフラグをつけて計算対象にします。

1.navigation の IP がPublicルーティング可能であること
2.メインドキュメントの permission policy がFLoCを許可していること
3.広告が表示されているページ、又は FLoC API (document.interestCohort()) が実行されているページであること

特に「1」は、プライベートIPを持つ内部Proxyを経由してインターネットアクセスがあった場合、FLoCの対象外となる可能性があることを示しています。また、GitHubWordPressといったウェブサービスはFLoCをブロックすることを表明しており、全てのウェブサイトにおいて行動ターゲティングが可能になるわけではない模様。

そして、フラグがつけられたウェブページのドメインが、 SimHash値に変換されます。

2: 7日間に一回、履歴からSimHashを計算し、Chrome SyncでGoogle側に送る

SimHashは、似ているデータを近いハッシュ値に変換するLSHの一種です。SimHashを使うと、ブラウザの閲覧履歴に並ぶドメイン情報がランダムな数字に変換され、かつ傾向の近いドメイン群は近似値になります。またSimHashは膨大なユーザーデータを一定の小さなサイズに変換できるというメリットも持ちます。

さらに細かくいうと、SimHashはいくつかのランダムなベクトルを用意し、ユーザーデータとランダムベクトルとの角度の関連性から、データの類似性を導きだし、低ベクトルにサイズを減らします。

例えば以下の場合、左図ではUserAもUserBも赤い波線上部のエリア(1のエリア)に位置するのでSimHash=1となります。中央図では、UserA・UserBともに赤い波線における1のエリアかつ緑の波線の0のエリアに位置するのでSimHash=10、右図ではUserA・UserBともに赤い波線と緑の波線における位置は同じですが、青い波線に対してはそれぞれ0・1という異なる位置にあるため、UserAはSimHash=100、UserBはSimHash=101となるわけです。このように表現することで、ユーザーの閲覧履歴という情報を、1~3bitという小さいサイズで表示することが可能になります。

FLoCでは、50個のランダムベクターを使い、ユーザ履歴の情報を50bitのSimHashに変換させるとのこと。

ユーザー履歴の情報をSimHashに変換したとしても、同じSimHashを持つユーザーが少ない場合、個人が特定される恐れがあります。また、センシティブなカテゴリーの割合が多いユーザー履歴では、センシティブな情報に偏ったコホートIDが生成されてしまうという問題もあります。

このためFLoCでは、ユーザ履歴やプロファイルなどをGoogleアカウントと一緒に同期するChrome Syncの仕組みを利用して、SimHash値をGoogleサーバーに送り、グループ化(クラスター化)させます。

3: Google側でユーザのSimHashをまとめ上げてクラスター化する

グループ化 の際、Google側の処理は、以下2つに分けられるとのこと。

1.ユーザから送られたSimHash値をソートし、2000人以上のユーザを含むようにSimHash群に分割する。SimHashの分割群に対して小さい順にIdを割り振りCohort Idとする。
2.Cohort Id 内に含まれるドメインを洗い出し、「経済状況」や「アイデンティティ」といったセンシティブなカテゴリーを含む割合が平均より10%以上大きければそのCohort Idに対して blocked のフラグを付ける。

つまり、記事作成時点ではSimHashを集めてソートして分割しているだけなので、機械学習(教師あり学習)を利用していません。このためFLoCは「Federated Learning of Cohorts」の略称ではあるものの、「Federated Learning(連合学習)」は行われていないという理解になります。

そしてGoogleが以下のように、ソート・分割したSimHash群と、コホートIDの対応表を作成し、このデータがクラスターファイルとして全Chromeユーザーへ配布されます。

4:サイトのFLoC APIの実行に伴い、SimHashとクラスターデータから Cohort Id を計算し、出力する

クラスターファイルを配布されたユーザーのブラウザは、自身のSimHash値と上記の対応表を照らし合わせて、コホートIDを計算します。そして広告が表示されるウェブサイトでFLoC APIが実行されると、ブラウザのコホートIDを提供します。

コホートIDは上記の通りユーザーの閲覧履歴に基づく興味・関心をベースとしているので、コホートIDに基づいて表示される広告は、ウェブサイトのコンテンツそのものとの関連性ではなく、過去に訪れたウェブサイトとの関連性が高くなり、広告パフォーマンスを高めることができると考えられているわけです。

以下の広告媒体資料のパスワードを入手するにはここをクリック

AdobeがサードパーティーCookieなしのターゲティングを可能にする「Real-Time CDP」について発表

サードパーティーCookieの規制が増加するなかで、「サードパーティーCookieに依存せず、パーソナライズされた広告を配信する仕組み」が強く求められています。Googleは独自の広告システム「プライバシーサンドボックス」でその仕組みを開発中ですが、一方でAdobeはファーストパーティーデータを使った広告配信システム「Real-Time CDP」について発表しました。

アドビ、業界初のファーストパーティデータ指向型 次世代Real-Time CDPを発表
https://www.adobe.com/jp/news-room/news/202104/20210428_adobe-announces-industry-first-cdp-architected-for-first-party-data.html

Adobe pitches at first-party customer data challenge, marketing workflow with latest tech releases – CMO Australia
https://www.cmo.com.au/article/688031/adobe-pitches-first-party-customer-data-challenge-marketing-workflow-latest-tech-releases/

Adobe wants to replace the cookie – Techzim
https://www.techzim.co.zw/2021/04/adobe-wants-to-replace-the-cookie/

近年はサードパーティーCookieの使用が規制される方向にあることから、Googleは2019年に「2年以内にChromeにおいてサードパーティーCookieを廃止する」と発表しており、新APIFLoC」を始めとする新しい広告システムを開発しています。

サードパーティーCookieの利用が問題となったのは、サードパーティーCookieがインターネットユーザーの行動を広範に追跡し、ターゲティング広告を表示するため。このため、新システムは「ファーストパーティーデータ」を使った広告配信を行うことを想定しています。

ファーストパーティーのデータを使った広告配信は、AppleのApp Tracking Transparencyでも予定されており、今後の広告システムの中心となるとみられています。ところが2019年4月の調査では、多くの企業がファーストパーティーのデータを活用しきれていないことが判明しています。

What Are Advertisers’ Challenges With Using First-Party Data? – Insider Intelligence Trends, Forecasts & Statistics
https://www.emarketer.com/content/advertisers-struggle-first-party-data

Adobeが提供するReal-Time CDPは、顧客企業と提携し、ファーストパーティーデータを軸にサービスを展開していくとのこと。Adobeのアニール・チャクラヴァーシー氏はReal-Time CDPが、顧客の期待する「個人情報のコントロールとパーソナライズされた顧客体験」の両方を提供するとしています。

具体的にReal-Time CDPの機能として発表されているのは以下の5つ。

◆1:ファーストパーティーデータの一元化
ファーストパーティーデータは、行動データ・属性データなどさまざまなものを含みます。Real-Time CDPは企業がさまざまな種類のファーストパーティーデータを集約し、より完全な顧客像を形成するために役立つとのこと。具体的には、ウェブサイトの閲覧履歴、ブランドサイトに登録した顧客のメールアドレスや電話番号を含むファーストパーティーのウェブデータ、アプリデータ、媒体から提供されたメディアデータを組み合わせることが可能です。

このように一元化されたデータをテスト&ターゲティングアプリケーションAdobe Targetで利用することにより、企業は顧客体験をパーソナライズできるとAdobeは述べています。

◆2:機械学習を活用したリアルタイムのパーソナライゼーション
電子メールや電話番号などの登録をユーザーに促すのは、ブランドサイトにとって難しいもの。しかしReal-Time CDPを使うと、ユーザーとのやりとりに基づき「見込み客のプロファイル」を作成可能に。このプロファイルをAdobe Targetに渡すことで、コンテンツをリアルタイムに編成し、顧客にあわせて登録画面を表示させるタイミングを調整するなど、パーソナライズされた顧客体験を提供できるとのことです。

◆3:セグメントマッチ
セグメントマッチは、企業が他社とのパートナーシップによってファーストパーティーデータセットを拡張できるというもの。たとえばアパレル企業がジュエリーブランドとマッチングすることで、「アパレルサイトでドレスを購入した顧客に最適なアクセサリーをオススメする」といったことが可能になります。

◆4:類似(look-alike)セグメント
これは、既存顧客と似た属性を持つ顧客を特定し、その顧客グループを自社データに追加するというもの。「例えば、特定の既存顧客をサンプルとして指定すれば、ブランドのデータベースの中から同様の特徴を持つ別の顧客で構成される、類似セグメントを構築することができます」とAdobeは述べています。類似セグメントはセグメントマッチと合わせて使うことも可能です。

◆5:B2B企業の新しい顧客体験管理
Real-Time CDPにはB2B版も存在します。個人と法人のプロファイルを統合し、B2B企業であってもB2C企業のように施策を行うことが可能になるとのことです。

IDGの研究ディレクターであるGerry Murray氏はAdobeのReal-Time CDPについて、「顧客は、いつ・どこで・どのように・誰とやりとりするかに関係なく、ブランドが1つのものとして機能することを期待しています。これを実現するための唯一の方法は、AdobeのReal-Time CDPのようなソリューションを使用して、企業が組織あるいはアプリごとに分かれたデータを解放し、顧客データを作成することです」とコメント。顧客体験の向上は、データインフラによるサポートなしで行えないことを示しました。

またAdobeのGabbi Stubbs氏は企業間の提携やコラボレーションが増加していることに言及。2023年までには、単なるデータ管理ではない「データ共有戦略」がビジネスで成果を生み出すようになることを示唆しました。

「私たちはセグメントマッチをデータコラボレーションの次なるレベルの革新とみています。これは私たちのサードパーティーCookieレスな将来の戦略の一部です」とStubbs氏は述べています。

以下の広告媒体資料のパスワードを入手するにはここをクリック

デジタル広告への支出は2020年に12%増加、Amazonが怒涛の勢いで成長中

by Ivan Radic

企業の広告費は景気に大きく左右されるため、2020年は新型コロナウイルス感染症(COVID-19)が流行した影響で広告費が縮小すると予測されました。しかし、実際にはそんな中でもアメリカにおけるデジタル広告に対する出費は過去最大となったことが判明。Google・Facebook・Amazonという広告大手が市場の独占をさらに強めたほか、これまで以上にAmazonが躍進していることもわかりました。

2020/2021 IAB Internet Advertising Revenue Report
https://www.iab.com/insights/internet-advertising-revenue-report/

Amazon’s share of the US digital ad market surpassed 10% in 2020 – Insider Intelligence Trends, Forecasts & Statistics
https://www.emarketer.com/content/amazon-s-share-of-us-digital-ad-market-surpassed-10-2020

Digital ad spend grew 12% in 2020 despite hit from pandemic
https://www.cnbc.com/2021/04/07/digital-ad-spend-grew-12percent-in-2020-despite-hit-from-pandemic.html

Amazon Surpasses 10% of U.S. Digital Ad Market Share – WSJ
https://www.wsj.com/articles/amazon-surpasses-10-of-u-s-digital-ad-market-share-11617703200

オンライン広告における技術的標準規格の策定や動向調査を行うIAB(Interactive Advertising Bureau)の調査報告によると、2020年のデジタル広告に対する支出は前年比で12.2%増加したとのこと。2020年の前半はCOVID-19の影響で旅行業界を始めとする多くの企業で売り上げが激減し、広告に対する出費も全体的に低下しましたが、2020年後半にはホリデーシーズンの盛り上がりとアメリカ大統領選の政治広告により、広告への支出が増加。年間で1398億ドル(約15兆円)の支出となりました。

ただし、これらの支出先は、GoogleやFacebookといった一部の大手広告企業に集中する傾向がみられます。IABによると、2020年における広告企業上位10社の広告売上高は合わせて1090億ドル(約11兆円)以上で、全体売上のほとんどを占めています。また2018年には上位10社の売り上げが全体を占める割合は75.9%でしたが、2019年には76.6%、2020年には78.1%となったとのことです。

上位企業の中でも特に成長が大きいのがAmazon。Amazonのデジタル広告市場における2020年のシェアは、2019年の7.8%から増加して10.3%となりました。デジタルマーケティングの市場調査会社であるeMarketerは、アメリカAmazonの2020年度の広告収入が、2019年から52.5%増加した157.3億ドル(約1兆7200億円)に上るとみています。

以下は左が2019年、右が2020年の広告収入の市場シェア。GoogleとFacebookがやはり圧倒的ですが、Amazonもそれに続いて収入を伸ばしています。

eMarketerのレポートによると、Amazonの広告収入の90%はAmazon.comに表示された広告によるものであり、スポンサー製品やブランドの検索広告が収入の大部分を占めるとのこと。またAmazon.comの広告に比べれば額が小さいものの、Fire TVやTwitch、IMDb TVといったサービスでの広告収入も大幅に成長しているそうです。

特に、Amazon.comに関して、2020年は都市封鎖などの影響で需要が増加し、Amazonマーケットプレイスの小売業者を含む、多くの人が在庫不足という問題を抱えました。しかし、これまでランキング上位に表示されていた小売業者が在庫不足になるということは、他の業者にとっては追い上げのチャンスとなります。Amazon.comの広告はこのような背景で多く利用されたとみられています。

2021年、アメリカAmazonの広告ビジネスは30.1%成長し、2020年第4四半期の予測を上回る200億ドル(約2兆2000億円)の収入を記録すると推測されています。また2023年までには収入が300億ドル(約3兆3000億円)に上る見込みだとeMarketerは示しました。

一方で、GoogleはAmazonにシェアを奪われる傾向にあり、2023年までには、2020年時点で28.9%あるシェアが26.6%になるとeMarketerは予測しています。またGoogleはサードパーティーCookieの廃止を受け、新たな広告システムの構築を余儀なくされているという点でも、今後の成長の持続性が疑問視されているとのことです。

以下の広告媒体資料のパスワードを入手するにはここをクリック

App Tracking Transparency(ATT)とは何ですか?

App Tracking Transparencyは、Appleが発表したプライバシー強化のための新しいポリシーおよびフレームワークのことを言います。

AppleはiPhoneやiPadといった端末に「IDFA」と呼ばれる広告識別子を割り当てています。IDFAはユーザーの「アプリ内のどの広告をクリックしたのか」「何に対して支払いを行ったのか」という行動を追跡するために使われるもの。このような追跡は、ユーザーに効果的な広告を表示することを目的としています。

しかし、上記のような追跡は、ユーザーのプライバシーを侵害することから近年は問題視されるようになってきました。そこでAppleはiOS 14.5から、アプリの開発企業や広告会社などがIDFAを使う時には、事前にユーザーの許可を必要とする形に、運用を変更すると発表。新しい運用で開発者が利用することになるフレームワークがApp Tracking Transparencyと呼ばれます。

Appleの開発者向けウェブページでは、「あなたのアプリがエンドユーザーのデータを集めて、アプリとウェブサイトを横断した追跡を目的としてデータを他企業と共有したい時は、App Tracking Transparencyのフレームワークを使わなければなりません」と記されています。

App Tracking Transparency | Apple Developer Documentation
https://developer.apple.com/documentation/apptrackingtransparency

アプリ開発者はApp Tracking Transparencyに備えて、自身のAPISDKを確認しユーザーにIDFAの使用許可を求めることができるかを確認すると共に、利用しているサードパーティーのSDKやAPIについても確認すべきとのこと。サードパーティーのコンポーネントがユーザーの許可無くIDFAにアクセスしようとすると、アプリ自体がバンされる可能性があります。

なお、AppleはIDFAを使わずに広告キャンペーンの効果を測定するためのツールとして、SKAdNetworkを公開しています。

SKAdNetworkについてはここから確認可能です。

以下の広告媒体資料のパスワードを入手するにはここをクリック