コード日進月歩

しんくうの技術的な小話、メモ、つれづれ、など

Google Analytics4における高基数ディメンションとは何かをざっくりまとめる

公式のヘルプはピンと来にくいので用語を順に整理する。なおGoogleAnalytics4のことをGA4と略してこの記事内では記述する。

出典元

[GA4] 基数 - アナリティクス ヘルプ

用語別整理

ディメンション

イベントに関するイベントパラメータをGA4で探索できるようにしたものがディメンション。ディメンションに関しては別記事でまとめたので下記参照。

Google Analytics4におけるディメンションのパターンをざっくり整理する - コード日進月歩

基数

ディメンションにおける基数とは、そのディメンションのパターンバリエーションの数ことを指す。たとえば「イベント発生させたユーザの性別」のバリエーションを "男性" "女性" ”その他" とするのであれば3つが基数となる。

高基数ディメンション

GA4では1日の中で記録する基数の数が500以上を超えるものを高基数ディメンションという。

たとえば「商品コード」などをディメンションとして設定したときに、品数が1000点など取り扱うECサイトの場合は高基数ディメンションとなってしまう。

高基数ディメンションは何が問題か

GA4側ではディメンション単位で集約して計算を行うので、多すぎる高基数ディメンションはGA4のUI上からは集計ができないケースが発生する。もし高基数ディメンションを使ってグルーピングなどしたい場合はBigQueryExportを活用する必要が出てくる。

例外的にユーザを一意に特定する識別子のディメンションとしてはUser-IDという概念を用意してくれており、こちらを使うと高基数にあたる500以上のパターンになっても対応してくれる。

参考リンク