HubSpotを導入してしばらく運用していると、ほぼ確実に「データの汚れ」という問題に直面します。重複コンタクトが大量に存在する、無効なメールアドレスが残ったまま配信不達が積み上がる、業種や役職の入力ルールがバラバラでセグメントが切れない、退職者がリストに残り続けている。こうした状態のままワークフローやスコアリングを動かしても、出力される数字は実態を反映しません。マーケティング判断の土台が崩れた状態で施策を回していることになります。
本記事では、HubSpotで運用フェーズに入った企業が継続的に行うべきデータ整備(リストクレンジング)の進め方を、実務手順として整理します。具体的には、整備すべき対象の特定、重複コンタクトの統合、無効メールアドレスの除外、プロパティ標準化、命名規則とリスト管理ポリシー、そして整備を継続させるための運用ルールまでを順に解説します。導入直後の初期設定とは別物の、運用しながら発生し続ける課題への対処法とご理解ください。
目次
なぜHubSpotにデータ整備が必要なのか
このセクションでは、データ整備を後回しにすることで起きる具体的な不利益を整理します。
HubSpotは、コンタクト・会社・取引・チケットといったオブジェクトを軸にしたCRMです。これらのレコードに紐づくプロパティ(項目)の値が、ワークフロー、スコアリング、リスト、レポートのすべての判定材料になります。つまり、データの品質がそのまま施策の品質を決めます。
運用初期は問題が見えにくいのですが、コンタクト数が数千件を超えるあたりから次のような症状が現れます。
- 同じ人物が複数のコンタクトとして登録されており、片方にしか活動履歴が残っていない
- 無効なメールアドレスが大量にあり、配信のバウンス率が悪化、ドメインレピュテーションが下がる
- 業種・役職・従業員規模などの値がバラバラで、ICPに沿ったセグメントが切れない
- 退職した担当者のレコードがアクティブなまま残り、無効な相手に営業メールを送ってしまう
- リスト名・ワークフロー名の付け方が属人的で、誰が何のために作ったか分からない
これらは個別には小さな問題に見えますが、放置するとMQLの判定精度低下、商談化率の低下、メールマーケティングの劣化、営業側からのCRM不信といった形で経営指標に効いてきます。MQLとSQLの定義設計や運用についてはHubSpotでMQLを設計・設定する方法とMQLとSQLの定義と設計方法で詳しく扱っていますが、その前提として「判定の入力データが信頼できること」が必要になります。
整備すべき対象を最初に棚卸しする
このセクションでは、いきなり手を動かす前に把握すべき「現状の汚れ具合」の棚卸し項目を整理します。
データ整備でよくある失敗は、目についたものから手を付けてしまい、全体像が見えないまま時間だけが過ぎるパターンです。最初に、HubSpot内の汚れがどこに偏っているかを定量的に把握します。
棚卸しで確認する5つの観点
- 重複コンタクトの規模:HubSpotの重複管理ツール(コンタクト>「重複を管理」)で、システムが検出している重複候補の件数を確認します。
- 無効メールアドレスの数:「ハードバウンス」「無効なメールアドレス」のステータスでフィルタしたリストを作成し、母数を出します。
- 必須プロパティの欠損率:会社名・業種・従業員規模・役職など、セグメントで使うプロパティの空欄率を確認します。
- 表記揺れの程度:業種・役職・流入チャネルなどのフリーテキスト項目で、同義の値がいくつあるかを抽出します(例:「マーケティング」「マーケ」「Marketing」)。
- 非アクティブコンタクトの量:直近12〜24ヶ月でメール開封・クリック・サイト訪問のいずれもないコンタクトの数を出します。
この5つを数字で押さえると、整備の優先順位が決まります。たとえば重複が全体の5%程度なら後回しでよいケースもありますし、無効メールが10%を超えていればメール配信より先にこちらを潰すべきです。
棚卸し結果の記録
棚卸しの結果はスプレッドシートに記録し、整備実施後に再度同じ指標を取って改善幅を見られるようにしておきます。整備は一度やって終わりではないため、定点観測の起点を作ることが重要です。
重複コンタクトの統合手順
このセクションでは、重複コンタクトを安全に統合するための手順と判定ルールを示します。
重複コンタクトはHubSpotで最も発生しやすい汚れの一つです。同一人物が異なるメールアドレス(個人用と会社用、旧ドメインと新ドメイン)で登録されているケース、フォーム入力時の表記ゆれ、CSVインポート時の重複などが原因となります。
HubSpot標準の重複管理ツール
HubSpotにはコンタクトと会社それぞれに重複管理機能があります。コンタクトの場合はメールアドレス、姓名、電話番号などの類似度から重複候補を提示します。提示された候補に対して、片方を残してもう一方の情報をマージする操作になります。
マージ前に決めておくべきルール
マージは原則として元に戻せないため、事前にルール化しておきます。
- 残すレコードの優先順位:作成日が古いほうを残す/最新の活動があるほうを残す、のどちらかを決めます。多くの場合、作成日が古いほうを残し、新しいほうの情報を統合する方法が、過去の活動履歴を保全しやすくなります。
- 会社所属・取引・活動履歴の扱い:マージにより両レコードの活動履歴は統合されます。ただしリストへの所属は片方のみが引き継がれるため、重要なリストに入っていないかを事前に確認します。
- 所有者(コンタクトオーナー)の取り扱い:両レコードで所有者が異なる場合、どちらを優先するかを営業組織と合意しておきます。
大量の重複への対応
重複候補が数百件以上ある場合、手動マージは現実的ではありません。HubSpotの重複管理ツールで一括マージを行うか、Operations Hub の「重複の自動マージ」機能を使う方法があります。Operations Hubの自動マージはルール設定が可能ですが、誤マージのリスクもあるため、最初は少量でテスト運用してから本適用するのが安全です。
なお、HubSpotのプラン構成や機能の違いについては、HubSpotの無料版と有料版の違いもあわせて参考にしてください。
無効メールアドレスとバウンス管理
このセクションでは、配信到達率を守るために行うべき無効メールの除外と継続的なバウンス処理を扱います。
無効なメールアドレスを残したままメール配信を続けると、送信ドメインの評価(ドメインレピュテーション)が下がり、有効な宛先にもメールが届きにくくなります。これはHubSpotだけの問題ではなく、メール配信基盤全般に共通する原則です。
HubSpotでの無効メール特定
HubSpotではメール配信の結果として以下のステータスが付与されます。
- ハードバウンス:宛先アドレスが存在しない、ドメインが存在しないなど永続的な配信不能
- ソフトバウンス:メールボックス容量超過、一時的な受信側不調など一時的な配信不能
- 配信停止(オプトアウト):受信者本人が配信停止を選択
- サブスクリプションなし:購読同意がない状態
このうちハードバウンスは、HubSpot側で自動的にメール送信対象から除外されますが、コンタクトレコード自体は残ります。メール配信用リストを作る際には、これらのステータスを確実に除外する条件を入れる必要があります。
定期的なクレンジング項目
四半期に1回程度、以下を実施します。
- ハードバウンス済みコンタクトのアーカイブ判定(直近で活動がなければアーカイブ候補)
- 長期間未開封・未クリックのコンタクトの再エンゲージメントキャンペーン実施、もしくは配信対象から除外
- ドメイン単位での到達率モニタリング(特定ドメイン向けに到達率が極端に低くないか)
第三者メール検証ツールの活用
大量のリストインポート時には、配信前にメール検証サービス(NeverBounceなど)でリストをクレンジングする運用を入れる企業もあります。HubSpot単体では送信前の有効性チェックは行わないため、外部リストをインポートする運用がある場合は検討に値します。
プロパティの標準化と命名規則
このセクションでは、表記揺れを根本から減らすためのプロパティ設計と命名規則を整理します。
表記揺れは、データを汚す最大の原因の一つです。「業種」をフリーテキストで入力させると、「IT」「IT/通信」「情報通信業」「Information Technology」が同じ意味で別の値として並ぶことになります。これを後から整備しようとすると膨大な手作業になるため、入力時点で標準化する設計が必要です。
フリーテキストをドロップダウンに置き換える
セグメントで使うプロパティ(業種、従業員規模、役職、流入チャネル、リード元など)は、原則としてドロップダウンセレクト(単一選択)またはチェックボックス(複数選択)にします。フォーム入力でもAPI連携でも、選択肢に存在しない値は入らないため、表記揺れが構造的に発生しなくなります。
プロパティの命名規則
HubSpotにはデフォルトプロパティと、ユーザーが追加するカスタムプロパティが共存します。カスタムプロパティが増えると、似た名前のプロパティが乱立し、運用者が混乱します。命名規則を最初に決めておきます。
| プロパティ種別 | 命名ルールの例 | 具体例 |
|---|---|---|
| マーケ施策由来 | [mkt]_目的_詳細 | mkt_lead_source_detail |
| セールス由来 | [sales]_目的_詳細 | sales_disqualified_reason |
| カスタマーサクセス由来 | [cs]_目的_詳細 | cs_health_score |
| システム連携用 | [sys]_目的_詳細 | sys_external_id |
命名規則の運用例として上記のような接頭辞方式を示しましたが、絶対的な正解があるわけではありません。重要なのは「自社で1つのルールを決めて全員が守る」という点です。
プロパティ追加の承認プロセス
プロパティは誰でも追加できる権限になっていることが多く、放置すると無秩序に増えます。月1回など定期的にプロパティ一覧をレビューし、未使用のものはアーカイブ、重複しているものは統合する運用を入れます。新規追加には簡易な承認プロセス(Slackで管理者承認など)を設けると有効です。HubSpotの初期設定段階での設計についてはHubSpot初期設定チェックリストもあわせて参考にしてください。
リスト・ワークフロー・レポートの命名規則と廃棄ポリシー
このセクションでは、データそのものではなく「データを使う側」のオブジェクトを整備する考え方を扱います。
運用が長くなると、リストやワークフロー、レポートの数が膨大になり、何が動いていて何が動いていないか誰も把握できなくなります。これもデータ整備の一部として扱うべき領域です。
命名規則の例
リストやワークフローの名前は、後から検索・棚卸ししやすい形式にします。たとえば次のような構造です。
- リスト名:[用途]_[対象]_[条件]_[作成日] 例:「nurture_MQL候補_業種IT_2025-04」
- ワークフロー名:[トリガー種別]_[目的]_[対象] 例:「form_資料DLお礼_全社」
- レポート名:[KPI]_[期間]_[セグメント] 例:「MQL数_月次_全社」
廃棄・アーカイブのポリシー
使われていないリストやワークフローを残し続けると、棚卸し時の判断コストが上がります。次のようなルールを決めておきます。
- 3ヶ月以上トリガーされていないワークフローはアーカイブ候補としてレビュー
- 6ヶ月以上参照されていないリストはアーカイブ候補
- 担当者退職時には、その人が作成したリスト・ワークフローを引き継ぎレビュー対象にする
- アーカイブ前に必ず別オブジェクトからの参照(他のワークフローやレポートが使っていないか)を確認
HubSpotのワークフロー設計の考え方はHubSpotワークフロー設計の進め方に詳しくまとめています。
データ整備を「継続させる」運用設計
このセクションでは、整備を一度きりで終わらせず、継続的に回すための運用ルールを整理します。
多くの企業でデータ整備が失敗するのは、整備プロジェクトを単発で実施して終わってしまうためです。汚れは日々発生するので、整備も日々のオペレーションに組み込む必要があります。
役割分担の明確化
HubSpot内のデータに関する責任者(データオーナー)を1人決めます。マーケティング担当が兼任することが多いですが、誰が決定権を持つかを曖昧にしないことが重要です。データオーナーの主な役割は次のとおりです。
- プロパティの新規追加・廃止の承認
- 命名規則・データ品質ルールの維持
- 定期クレンジングの実施または委任管理
- 営業・マーケ・CS各部門からの整備要望の受付
定期メンテナンスのスケジュール
整備頻度の目安として、以下のような周期が一つの参考になります。実際の頻度は組織規模・データ量により調整してください。
| 周期 | 実施内容 |
|---|---|
| 毎週 | 新規重複候補のチェック、フォーム経由の異常値(テスト送信など)の除外 |
| 毎月 | プロパティ追加・廃止のレビュー、未使用リスト・ワークフローの一次棚卸し |
| 四半期 | 無効メール・非アクティブコンタクトの一括クレンジング、KPI再定義レビュー |
| 半期〜年次 | 命名規則・整備ポリシー全体の見直し、ICP・MQL定義との整合チェック |
営業組織との合意形成
データ整備は営業組織にも影響します。重複マージで担当者割り当てが変わる、無効メール除外でリスト件数が減る、といった変化は必ず事前共有が必要です。マーケと営業が共通のデータ品質基準を持つことが、組織全体のCRM活用度を引き上げます。マーケティングと営業の連携設計についてはマーケティングとセールスの連携の仕組み作りもあわせて参考になります。
外注・代行を検討すべきタイミング
このセクションでは、データ整備を社内で完結させるか、外部リソースを使うかの判断基準を整理します。
データ整備は地味で時間のかかる作業のため、社内の主担当者が他の業務と兼任していると後回しになりがちです。次のような状況であれば、外部の支援を検討に入れる価値があります。
- コンタクトが数万件以上あり、棚卸しに着手する工数すら確保できない
- 過去にHubSpotを複数の担当者で運用しており、命名規則やプロパティ設計が統一されていない
- 他システム(旧MA、旧CRM、Excel管理など)からの移行データがそのまま放置されている
- 整備のたびに営業組織との調整が発生し、社内では合意形成が難しい
外部支援を入れる場合、単発のクレンジング作業だけを依頼するのか、命名規則・運用ルールの設計から関与してもらうのかで成果が大きく変わります。一度きりのクレンジングでは数ヶ月後に同じ状態に戻ることが多いため、運用ルールごと整備するのが本筋です。HubSpotの運用代行に何を任せるかについてはHubSpot運用代行で頼めることでも整理しています。
まとめ:データ整備は施策の前提条件
このセクションでは、本記事の要点を整理し、次に取るべき行動を示します。
HubSpotにおけるデータ整備は、ワークフローの自動化やスコアリング、レポーティングといった上位施策が機能するための前提条件です。整備の進め方として本記事で扱った要点は次のとおりです。
- 整備すべき対象を5つの観点(重複・無効メール・欠損・表記揺れ・非アクティブ)で棚卸しする
- 重複統合は事前ルールを決めてから実施し、大量処理は段階的に行う
- 無効メールは送信ドメイン評価を守るため定期的に除外する
- 表記揺れはフリーテキストをドロップダウンに置き換えて構造的に防ぐ
- プロパティ・リスト・ワークフローには命名規則と廃棄ポリシーを設ける
- 整備は単発ではなく、データオーナーを置いた継続運用に組み込む
整備に着手する際は、いきなり手を動かすのではなく、まず棚卸しで現状を数値化し、優先順位を決めるところから始めてください。社内に運用工数が不足している場合は、運用ルール設計から外部支援を入れる選択肢も現実的です。
よくある質問(FAQ)
- Q1. データクレンジングはどのくらいの頻度で行うべきですか?
- A. 規模により異なりますが、毎週・毎月・四半期・半期の4階層で運用するのが一般的です。重複候補チェックは毎週、プロパティレビューは毎月、無効メール処理は四半期、ポリシー全体見直しは半期〜年次が目安です。
- Q2. 重複コンタクトのマージは元に戻せますか?
- A. HubSpotの仕様上、コンタクトのマージは原則として元に戻せません。マージ前に残すレコードと統合される情報を必ず確認してください。心配な場合は事前にCSVエクスポートでバックアップを取ることをおすすめします。
- Q3. 無効メールアドレスは削除すべきですか、残すべきですか?
- A. 即削除ではなく、まずアーカイブ(非アクティブ化)し、メール配信対象から外す運用が一般的です。完全削除すると過去の活動履歴も失われるため、後から分析できなくなる点に注意が必要です。
- Q4. プロパティが既に大量に増えてしまった場合、どこから整理すべきですか?
- A. 直近6〜12ヶ月で値が更新されていないプロパティをまずリストアップし、そこから「使われていない」「重複している」「命名が不適切」の3観点でレビューしてください。一度に全削除するのではなく、月1回ペースで段階的に進めるほうが安全です。
- Q5. 社内にHubSpot運用の専任担当がいません。データ整備は外注できますか?
- A. 可能です。ただし単発のクレンジング作業だけを発注するのではなく、命名規則やプロパティ設計、運用ルールも含めて整備してくれるパートナーを選ぶほうが、長期的には費用対効果が高くなります。
HubSpot活用にお困りですか?
MA・CRM導入から運用設計まで、フリーランスのBtoBマーケターがサポートします。
まずはお気軽にご相談ください。
この記事を書いた人
Tomohiro Toukaichi
BtoB SaaSのマーケティング責任者を経験後、フリーランスとして独立。マーケティング戦略設計、KPI・予算設計、広告運用、HubSpot設計・ファネル構築・リードナーチャリングなど、戦略から実行まで一気通貫で支援。