Identity resolution trong CDP

Giới thiệu

Identity Resolution là một chức năng quan trọng của nền tảng dữ liệu khách hàng (Customer Data platform – CDP). Với chức năng này, hệ thống có thể định danh được khách hàng, giúp brand hiểu rõ được khách hàng của mình, hiểu rõ lịch sử truy cập, giao dịch và tương tác của khách hàng đối với brand. Từ đó giúp cho nhân viên bán hàng, tiếp thị và chăm sóc khách hàng có cái nhìn toàn diện về khách hàng, đưa ra những thông điệp, nội dung cho việc tiếp thị, bán hàng hoặc chăm sóc họ.

Source from hightouch

Identity resolution là gì?

Là quá trình tính toán, so sánh các dòng dữ liệu về thông tin khách hàng để xác định xem những dòng dữ liệu này có liên quan với nhau không và liên quan với nhau như thế nào, có liên quan đến cùng 1 khách hàng hay không hay nói cách khách là đang tham chiếu đến một khách hàng nào.

Những dữ liệu đề cập ở trên là gì? Đó là thông tin khách hàng như tên, tuổi, email, số điện thoại, địa chỉ được thu thập ở nhiều nguồn như website, mobile app, pos, crm, landing page, form… Và thông tin hành vi khách hàng trên nguồn này như hành vi duyệt web, hành vi mua hàng… và hành vi trên các kênh tiếp thị như email, web push, sms… và các kênh chăm sóc khách hàng như chat, chatbot, call center…

Về phân loại dữ liệu này được chia thành 2 dạng: Thông tin khách hàng (PII) và thông tin định danh kỹ thuật số (digital identify).

Thông tin khách hàng (PII):

  • Email address
  • Mobile Number
  • Address
  • Customer ID
  • Name
  • Loyalty ID

Những dữ liệu này thường được thu thập khi bạn đăng ký tài khoản, đăng ký form nào đó, đăng ký thông tin khi mua hàng (cả online website/mobile app và offline dưới cửa hàng), chơi các trò chơi, đăng ký nhận mã khuyến mãi…

Thông tin định danh kỹ thuật số (Digital Identify):

  • Thông tin trình duyệt và thiết bị sử dụng: Thông thường dữ liệu này được thu thập thông qua SDK như Google Analytics, Segment… cài đặt trên website, mobile app của bạn. Đây là những dữ liệu first-party cookie giúp bạn hiểu rõ về trình duyệt, thiết bị, hành vi mà khách hàng tương tác với website hay mobile app của bạn.
  • Thông tin mạng như IP Address, đây là thông tin về dịch vụ internet mà khách sử dụng để truy cập, dữ liệu này là public nên bạn không cần phải lo lắng. Với việc sử dụng IP Address thì các hệ thống sử dụng dịch vụ thứ 3 để có thể biết bạn đến từ vùng nào, quốc gia nào, thành phố nào, thậm chí là bạn đang sử dụng mạng internet nào. Ví dụ như https://ip-api.com

Các phương pháp định danh

Deterministic

Đây là phương pháp định danh dựa vào các quy tắc (rule-based). Để thực hiện bạn thường phải khai báo danh sách các thuộc tính định danh theo thứ tự ưu tiên để hệ thống nhận dạng và nhận biết xử lý khi dữ liệu được nhập vào từ các nguồn.

Ví dụ bạn định nghĩa thứ tự định danh như sau: Customer ID > Mobile Number > Email Address. Khi khách hàng đăng nhập vào website, hệ thống sẽ trả về Customer ID của khách hàng, và từ đó các hành vi duyệt web của khách trên website sẽ định danh với khách hàng này.

Phương pháp này vì định nghĩa theo thứ tự nên có thể gây ra việc trùng lắp dữ liệu ở những thuộc tính thứ 2 trở đi như ví dụ trên là hai khách hàng có Customer ID khách nhau nhưng Email Address có thể trùng nhau.

Probabilistic

Đây là phương pháp định danh dựa vào các thuật toán nhằm xác định khách hàng duy nhất từ các dữ liệu khách hàng, phương pháp này dựa vào những thông tin hành vi trên website/mobile app thông qua các thiệt bị, trình duyệt hoặc IP Address giống nhau như đã nói ở trên.

Ví dụ khách hàng sử dụng lapop và truy cập website để mua hàng và đã được định danh, nhưng khi gửi email/sms cho khách hàng này, họ sử dụng mobile device và click vào link trong email/sms để mở trình duyệt trên mobile. Dựa vào thuật toán này có thể định danh được thông tin mobile device và laptop là cùng một khách hàng.

Tuy nhiên phương pháp này có xác suất khớp thông tin khách hàng thấp hơn phương pháp ở trên. Các hệ thống thường đưa ra những tùy chọn để làm việc khớp tốt hơn.