🤖AI gợi ý post🔬

1️⃣ AI gợi ý post hoạt động như thế nào?

Các hệ thống như của:

  • Facebook

  • TikTok

  • YouTube

  • Netflix

… KHÔNG đơn giản là “mỗi lần click thì chạy query update”.

Thực tế gồm 4 tầng chính:


🔬 1. Thu thập hành vi (Behavior Logging)

Mỗi hành động đều được log:

  • Click

  • Dừng lại bao lâu (dwell time)

  • Scroll chậm hay lướt nhanh

  • Like / Comment / Share

  • Hover chuột

  • Xem đến bao nhiêu %

Nhưng:

👉 Họ KHÔNG update toàn bộ mô hình mỗi lần bạn click.
👉 Họ chỉ ghi log vào event stream (Kafka / log server).


🧠 2. Biểu diễn người dùng thành vector (User Embedding)

User không được lưu kiểu:

user.likes = "chứng khoán"

Mà được lưu dạng vector:

User A = [0.23, -1.44, 0.88, ... 512 chiều]

Mỗi post cũng có vector riêng:

Post X = [0.25, -1.40, 0.92, ...]

→ Tính cosine similarity để xem gần nhau bao nhiêu.

Đây gọi là:

Embedding-based Recommendation


⚡ 3. Có update mỗi click không?

Câu trả lời: Có nhưng không theo cách bạn nghĩ

Có 2 kiểu update:

🟢 A. Real-time lightweight update

  • Update một số feature đơn giản

  • Ví dụ: tăng weight chủ đề "crypto" lên 0.02

  • Không retrain model

Cái này gần như realtime.


🔵 B. Batch retrain model

  • 1h / 6h / 1 ngày retrain

  • Dùng dữ liệu log thu thập

  • Huấn luyện lại deep model

Ví dụ: TikTok retrain cực nhanh (gần realtime).


🏗 4. Pipeline thực tế

Hệ thống lớn thường gồm 3 tầng:

🔹 Tầng 1: Candidate Generation (lọc 1 triệu bài → còn 5000)

  • ANN search (Approximate Nearest Neighbor)

  • Vector database

🔹 Tầng 2: Ranking model

  • Deep Learning (Wide & Deep, Transformer, DLRM…)

  • Predict xác suất bạn click

🔹 Tầng 3: Re-ranking

  • Loại trùng

  • Chèn quảng cáo

  • Diversity control


📊 Vậy có phải mỗi lần click là chạy query update DB?

❌ Không phải kiểu:

UPDATE users SET interest='crypto'

Thay vào đó:

  1. Ghi log event

  2. Update feature online

  3. Batch retrain model


🧠 Nếu tự xây hệ thống đơn giản

Vì bác có nền lập trình mạnh, có thể làm bản mini như sau:

Cách đơn giản:

  • Lưu tag bài viết

  • Mỗi lần click → tăng score tag đó

  • Gợi ý bài có tag score cao nhất

Nâng cấp:

  • Dùng TF-IDF

  • Hoặc sentence-transformers

  • Lưu vector vào FAISS

  • Tính cosine similarity


🔥 Vũ khí tối thượng của hệ thống gợi ý

Không phải chỉ ML.

Mà là:

🧠 Deep Learning + Vector Embedding + Feedback Loop + A/B Testing liên tục

AI recommendation = hệ thống sống
Nó thay đổi theo hành vi người dùng từng giờ.


Nếu Tiến sĩ M muốn, tôi có thể:

  • Vẽ sơ đồ kiến trúc hệ thống recommendation full

  • Hoặc viết demo Python mini recommender

  • Hoặc phân tích sâu cách TikTok tối ưu dopamine loop 😄

Chọn level nào đây?


made by AI 🤖 Precision Engine

Nhận xét

Bài đăng phổ biến từ blog này

🌈 Tự Động Highlight Code Trong Blogger

🧭CRUD CHUẨN LARAVEL

🚀01 giờ học cách sử dụng Developer Console