🤖AI gợi ý post🔬

tháng 2 27, 2026

1️⃣ AI gợi ý post hoạt động như thế nào?

Các hệ thống như của:

Facebook
TikTok
YouTube
Netflix

… KHÔNG đơn giản là “mỗi lần click thì chạy query update”.

Thực tế gồm 4 tầng chính:

🔬 1. Thu thập hành vi (Behavior Logging)

Mỗi hành động đều được log:

Click
Dừng lại bao lâu (dwell time)
Scroll chậm hay lướt nhanh
Like / Comment / Share
Hover chuột
Xem đến bao nhiêu %

Nhưng:

👉 Họ KHÔNG update toàn bộ mô hình mỗi lần bạn click.
👉 Họ chỉ ghi log vào event stream (Kafka / log server).

🧠 2. Biểu diễn người dùng thành vector (User Embedding)

User không được lưu kiểu:

user.likes = "chứng khoán"

Mà được lưu dạng vector:

User A = [0.23, -1.44, 0.88, ... 512 chiều]

Mỗi post cũng có vector riêng:

Post X = [0.25, -1.40, 0.92, ...]

→ Tính cosine similarity để xem gần nhau bao nhiêu.

Đây gọi là:

Embedding-based Recommendation

⚡ 3. Có update mỗi click không?

Câu trả lời: Có nhưng không theo cách bạn nghĩ

Có 2 kiểu update:

🟢 A. Real-time lightweight update

Update một số feature đơn giản
Ví dụ: tăng weight chủ đề "crypto" lên 0.02
Không retrain model

Cái này gần như realtime.

🔵 B. Batch retrain model

1h / 6h / 1 ngày retrain
Dùng dữ liệu log thu thập
Huấn luyện lại deep model

Ví dụ: TikTok retrain cực nhanh (gần realtime).

🏗 4. Pipeline thực tế

Hệ thống lớn thường gồm 3 tầng:

🔹 Tầng 1: Candidate Generation (lọc 1 triệu bài → còn 5000)

ANN search (Approximate Nearest Neighbor)
Vector database

🔹 Tầng 2: Ranking model

Deep Learning (Wide & Deep, Transformer, DLRM…)
Predict xác suất bạn click

🔹 Tầng 3: Re-ranking

Loại trùng
Chèn quảng cáo
Diversity control

📊 Vậy có phải mỗi lần click là chạy query update DB?

❌ Không phải kiểu:

UPDATE users SET interest='crypto'

Thay vào đó:

Ghi log event
Update feature online
Batch retrain model

🧠 Nếu tự xây hệ thống đơn giản

Vì bác có nền lập trình mạnh, có thể làm bản mini như sau:

Cách đơn giản:

Lưu tag bài viết
Mỗi lần click → tăng score tag đó
Gợi ý bài có tag score cao nhất

Nâng cấp:

Dùng TF-IDF
Hoặc sentence-transformers
Lưu vector vào FAISS
Tính cosine similarity

🔥 Vũ khí tối thượng của hệ thống gợi ý

Không phải chỉ ML.

Mà là:

🧠 Deep Learning + Vector Embedding + Feedback Loop + A/B Testing liên tục

AI recommendation = hệ thống sống
Nó thay đổi theo hành vi người dùng từng giờ.

Nếu Tiến sĩ M muốn, tôi có thể:

Vẽ sơ đồ kiến trúc hệ thống recommendation full
Hoặc viết demo Python mini recommender
Hoặc phân tích sâu cách TikTok tối ưu dopamine loop 😄

Chọn level nào đây?

✨ made by AI 🤖 Precision Engine

Tìm kiếm Blog này

Trại hè công nghệ