🤖AI gợi ý post🔬
1️⃣ AI gợi ý post hoạt động như thế nào?
Các hệ thống như của:
Facebook
TikTok
YouTube
Netflix
… KHÔNG đơn giản là “mỗi lần click thì chạy query update”.
Thực tế gồm 4 tầng chính:
🔬 1. Thu thập hành vi (Behavior Logging)
Mỗi hành động đều được log:
Click
Dừng lại bao lâu (dwell time)
Scroll chậm hay lướt nhanh
Like / Comment / Share
Hover chuột
Xem đến bao nhiêu %
Nhưng:
👉 Họ KHÔNG update toàn bộ mô hình mỗi lần bạn click.
👉 Họ chỉ ghi log vào event stream (Kafka / log server).
🧠 2. Biểu diễn người dùng thành vector (User Embedding)
User không được lưu kiểu:
user.likes = "chứng khoán"
Mà được lưu dạng vector:
User A = [0.23, -1.44, 0.88, ... 512 chiều]
Mỗi post cũng có vector riêng:
Post X = [0.25, -1.40, 0.92, ...]
→ Tính cosine similarity để xem gần nhau bao nhiêu.
Đây gọi là:
Embedding-based Recommendation
⚡ 3. Có update mỗi click không?
Câu trả lời: Có nhưng không theo cách bạn nghĩ
Có 2 kiểu update:
🟢 A. Real-time lightweight update
Update một số feature đơn giản
Ví dụ: tăng weight chủ đề "crypto" lên 0.02
Không retrain model
Cái này gần như realtime.
🔵 B. Batch retrain model
1h / 6h / 1 ngày retrain
Dùng dữ liệu log thu thập
Huấn luyện lại deep model
Ví dụ: TikTok retrain cực nhanh (gần realtime).
🏗 4. Pipeline thực tế
Hệ thống lớn thường gồm 3 tầng:
🔹 Tầng 1: Candidate Generation (lọc 1 triệu bài → còn 5000)
ANN search (Approximate Nearest Neighbor)
Vector database
🔹 Tầng 2: Ranking model
Deep Learning (Wide & Deep, Transformer, DLRM…)
Predict xác suất bạn click
🔹 Tầng 3: Re-ranking
Loại trùng
Chèn quảng cáo
Diversity control
📊 Vậy có phải mỗi lần click là chạy query update DB?
❌ Không phải kiểu:
UPDATE users SET interest='crypto'
Thay vào đó:
Ghi log event
Update feature online
Batch retrain model
🧠 Nếu tự xây hệ thống đơn giản
Vì bác có nền lập trình mạnh, có thể làm bản mini như sau:
Cách đơn giản:
Lưu tag bài viết
Mỗi lần click → tăng score tag đó
Gợi ý bài có tag score cao nhất
Nâng cấp:
Dùng TF-IDF
Hoặc sentence-transformers
Lưu vector vào FAISS
Tính cosine similarity
🔥 Vũ khí tối thượng của hệ thống gợi ý
Không phải chỉ ML.
Mà là:
🧠 Deep Learning + Vector Embedding + Feedback Loop + A/B Testing liên tục
AI recommendation = hệ thống sống
Nó thay đổi theo hành vi người dùng từng giờ.
Nếu Tiến sĩ M muốn, tôi có thể:
Vẽ sơ đồ kiến trúc hệ thống recommendation full
Hoặc viết demo Python mini recommender
Hoặc phân tích sâu cách TikTok tối ưu dopamine loop 😄
Chọn level nào đây?
✨ made by AI 🤖 Precision Engine
Nhận xét
Đăng nhận xét