Andrej Karpathy từng là Director of AI ở Tesla, đồng sáng lập OpenAI giai đoạn đầu.
Đầu tháng 4/2026, Karpathy giới thiệu ý tưởng LLM Wiki: một pattern để dùng LLM xây và duy trì knowledge base.
AI được giao một wiki để bảo trì, mỗi lần đọc, mỗi lần hỏi, mỗi lần phát hiện một kết nối mới đều có thể làm cho lớp tri thức đó dày lên.
1. LLM Wiki không lưu “tài liệu”, nó lưu phần đã hiểu
Nếu chỉ lưu lại từng bài viết đã đọc, ta mới có một archive. Nếu chỉ embedding tài liệu rồi query, ta có một hệ thống retrieval. LLM Wiki nằm ở giữa hai thứ đó: nó giữ nguồn thô, nhưng đồng thời tạo ra một lớp tri thức đã được tổ chức lại.
Raw data trả lời câu hỏi: “Thông tin này đến từ đâu?”
Wiki trả lời câu hỏi khác: “Ta đã biết gì”
Đơn vị dữ liệu quan trọng trong LLM Wiki không phải là document. Nó là concept, entity, insight và các link giữa chúng.
2. Cấu trúc lưu trữ: raw là kho hồ sơ, wiki là bảng điều tra
Một LLM Wiki tốt nhưng kiến trúc lại đơn giản
raw/
papers/
articles/
transcripts/
assets/
wiki/
concepts/
people/
projects/
questions/
Điểm quan trọng là sự tách lớp.
raw/ giống kho hồ sơ đã đóng thùng. Trong đó có bài viết, PDF, transcript, ảnh, dataset. Đây là chứng cứ gốc. AI có thể mở ra đọc, trích dẫn, nhìn ảnh, nhưng không sửa nội dung trong đó.
wiki/ giống cái bảng của điều tra viên. Trên đó có ảnh của nhân vật, địa điểm, tổ chức, dự án, concept, claim. Mỗi thứ là một tấm thẻ riêng. Các link là những sợi chỉ nối giữa chúng: nguồn nào nói về entity nào, entity nào liên quan tới concept nào, claim nào củng cố hoặc mâu thuẫn với claim khác.

Hai lớp này đủ để vận hành: raw cố định, wiki giữ phần đã hiểu.
3. Các khái niệm chính trong LLM Wiki
Để đọc LLM Wiki dễ hơn, nên xem nó như một graph nhỏ. Nó không chỉ có “note”. Nó có source note, concept, entity, claim, insight, index, log, và quan trọng nhất là các link giữa chúng.
index.md trả lời: “Trong wiki có gì?” log.md trả lời: “Gần đây wiki đã thay đổi thế nào?” Hai file này không chỉ dành cho người đọc. Chúng là context rẻ cho agent ở phiên làm việc sau.
4. Workflow: ingest, query, lint
Tương tác với LLM Wiki chỉ có ba lệnh chính
ingest là đưa nguồn mới vào. AI đọc raw source, viết source note, rút concept/entity/claim, cập nhật các trang liên quan, rồi update index.md và log.md.
query là hỏi trên wiki. Hữu ích khi cần share knowledge với đồng bạn.
lint là bảo trì. AI tìm trang orphan, link chết, concept bị trùng, claim cũ, entity được nhắc nhiều nhưng chưa có trang riêng, hoặc synthesis đã lỗi thời.
Nếu thiếu lint, wiki sẽ mục dần như mọi knowledge base khác. Nếu có lint định kỳ, wiki giữ được hình dạng khi nó lớn lên.
5. Vì sao cách này works
LLM Wiki works vì nó giao đúng việc cho đúng bên.
Con người chọn nguồn, đặt câu hỏi, đánh giá cái gì đáng tin, và quyết định hướng nghiên cứu.
AI làm phần bookkeeping: đọc nhiều file, tạo note, update link, sửa index, ghi log, phát hiện trang trùng, nối claim mới với concept cũ.
Đây chính là phần giữ knowledge base sống. Không ai muốn ngồi cập nhật link, sửa trang cũ, gom ý trùng, hãy để AI làm.
Kết
Ở bài tiếp theo sẽ đi vào phần implementation cụ thể hơn: claude-obsidian hiện thực hóa LLM Wiki thành một workflow chạy được thật như thế nào.