Lộ trình tới AGI: kịch bản, mốc năng lực và rào cản (2027–2035)
Tổng hợp và đối chiếu các dự báo AGI từ những phòng lab và nhà nghiên cứu hàng đầu, các mốc năng lực còn chưa vượt qua, và cuộc tranh luận 'scaling là đủ' hay 'cần đột phá mới' tính tới giữa năm 2026.
Lộ trình tới AGI: kịch bản, mốc năng lực và rào cản (2027–2035)
Tóm tắt
“Trí tuệ nhân tạo tổng quát” (AGI — Artificial General Intelligence) là khái niệm chỉ một hệ thống AI có thể làm được hầu hết các tác vụ trí tuệ mà con người làm được, ở mức ngang hoặc vượt con người. Tính tới giữa năm 2026, các lãnh đạo phòng lab hàng đầu đặt mốc AGI rất gần — khoảng 2026 đến 2030 — trong khi nhiều nhà nghiên cứu độc lập cho rằng đó là sự lạc quan có động cơ thương mại và mốc thực tế xa hơn nhiều.
Bài viết này không đứng về một phe. Thay vào đó, chúng tôi trình bày ba điều: (1) các kịch bản thời gian kèm tên người dự báo cụ thể, (2) các mốc năng lực mà AI hiện vẫn chưa vượt qua một cách đáng tin cậy, và (3) cuộc tranh luận trung tâm giữa “chỉ cần mở rộng quy mô” (scaling) và “cần kiến trúc đột phá mới”. Mọi con số và dự báo đều được gắn với nguồn và người phát ngôn — vì trong chủ đề này, ai nói quan trọng không kém nói gì.
Một lưu ý quan trọng: bản thân định nghĩa “AGI” chưa được thống nhất. Cùng một mốc thời gian “2027” có thể nghĩa là “AI viết code giỏi hơn kỹ sư giỏi nhất” (định nghĩa hẹp) hoặc “AI có mọi năng lực nhận thức của con người” (định nghĩa rộng của Demis Hassabis). Phần lớn bất đồng về thời gian thực ra là bất đồng về định nghĩa.
Các kịch bản thời gian (ai dự báo gì)
Kịch bản lạc quan: 2026–2028
Dario Amodei (CEO Anthropic) là người dự báo sớm nhất. Trong khuyến nghị gửi Văn phòng Chính sách Khoa học Công nghệ Nhà Trắng (tháng 3/2025), Anthropic viết rằng họ “kỳ vọng các hệ thống AI mạnh sẽ xuất hiện vào cuối 2026 hoặc đầu 2027”. Trong tiểu luận nổi tiếng Machines of Loving Grace, Amodei mô tả “Powerful AI” là hệ thống có năng lực trí tuệ “ngang hoặc vượt người đoạt giải Nobel” trên hầu hết lĩnh vực. Ông cẩn trọng thêm: “có thể đến sớm như 2026, nhưng cũng có những cách nó kéo dài lâu hơn nhiều”.
Daniel Kokotajlo (cựu nghiên cứu viên OpenAI) và nhóm AI Futures Project công bố kịch bản chi tiết AI 2027 (tháng 4/2025). Kịch bản mô tả một “siêu lập trình viên” (superhuman coder) xuất hiện khoảng tháng 3/2027, sau đó tự cải thiện đệ quy (recursive self-improvement) dẫn tới siêu trí tuệ vào 2028. Đây là kịch bản “đường đua nhanh”; nhánh “đường an toàn chậm hơn” đẩy các mốc sang 2028 trở đi. Dự báo trung vị cá nhân của Kokotajlo cho AGI là 2029.
Kịch bản trung dung: 2029–2032
Demis Hassabis (CEO Google DeepMind, đoạt giải Nobel Hóa học 2024) nhất quán đặt mốc “5 đến 10 năm” kể từ 2025, tức khoảng 2030–2035, với “xác suất 50%” đạt AGI trong khung đó. Quan trọng là định nghĩa của Hassabis rất rộng: AGI phải thể hiện “tất cả năng lực nhận thức con người có” — không phải chỉ một LLM giỏi. Tại Axios AI+ Summit (tháng 12/2025), ông nói thêm: “Chúng ta chỉ còn cách AGI một hoặc hai đột phá công nghệ tầm cỡ AlphaGo” — một phát biểu vừa lạc quan (gần) vừa thận trọng (vẫn cần đột phá chưa có).
Kịch bản thận trọng: sau 2035, hoặc cần đổi mô hình
Gary Marcus (nhà khoa học nhận thức) cho rằng “khả năng AGI đến trước 2027 giờ có vẻ xa vời”. Lập trường của ông cân bằng hơn cách thường bị trích dẫn: “Ai nghĩ AGI là bất khả thi — sai. Ai nghĩ AGI cận kề — cũng sai vậy”. Marcus dẫn một khảo sát rằng 84% nhà nghiên cứu AI cho rằng riêng LLM sẽ không đủ để đạt AGI. Ông đã đặt cược tiền với chuyên gia chính sách Miles Brundage về việc AI có đạt một bộ tiêu chí tham vọng vào cuối 2027 hay không.
Bài học về cách đọc dự báo: Hassabis và Amodei là CEO của các công ty huy động hàng tỷ USD dựa trên kỳ vọng AGI — họ có động cơ để lạc quan. Kokotajlo và Marcus không bán sản phẩm AGI. Điều này không tự động làm bên nào đúng, nhưng nó nên định hình mức độ hoài nghi của bạn.
Các mốc năng lực vẫn chưa vượt qua
Tiến bộ trên benchmark là có thật và nhanh, nhưng “đạt điểm cao trên bài kiểm tra” khác với “đáng tin cậy trong thế giới thực”. Đây là những rào cản năng lực cụ thể.
1. Độ dài tác vụ và độ tin cậy dài hạn (METR)
Tổ chức đánh giá độc lập METR đo lường “độ dài tác vụ mà AI hoàn thành với độ tin cậy 50%”. Phát hiện cốt lõi: chỉ số này tăng gấp đôi khoảng mỗi 7 tháng trong giai đoạn 2019–2025, và tăng tốc lên mỗi ~4 tháng trong 2024–2025. Ngoại suy xu hướng này, trong chưa đầy một thập kỷ AI có thể tự hoàn thành phần lớn tác vụ phần mềm mà con người hiện mất nhiều ngày hoặc tuần.
Nhưng hãy chú ý chữ “50%”: ở ngưỡng tin cậy đó, một nửa số lần thử thất bại. Để AI làm việc tự chủ thực sự trong môi trường rủi ro cao, độ tin cậy cần lên 99%+ — và độ dài tác vụ ở ngưỡng đó thấp hơn nhiều. Khoảng cách giữa “ấn tượng trong demo” và “tin cậy được trong sản xuất” chính là rào cản agentic reliability.
2. Suy luận trừu tượng: ARC-AGI-2
ARC-AGI-2 (ARC Prize) kiểm tra suy luận trừu tượng trên các bài toán mới, không thể “học vẹt” từ dữ liệu huấn luyện. Đầu năm 2025, mô hình o3 của OpenAI chỉ đạt ~6,5%. Tới đầu 2026, các mô hình frontier tiến gần ngưỡng giải thưởng lớn (>85%). Người dùng trung bình đạt khoảng 66%, và bảng đánh giá con người đạt 100%.
Đính chính so với bản nháp ban đầu: Một số bản tổng hợp gán điểm ARC-AGI-2 ~85% cho “GPT-5.5” và “Gemini 3.1”. Cần thận trọng: tên phiên bản và con số chính xác thay đổi nhanh và khác nhau giữa các nguồn (ví dụ một số bảng xếp Gemini 3.1 Pro ở mức ~77%). Điều chắc chắn là xu hướng — từ ~6,5% lên gần ngưỡng 85% trong khoảng một năm — chứ không phải con số tuyệt đối của một phiên bản cụ thể. Hãy kiểm tra bảng xếp hạng ARC Prize trực tiếp để có số mới nhất.
3. Kỹ thuật phần mềm: SWE-bench Verified vs Pro
Đây là ví dụ điển hình về việc đọc benchmark sai có thể gây hiểu lầm. Trên SWE-bench Verified (bộ bài đã được lọc, công khai), các mô hình hàng đầu năm 2026 đạt mức rất cao — báo cáo lên tới ~90–95%. Nghe như AI đã “giải quyết xong” kỹ thuật phần mềm.
Nhưng trên SWE-bench Pro — biến thể khó hơn, chống nhiễm dữ liệu (contamination), test trên codebase tư nhân chưa từng thấy — điểm tụt mạnh xuống khoảng 55–59% cho các mô hình dẫn đầu. Mọi mô hình đều mất điểm khi gặp code lạ. Khoảng cách Verified-vs-Pro chính là bằng chứng định lượng cho “trần độ tin cậy”: phần lớn điểm cao đến từ việc tinh chỉnh scaffolding cho đúng dạng bài, không phải năng lực tổng quát thực sự.
4. Học liên tục (continual learning)
Đây có lẽ là rào cản sâu sắc nhất, được nhà phỏng vấn Dwarkesh Patel nêu bật: LLM hiện tại bị “đóng băng” sau huấn luyện. Chúng không thể học trong lúc làm việc như một nhân viên mới tích lũy kinh nghiệm qua từng ngày. Richard Sutton (đoạt giải Turing) lập luận rằng trí tuệ thật phải học “tại thời điểm chạy” (at runtime), vì thế giới quá phức tạp để nhồi hết vào một lần pre-training. Dario Amodei phản bác rằng “học liên tục sẽ được giải quyết một cách thỏa đáng trong 2026” — một dự báo cụ thể, có thể kiểm chứng được.
5. Mô hình thế giới và nhân quả (world models)
LLM dự đoán token tiếp theo dựa trên thống kê ngôn ngữ; chúng không có mô hình nội tại về vật lý, không gian, hay nhân quả của thế giới thực. Đây là luận điểm trung tâm của phe hoài nghi (xem phần tranh luận bên dưới).
Tranh luận trung tâm: “Scaling là đủ” hay “cần đột phá mới”
Đây là chia rẽ định hình toàn bộ chủ đề. Đáng chú ý, ranh giới không nằm giữa “người trong ngành” và “người ngoài” — nó cắt ngang chính các phòng lab.
Phe “cần đột phá mới” — và họ đến từ bên trong
Ilya Sutskever (đồng sáng lập OpenAI, nay sáng lập Safe Superintelligence) — chính người từng là kiến trúc sư của kỷ nguyên scaling — tuyên bố cuối 2025: “Thời đại scaling đã kết thúc.” Ông phân kỳ lịch sử: 2012–2020 là “thời đại nghiên cứu” (ý tưởng dẫn dắt), 2020–2025 là “thời đại scaling” (cứ thêm dữ liệu và compute là tiến bộ). Giờ kết quả từ việc mở rộng pre-training “đã chững lại” và “chúng ta quay lại thời đại của khám phá”. Khi người phát minh ra công thức scaling nói công thức đã hết dư địa, đó là tín hiệu mạnh.
Yann LeCun (đoạt giải Turing, cựu Giám đốc Khoa học AI của Meta) còn quyết liệt hơn: LLM là “ngõ cụt” trên con đường tới trí tuệ cấp người. Ông rời Meta tháng 11/2025 sau 12 năm, và đến tháng 3/2026 huy động 1,03 tỷ USD cho startup AMI Labs (Advanced Machine Intelligence) ở Paris, tập trung vào “world models” — AI học về thế giới thực qua video, dữ liệu không gian và cảm biến, thay vì chỉ qua văn bản. LeCun đặt cược sự nghiệp và hơn một tỷ USD vào niềm tin rằng cần một kiến trúc khác hẳn.
Gary Marcus bổ sung góc nhìn từ khoa học nhận thức: LLM gặp vấn đề về tính kết hợp (compositionality), ảo giác (hallucination), và “riêng LLM không phải câu trả lời cho AGI”.
Phe “scaling cộng suy luận sẽ tới đích”
Phe lạc quan không phủ nhận giới hạn của pre-training thuần túy; họ chuyển trọng tâm sang test-time compute (suy luận lúc inference). Quan sát của 2025–2026: cho mô hình “suy nghĩ lâu hơn” trước khi trả lời (chế độ reasoning / “think mode”) mở khóa năng lực mới trên các bài như ARC mà chỉ tăng kích thước mô hình không làm được. Theo lập luận này, “scaling” chưa chết — nó chỉ chuyển từ mở rộng pre-training sang mở rộng compute lúc suy luận và học tăng cường (RL).
Một số nhà phân tích cũng cho rằng học liên tục là vấn đề kỹ thuật hệ thống (quản lý ngữ cảnh tốt hơn, in-context learning tinh vi hơn) chứ không phải rào cản cơ bản về thuật toán — và do đó có thể giải quyết sớm.
Cách phép thử sẽ phân định
Tranh luận này sẽ được giải quyết bằng bằng chứng thực nghiệm, không phải hùng biện. Các thế hệ mô hình tiếp theo là phép thử: nếu chúng cải thiện đột phá so với thế hệ trước, phe scaling đúng; nếu cải thiện chững lại hoặc đòi compute tăng theo hàm mũ chỉ để được chút ít, phe hoài nghi được chứng minh. Mốc continual-learning-2026 của Amodei và cược Marcus–Brundage cuối 2027 là những điểm kiểm chứng cụ thể nên theo dõi.
Rào cản ngoài thuật toán
Ngay cả khi năng lực mô hình tiếp tục tăng, ba rào cản triển khai vẫn có thật:
- Năng lượng và compute. Nhu cầu điện tính bằng Gigawatt cho các trung tâm dữ liệu thế hệ tiếp theo đang vượt khả năng cung ứng của lưới điện hiện tại; xây dựng hạ tầng điện mất nhiều năm, không phải nhiều tháng.
- Dữ liệu chất lượng cao cạn dần (“data wall”). Dữ liệu do người tạo ra đang tới hạn. Dùng dữ liệu tổng hợp (synthetic) do AI sinh ra để tự huấn luyện có rủi ro “sụp đổ mô hình” (model collapse) nếu không cẩn trọng.
- Khoảng trống kiểm chứng (verification gap) và alignment. Khi AI tạo ra code và quyết định nhanh hơn tốc độ con người có thể kiểm tra (audit), việc giám sát trở thành nút thắt — và là rủi ro an toàn cốt lõi khi hệ thống tiến gần hoặc vượt năng lực con người.
Kết luận: nên nghĩ thế nào về lộ trình này
AGI nhiều khả năng không phải một “cú nổ” duy nhất vào một ngày cụ thể, mà là sự tích lũy năng lực không đều — agentic AI trong code và nghiên cứu trước, rồi mở rộng dần sang các lĩnh vực khác. Khoảng tin cậy hợp lý, tổng hợp các quan điểm: một số năng lực hẹp ở mức siêu phàm xuất hiện 2026–2028; AGI theo nghĩa rộng đầy đủ thì bất định hơn nhiều, với khung trung dung 2029–2035 và một xác suất thực rằng cần đột phá kiến trúc chưa tồn tại.
Điều nên làm với thông tin này không phải là chọn một ngày để tin, mà là: theo dõi các phép thử có thể kiểm chứng (continual learning 2026, thế hệ mô hình mới, điểm SWE-bench Pro và ARC-AGI-2), phân biệt benchmark “đã lọc” với benchmark “chống nhiễm”, và luôn hỏi ai đang dự báo và động cơ của họ là gì.
Nguồn tham khảo
- METR — Measuring AI Ability to Complete Long Tasks: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/
- ARC Prize — ARC-AGI-2 Technical Report: https://arcprize.org/blog/arc-agi-2-technical-report (bảng xếp hạng: https://arcprize.org)
- Dario Amodei — Machines of Loving Grace: https://darioamodei.com/essay/machines-of-loving-grace
- CNBC — Human-level AI will be here in 5 to 10 years, DeepMind CEO says (Hassabis): https://www.cnbc.com/2025/03/17/human-level-ai-will-be-here-in-5-to-10-years-deepmind-ceo-says.html
- AI Futures Project — AI 2027 (Kokotajlo): https://ai-2027.com/
- Dwarkesh Patel — phỏng vấn Ilya Sutskever, “age of scaling to age of research”: https://www.dwarkesh.com/p/ilya-sutskever-2
- Wikipedia — Advanced Machine Intelligence Labs (Yann LeCun, AMI Labs): https://en.wikipedia.org/wiki/Advanced_Machine_Intelligence_Labs
- Gary Marcus — Two years later, deep learning is still faced with the same fundamental challenges: https://garymarcus.substack.com/p/two-years-later-deep-learning-is
- Scale — SWE-bench Pro Public Leaderboard: https://labs.scale.com/leaderboard/swe_bench_pro_public
- Nathan Lambert (Interconnects) — Contra Dwarkesh on Continual Learning: https://www.interconnects.ai/p/contra-dwarkesh-on-continual-learning
Bài viết tổng hợp và kiểm chứng từ nghiên cứu R011. Các dự báo đều được gắn với người phát ngôn; con số benchmark thay đổi nhanh — hãy kiểm tra nguồn gốc để có số liệu mới nhất. Cập nhật: 2026-06-13.