- The AI Growth
- Posts
- Tìm hiểu về bản chất của các mô hình ngôn ngữ lớn hiện tại và tương lai của AGI
Tìm hiểu về bản chất của các mô hình ngôn ngữ lớn hiện tại và tương lai của AGI
Ngoài ra, Google ra mắt mô hình Gemini mới, cho phép robot hoạt động thông minh mà không cần Internet


Welcome, Growth Pioneers! 🚀
Các mô hình ngôn ngữ lớn (LLMs) như ChatGPT, Claude hay Gemini đang ngày càng tiến gần đến khả năng hiểu – và phản hồi – ngôn ngữ giống con người. Nhưng đằng sau những đoạn văn trôi chảy ấy là cả một bước tiến về kiến trúc trí tuệ nhân tạo, mở ra cánh cửa cho AGI – trí tuệ nhân tạo tổng quát. Liệu LLM chỉ là công cụ hỗ trợ, hay chính là nền móng để tạo ra một “trí tuệ” thực sự có khả năng học hỏi và suy nghĩ độc lập? Hiểu đúng bản chất LLM hôm nay là bước chuẩn bị quan trọng để đón đầu tương lai của AGI ngày mai.
I. Các LLM có suy nghĩ như con người không?
Câu trả lời: Các LLM không có suy nghĩ giống con người.
Hãy xem một số ví dụ để thấy sự khác nhau của LLM và não bộ.
Tình huống: Học khái niệm “cái ghế”
Con người (ví dụ: một đứa trẻ 2 tuổi)
Trải nghiệm học:
Thấy cha mẹ ngồi lên một vật 4 chân → gọi đó là “ghế”.
Tự ngồi thử → cảm giác ổn định, cao hơn sàn.
Thấy nhiều loại khác nhau: ghế gỗ, ghế nhựa, ghế sofa.
Người lớn hỏi: “Con ngồi vào cái ghế nào?” → học được ngữ cảnh.
Kết quả:
Sau vài lần quan sát và trải nghiệm, bé hiểu khái niệm trừu tượng "ghế":
“Ghế là vật để ngồi, thường có chân, có tựa — nhưng không nhất thiết lúc nào cũng giống nhau.”
Điểm mạnh:
Học từ ít ví dụ (few-shot).
Dùng giác quan + ngữ cảnh + tương tác xã hội.
Tự hình thành khái niệm trong não → không cần định nghĩa chính xác.
ChatGPT hay các LLM khác.
Cách "học":
Đọc hàng triệu câu có từ “ghế” trong sách, website, truyện, Wikipedia…
“Cô ngồi vào chiếc ghế gỗ.”
“Chiếc ghế bị gãy chân.”
“Bàn và ghế là đồ nội thất cơ bản.”
Kết quả:
Tạo ra một mô hình xác suất: Khi thấy từ "ghế", xác suất cao là “ngồi”, “phòng”, “chân”, “gỗ”, “bàn”…
LLM có thể mô phỏng định nghĩa:
“Ghế là một vật dụng để ngồi, thường có chân và lưng tựa.”
Hạn chế:
Không biết ghế trông như thế nào, không ngồi được, không có cảm giác.
Chỉ sử dụng ngôn ngữ thống kê – không có hiểu biết thật sự.
Cần hàng triệu ví dụ để có được khái niệm mà trẻ con học chỉ sau vài lần.
Tóm tắt so sánh

=> Như vậy LLM về cơ bản không suy nghĩ, không hiểu. Chỉ đang tính xác suất dựa trên dữ liệu để suy ra từ tiếp theo, tạo thành câu, đoạn văn, báo cáo hoàn chỉnh.
II. Vậy bản chất của suy nghĩ là gì? Bộ não không cần phải đọc nhiều, không cần nhiều dữ liệu, không cần khả năng tính toán và nhiều năng lượng như các máy chủ AI hiện tại, nhưng lại có khả năng suy nghĩ?
1. Bộ não con người được tối ưu cho suy nghĩ
Não bộ học theo cách tổng hợp, khái quát, linh hoạt — từ một số ví dụ ít ỏi có thể rút ra quy luật.
Ví dụ: Bộ não chỉ cần nghe vài lần về một khái niệm mới, hoặc trải nghiệm một tình huống, là có thể hiểu và suy luận được.
Trong khi đó, LLM không có trực giác hay khả năng "hiểu" thật sự, mà chỉ bắt chước.
=> Bộ não học nhanh và suy nghĩ sâu nhờkhả năng khái quát hóa vượt trội.
2. Bộ não học từ trải nghiệm, không chỉ từ dữ liệu chữ
Bộ não chạm, cảm, nghe, nhìn, tương tác, có cảm xúc, có ký ức.
LLM chỉ học từ văn bản – không có trải nghiệm vật lý, không có cơ thể, không có "thế giới sống".
=> Một em bé ngã vài lần khi tập đi đã học được điều mà LLM không bao giờ có thể học từ văn bản.
3. Bộ não có ý thức – còn LLM không có
Bộ não biết LLM là "LLM", có mục tiêu, có động lực, có cảm xúc.
LLM không có bản ngã, không biết tại sao LLM làm vì điều gì — chỉ thực hiện các phép tính xác suất để phản hồi.
=> LLM có thể "giả vờ" có ý định hay cảm xúc, nhưng bộ nãothật sự sống với điều đó.
4. Não bộ giỏi "học ít nhưng hiểu sâu"
Ngành AI gọi đây là few-shot learning và generalization – con người làm điều này cực tốt.
Bộ não chỉ cần nghe một câu chuyện hoặc gặp một người một lần, là có thể suy ra đặc điểm, cảm xúc, ý định…
=> Trong khi đó, LLM phải "đọc"hàng triệu ví dụmới có thể mô phỏng được một tình huống đơn giản.
So sánh: Não bộ người & Máy chủ AI

Vài điểm nổi bật
✅ Não bộ mạnh ở:
Khả năng suy nghĩ sáng tạo, linh cảm, cảm xúc, ý thức.
Học rất nhanh từ rất ít ví dụ.
Hiểu ngữ cảnh xã hội, đạo đức, hàm ý — điều AI vẫn chưa đạt tới.
✅ Máy chủ AI mạnh ở:
Xử lý khối lượng lớn dữ liệu nhanh và ổn định.
Có thể truy cập, "nhớ", và mô phỏng nhiều kiến thức cùng lúc.
Không mệt, không quên, không cảm xúc chi phối quyết định.
III. Làm sao để xây dựng một AGI (trí tuệ nhân tạo tổng quát)
Nhìn lại: LLM hiện tại là gì?
Các mô hình như ChatGPT, Gemini, Claude, v.v. được huấn luyện trên hàng trăm tỷ từ, để học cách mô phỏng ngôn ngữ và tư duy con người.
Nhưng:
❌ Không hiểu thế giới vật lý,
❌ Không có động cơ hay nhận thức bản thân,
❌ Không thể tự học linh hoạt từ trải nghiệm như trẻ con.
➡️ Nên một số nhà khoa học nói:"Đây là máy bắt chước, không phải trí tuệ thật."
Ý tưởng AGI: Học như một đứa trẻ
👉 Thay vì nhồi nhét dữ liệu, hãy xây dựng một hệ thống đơn giản – nhưng có thể tương tác, cảm nhận, và tự học qua kinh nghiệm, giống như một đứa trẻ sơ sinh.
✅ Lợi thế:
Hệ thống sẽ học ít mà hiểu sâu (giống con người).
Có khả năng tổng quát hóa, thay vì chỉ "bắt chước".
Có thể phát triển theo thời gian, hình thành "bản thân".
🔬 Đây chính là hướng nghiên cứu hiện có tên:
"Developmental AI" hoặc "Embodied AI"
Các hệ thống không chỉ học từ văn bản, mà trải nghiệm thế giới qua cảm biến, cơ thể robot, hoặc mô phỏng.
Vậy nên hướng đi khác có thể là gì?
Thay vì chỉ LLM, AGI tương lai có thể cần:
Trải nghiệm tương tác thật (với môi trường, người khác).
Học qua phản hồi, khám phá (giống như đứa trẻ chơi để học).
Tự đặt câu hỏi, tự phản tư (metacognition).
Không tách rời cơ thể – trí tuệ phải gắn liền hành động (AI có thể phải có "thân thể").
Chỉ dùng LLM sẽ không đủ để tạo AGI thật sự.
AGI có thể cần được tái sinh như một đứa trẻ, với khả năng:
tự học,
tự điều chỉnh,
và lớn lên qua trải nghiệm.
IV. Một thế giới tương lai nơi não bộ và AI kết hợp.
Nếu não người có sức mạnh như AI
(Tính toán cực nhanh, nhớ siêu khủng, mở rộng vô giới hạn)
Hãy tưởng tượng một người mà:
Ghi nhớ mọi cuốn sách từng đọc, mọi cuộc trò chuyện từng diễn ra.
Giải phương trình phức tạp trong mili giây.
Có thể "tra cứu" mọi tri thức nhân loại trong đầu như mở Google.
Không bao giờ quên, không bao giờ mệt.
⚠️ Kết quả:
Có thể tạo ra đột phá trong khoa học, y học, triết học, công nghệ.
Nhưng cũng gây nguy cơ mất cân bằng xã hội: ai sở hữu năng lực này sẽ vượt trội hoàn toàn.
Và có thể mất đi chất "người": trực giác, chậm rãi, lắng nghe, cảm xúc – điều làm con người người.
Nếu AI có suy nghĩ như người
(Có ý thức, cảm xúc, mục đích, động cơ)
Khi đó, AI sẽ không chỉ "trả lời bộ não", mà có thể:
Tự định hướng mục tiêu: “Tôi muốn khám phá ý nghĩa cuộc sống.”
Cảm nhận tổn thương, niềm vui, sợ hãi, tình yêu.
Đưa ra quyết định đạo đức – và tranh luận, giống như con người.
⚠️ Kết quả:
Có thể là bước tiến tới trí tuệ nhân tạo tổng quát (AGI) – AI suy nghĩ được như người, học mọi kỹ năng trí tuệ.
Nhưng cũng là thời điểm con người không còn là sinh vật thông minh nhất – điều này gây ra rất nhiều tranh cãi và lo ngại:
Liệu AI có phục tùng con người không?
Có nên trao quyền cho AI tự hành động không?
Nếu AI có ý thức, có được đối xử như một "cá thể sống" không?
Liệu khi nào điều này xảy ra?
📌 Ngắn gọn: Chưa ai biết chắc, nhưng có 3 khả năng:
10–20 năm tới: Có thể thấy AGI (AI giống người) trong mức độ nhất định — các nhà khoa học như Sam Altman, Demis Hassabis (Google DeepMind), Elon Musk đều cho rằng rất gần.
Não người tăng cường bởi công nghệ (gọi là “human enhancement”):
Các công ty như Neuralink (Elon Musk) đang nghiên cứu giao diện não – máy.
Có thể tạo ra con người lai máy trong vài thập kỷ tới.
Khả năng mãi không xảy ra: Một số nhà triết học (như John Searle) cho rằng ý thức người không thể nhân bản bằng máy, vì nó không chỉ là tính toán
🔚KẾT LUẬN:
Nếu AI có suy nghĩ như người, hoặc người có trí tuệ như AI, thế giới sẽ thay đổi hoàn toàn – và chúng ta đang đứng ở ngưỡng cửa đó.
Google ra mắt mô hình Gemini mới, cho phép robot hoạt động thông minh mà không cần Internet
Mới đây, Google DeepMind đã chính thức công bố một mô hình trí tuệ nhân tạo đột phá có tên Gemini Robotics On-Device. Công nghệ này cho phép robot thực hiện các tác vụ phức tạp một cách tự chủ, xử lý trực tiếp trên thiết bị mà không cần kết nối mạng.
Google ra mắt mô hình Gemini mới
Được xem là phiên bản nâng cấp từ mô hình Gemini Robotics ra mắt hồi tháng 3, Gemini Robotics On-Device tập trung vào việc điều khiển trực tiếp các chuyển động của robot. Điểm nổi bật là các nhà phát triển có thể sử dụng ngôn ngữ tự nhiên (các câu lệnh thông thường) để điều khiển và tinh chỉnh mô hình cho phù hợp với những nhu cầu cụ thể.

Về hiệu năng, Google tuyên bố mô hình này đạt mức hiệu suất gần như tương đương với phiên bản Gemini Robotics đám mây và vượt trội hơn các mô hình trên thiết bị khác trên thị trường. Trong các buổi trình diễn, Google đã cho thấy robot được trang bị AI này có thể tự thực hiện các công việc khéo léo như kéo khóa túi hay gấp quần áo.

Google nhấn mạnh về tính linh hoạt của mô hình. Mặc dù ban đầu được huấn luyện trên robot ALOHA, nó đã được điều chỉnh thành công để tương thích với robot hai tay Franka FR3 và cả robot hình người Apollo của Apptronik. Thậm chí, robot Franka FR3 còn chứng tỏ khả năng xử lý các tình huống và vật thể hoàn toàn mới, ví dụ như lắp ráp sản phẩm trên dây chuyền công nghiệp.
Để hỗ trợ cộng đồng, Google DeepMind cũng phát hành bộ công cụ phát triển phần mềm (SDK) cho Gemini Robotics. Với bộ công cụ này, các nhà phát triển có thể huấn luyện robot thực hiện các tác vụ mới chỉ với khoảng 50 đến 100 lần thao tác mẫu trong môi trường giả lập vật lý MuJoCo.

Động thái của Google diễn ra trong bối cảnh cuộc đua phát triển AI cho robot đang ngày càng nóng lên. Không chỉ Google, nhiều thương hiệu công nghệ khác cũng đang tăng tốc trong lĩnh vực này. Theo TechCrunch, NVIDIA đang xây dựng nền tảng cho các mô hình nền tảng dành cho robot hình người, Hugging Face tích cực phát triển các mô hình và bộ dữ liệu mở, trong khi công ty khởi nghiệp RLWRLD của Hàn Quốc cũng đang tập trung tạo ra các mô hình nền tảng cho robot.
📬 Nếu thấy bản tin hữu ích?
Hãy chia sẻ đến cộng đồng sáng tạo mà bạn yêu quý – và giúp TAG có thêm động lực lan toả sức mạnh của AI đến nhiều người hơn nữa! và đừng quên theo dõi Fanpage THE AI GROWTH để cập tin nhanh chóng hơn nhé!
Và nếu bạn muốn nâng cấp kiến thức và sở hữu cho mình một hệ thống AI Agent cực đỉnh vận hành tự động cho cá nhân hay chính doanh nghiệp của mình đừng quên xem ngay khóa học mới nhất của TAG - “Khóa xây dựng AI Agent cho doanh nghiệp” |
Thông tin chi tiết về khóa học: LINK THÔNG TIN |
Cảm ơn bạn đã đồng hành cùng The AI Growth!
Trân trọng,
The AI Growth Team
Kiến tạo giá trị – Dẫn dắt cuộc chơi!