• The AI Growth
  • Posts
  • Meta phát hành hai mô hình AI Llama 4 trở lại cuộc đua

Meta phát hành hai mô hình AI Llama 4 trở lại cuộc đua

Ngoài ra, Anthropic vừa có động thái mới nhất trong cuộc chiến mã hóa AI

Welcome, Growth Pioneers! 🚀

Chào bạn,

Meta đã công bố Llama 4 , bộ sưu tập mô hình AI mới nhất hiện đang hỗ trợ trợ lý ảo Meta AI trên web , WhatsApp, Messenger và Instagram. Hai mô hình mới, cũng có thể tải xuống từ Meta hoặc Hugging Face , là Llama 4 Scout — một mô hình nhỏ gọn có khả năng "gắn vừa một GPU Nvidia H100" — và Llama 4 Maverick, tương tự như GPT-4o và Gemini 2.0 Flash. Meta cho biết họ vẫn đang trong quá trình huấn luyện Llama 4 Behemoth, mà theo CEO Mark Zuckerberg của Meta là "mô hình cơ sở có hiệu suất cao nhất thế giới".

Theo Meta, Llama 4 Scout có cửa sổ ngữ cảnh 10 triệu mã thông báo — bộ nhớ làm việc của một mô hình AI — và đánh bại các mô hình Gemma 3 và Gemini 2.0 Flash-Lite của Google , cũng như Mistral 3.1 mã nguồn mở, "trên một loạt các điểm chuẩn được báo cáo rộng rãi", trong khi vẫn "vừa vặn trong một GPU Nvidia H100 duy nhất". Meta đưa ra những tuyên bố tương tự về hiệu suất của mô hình Maverick lớn hơn so với GPT-4o của OpenAI và Gemini 2.0 Flash của Google, và cho biết kết quả của nó tương đương với DeepSeek-V3 trong các tác vụ mã hóa và suy luận sử dụng "ít hơn một nửa số tham số hoạt động".

Hình ảnh: Meta

Trong khi đó, Llama 4 Behemoth có 288 tỷ tham số hoạt động, với tổng cộng 2 nghìn tỷ tham số. Mặc dù chưa được phát hành, Meta cho biết Behemoth có thể vượt trội hơn các đối thủ cạnh tranh (trong trường hợp này là GPT-4.5 và Claude Sonnet 3.7) "trên một số tiêu chuẩn STEM".

Đối với Llama 4, Meta cho biết họ đã chuyển sang kiến trúc "hỗn hợp chuyên gia" (MoE), một phương pháp tiết kiệm tài nguyên bằng cách chỉ sử dụng các phần của mô hình cần thiết cho một nhiệm vụ nhất định. Công ty dự định thảo luận về các kế hoạch tương lai cho các mô hình và sản phẩm AI tại hội nghị LlamaCon.

Giống như các mô hình trước đây, Meta gọi bộ sưu tập Llama 4 là "nguồn mở", mặc dù Llama đã bị chỉ trích vì những hạn chế về giấy phép. Ví dụ, giấy phép Llama 4 yêu cầu các tổ chức thương mại có hơn 700 triệu người dùng hoạt động hàng tháng phải xin phép Meta trước khi sử dụng các mô hình của mình, điều mà Sáng kiến Nguồn Mở đã viết vào năm 2023 đã đưa nó "ra khỏi danh mục 'Nguồn mở'".

Anthropic vừa có động thái mới nhất trong cuộc chiến mã hóa AI

Cuộc chiến AI trong lĩnh vực lập trình đang nóng lên. Một trong những “mặt trận” chính? Cửa sổ ngữ cảnh — hay còn gọi là “trí nhớ làm việc” của một mô hình AI, tức lượng văn bản mà nó có thể xem xét khi đưa ra câu trả lời. Về khía cạnh này, Anthropic vừa giành được lợi thế. Hôm nay, startup AI này công bố tăng gấp 5 lần kích thước cửa sổ ngữ cảnh khi chạy đua cạnh tranh với OpenAI, Google và các ông lớn khác.

Cửa sổ ngữ cảnh được đo bằng token, và cửa sổ mới của Claude Sonnet 4 — một trong những mô hình AI mạnh nhất của Anthropic — hiện có thể xử lý 1 triệu token. Để so sánh, trước đây Anthropic cho biết một cửa sổ 500.000 token có thể xử lý khoảng 100 cuộc trò chuyện bán hàng dài 30 phút hoặc 15 báo cáo tài chính. Giờ đây, con số này đã tăng gấp đôi, cho phép người dùng phân tích hàng chục bài nghiên cứu hoặc hàng trăm tài liệu chỉ trong một yêu cầu API duy nhất, theo Anthropic.

Quan trọng hơn, khả năng lập trình của nó mạnh hơn rất nhiều — từ chỗ chỉ phân tích được 20.000 dòng mã (với cửa sổ 200.000 token trước đây) lên đến toàn bộ codebase từ 75.000 đến 110.000 dòng mã.

“Điều này thực sự tuyệt vời vì đây là một trong những rào cản lớn mà tôi thấy ở khách hàng,” Brad Abrams, trưởng sản phẩm của Claude, chia sẻ với The Verge. “Trước đây họ phải chia nhỏ vấn đề thành từng phần nhỏ với cửa sổ ngữ cảnh hiện có, còn với 1 triệu token, mô hình có thể xử lý toàn bộ phạm vi ngữ cảnh — giải quyết vấn đề ở quy mô đầy đủ.”

Abrams cho biết Sonnet 4 hiện có thể xử lý 2.500 trang văn bản, và “một bản đầy đủ của Chiến Tranh và Hòa Bình cũng dễ dàng nằm gọn trong đó.”

Tuy nhiên, Anthropic không phải là công ty AI đầu tiên cung cấp cửa sổ ngữ cảnh lớn đến vậy.

📬 Nếu thấy bản tin hữu ích?
Hãy chia sẻ đến cộng đồng sáng tạo mà bạn yêu quý – và giúp TAG có thêm động lực lan toả sức mạnh của AI đến nhiều người hơn nữa! và đừng quên theo dõi Fanpage THE AI GROWTH để cập tin nha hơn nhé!

Và nếu bạn muốn nâng cấp kiến thức và sở hữu cho mình một hệ thống AI Agent cực đỉnh vận hành tự động cho cá nhân hay chính doanh nghiệp của mình đừng quên xem ngay các khóa học mới nhất của TAG

Một hệ thống giúp bạn:

  • Giảm 70% công việc lặp lại, tăng 300% output nội dung, tự động hóa 80% quy trình sale & marketing.

  • Tăng 40% chuyển đổi nhờ AI chatbot, giảm 60% chi phí marketing, nâng 200% chất lượng CSKH.

  • Vượt trội đối thủ 2-3 năm về công nghệ, sở hữu mô hình kinh doanh – dễ nhân bản, khó bị sao chép bởi USP độc quyền.

  • Dễ dàng mở rộng (Scale up) không giới hạn – bạn có thể x10, x100 với AI Agent mà không cần thêm nhân sự.

Cảm ơn bạn đã đồng hành cùng The AI Growth!

Trân trọng,
The AI Growth Team
Kiến tạo giá trị – Dẫn dắt cuộc chơi!