- The AI Growth
- Posts
- Tổng hợp các cập nhật mới nhất của ChatGPT: Tùy chỉnh mô hình cho GPT, xuất định dạng PDF và Google Docs, bổ sung tính năng cho Dự án
Tổng hợp các cập nhật mới nhất của ChatGPT: Tùy chỉnh mô hình cho GPT, xuất định dạng PDF và Google Docs, bổ sung tính năng cho Dự án
Ngoài ra, Meta giới thiệu V-JEPA 2: Robot AI biết “tư duy trước khi hành động”


Welcome, Growth Pioneers! 🚀
Chỉ trong những ngày đầu của tháng 6 năm 2025, OpenAI đã công bố một loạt cập nhật quan trọng, mang đến nhiều cải tiến đáng kể cho nền tảng của mình. Các thay đổi chính bao gồm: Chọn mô hình cho GPTs tùy chỉnh, nâng cấp tính năng Dự án trong ChatGPT, và bổ sung khả năng tải xuống cho Canvas kèm xuất nhiều định dạng.
Mở rộng lựa chọn mô hình cho GPT tùy chỉnh
OpenAI đã mở rộng danh sách các mô hình ngôn ngữ có thể sử dụng cho GPTs tùy chỉnh. Giờ đây, người tạo có thể lựa chọn từ nhiều mô hình khác nhau như GPT-4o, GPT-4, GPT-3.5 và các phiên bản khác. Điều này cho phép người dùng tối ưu hóa hiệu suất cho các tác vụ cụ thể, từ sáng tạo nội dung, phân tích dữ liệu đến phát triển ứng dụng.

Người dùng tạo các GPT không có Custom Actions có thể sử dụng trình chọn mô hình để chọn từ tất cả các mô hình mà người dùng có quyền truy cập. Các GPT có Custom Actions hiện chỉ hỗ trợ GPT-4o và GPT-4.1. Tính năng này đã khả dụng trên nền tảng web cho người dùng các gói Plus, Pro, và Team. OpenAI dự kiến sẽ sớm triển khai cho các gói Enterprise và Education.
Bản chất của cập nhật này là trao cho nhà phát triển nhiều lựa chọn hơn để xây dựng công cụ AI hiệu quả. Giờ đây, họ có thể chọn một mô hình nhanh và tiết kiệm cho việc đơn giản, hoặc một mô hình mạnh nhất và thông minh nhất cho việc phức tạp. Điều này mở ra cơ hội cho nhiều ứng dụng AI chuyên dụng hơn ra đời. Thử thách của OpenAI là phải đảm bảo các mô hình hoạt động ổn định và cung cấp hướng dẫn rõ ràng để người dùng chọn lựa đúng.
Cải tiến tính năng “Dự Án” trong ChatGPT
Tính năng “Dự án” (Projects) trong ChatGPT cũng nhận được nhiều nâng cấp giá trị, giúp người dùng làm việc tập trung và cộng tác hiệu quả hơn. Các cải tiến này dành cho người dùng gói Plus, Pro và Team.
Các thay đổi chính:
Chế độ nghiên cứu sâu và tương tác bằng giọng nói: Đặc biệt hữu ích cho giới học thuật và doanh nghiệp, cho phép người dùng tương tác mà không cần dùng tay.
Cải thiện bộ nhớ dài hạn: Người dùng có thể tham chiếu các cuộc trò chuyện cũ ngay trong dự án, đảm bảo tính liền mạch của công việc.
Chia sẻ và tạo mới linh hoạt: Dễ dàng chia sẻ một cuộc trò chuyện cụ thể hoặc khởi tạo một dự án mới từ các cuộc trò chuyện có sẵn.
Hỗ trợ di động toàn diện: Cho phép tải tệp và chọn mô hình ngay trên ứng dụng di động, giúp làm việc hiệu quả mọi lúc, mọi nơi.

Động thái này cho thấy OpenAI muốn biến ChatGPT từ một trợ lý ảo thành một không gian làm việc nhóm. Bằng cách tập trung vào tính năng cộng tác và ghi nhớ, họ đang hướng đến việc cạnh tranh với các công cụ quản lý dự án phổ biến. Thành công sẽ phụ thuộc vào việc nền tảng này có đủ dễ dùng để các đội nhóm thực sự chuyển sang sử dụng nó cho công việc hàng ngày hay không.
Canvas bổ sung tính năng tải xuống
Đây là một cập nhật được nhiều người dùng mong đợi: Canvas – không gian làm việc tích hợp trong ChatGPT giờ đây đã cho phép tải xuống dưới nhiều định dạng khác nhau như PDF, DOCX, Markdown và các tệp mã nguồn như .py, .js, .sql.
Thông tin này đã được OpenAI xác nhận trong bài đăng mới nhất trên trang chủ của X.
Trước đây, việc chuyển nội dung từ Canvas ra các nền tảng khác có thể sẽ gặp bất tiện và dễ lỗi định dạng. Việc cho phép tải xuống trực tiếp giúp Canvas trở thành một công cụ hữu ích và tiện lợi hơn hẳn cho việc viết lách và lập trình. Nó kết nối trực tiếp giai đoạn lên ý tưởng bằng AI và chuyển sang các định dạng quen thuộc. Đây là một thay đổi nhỏ nhưng tác động lớn đến hiệu suất làm việc.
Với loạt cải tiến này, OpenAI không chỉ nâng cao trải nghiệm người dùng mà còn mở ra nhiều tiềm năng mới cho các nhà phát triển. Sự linh hoạt của GPTs tùy chỉnh, hiệu quả của tính năng Dự án và sự tiện lợi của Canvas là minh chứng cho nỗ lực không ngừng của OpenAI nhằm đáp ứng các nhu cầu ngày càng đa dạng.
Meta giới thiệu V-JEPA 2: Robot AI biết “tư duy trước khi hành động”
Được giới thiệu tại hội nghị VivaTech ở Paris hôm 11/6, V-JEPA 2 đánh dấu bước tiến quan trọng trong lĩnh vực “mô hình thế giới” (world models) – những hệ thống AI có thể mô phỏng thế giới vật lý và giúp máy móc suy luận, lập kế hoạch như con người. Meta tin rằng các mô hình thế giới sẽ mở ra kỷ nguyên mới cho robotics, cho phép các tác nhân AI thực tế giúp đỡ các công việc gia đình và nhiệm vụ vật lý mà không cần lượng dữ liệu huấn luyện robot khổng lồ.

Điểm đặc biệt của V-JEPA 2 nằm ở khả năng học hỏi từ video không gán nhãn. Thay vì cần dữ liệu được xử lý sẵn như các mô hình AI truyền thống, V-JEPA 2 được huấn luyện trên hơn 1 triệu giờ video thô để hiểu các quy luật vật lý cơ bản như trọng lực, chuyển động và tương tác giữa các vật thể. Kiến trúc JEPA (Joint Embedding Predictive Architecture) cho phép mô hình học bằng cách dự đoán những phần bị che khuất của video trong không gian khái niệm trừu tượng thay vì cố gắng tái tạo từng pixel.
Câu chuyện thú vị là khi một đứa trẻ chơi ném bóng với chú chó, chú chó không chạy theo vị trí hiện tại của quả bóng mà chạy đến nơi nó dự đoán bóng sẽ rơi. Đây chính là loại “thông minh thường thức” mà V-JEPA 2 muốn mang đến cho máy móc. Trong các thử nghiệm tại phòng lab của Meta, robot được trang bị V-JEPA 2 hoàn thành thành công các nhiệm vụ nhặt và đặt vật thể với đối tượng chưa từng thấy, đạt tỷ lệ thành công 65-80% chỉ bằng cách sử dụng hướng dẫn thị giác.
So với đối thủ cạnh tranh, V-JEPA 2 nhanh hơn 30 lần so với mô hình Cosmos của Nvidia, mặc dù Meta có thể đang sử dụng các tiêu chuẩn đánh giá khác với Nvidia. Mô hình có 1,2 tỷ tham số và sử dụng quy trình huấn luyện hai giai đoạn: đầu tiên học hiểu động lực học thế giới từ video và hình ảnh, sau đó được tinh chỉnh với 62 giờ dữ liệu robot để kết nối đầu vào thị giác với các hành động điều khiển cụ thể.
Nhà khoa học trưởng về AI của Meta, Yann LeCun, mô tả V-JEPA 2 như một “bản sao kỹ thuật số trừu tượng của thực tế” cho phép AI “dự đoán hậu quả của hành động và lập kế hoạch để hoàn thành nhiệm vụ cụ thể”. Ông chia sẻ trong video giới thiệu rằng khả năng này sẽ giúp robot thực hiện các công việc từ nấu ăn đến dọn dẹp nhà cửa một cách tự nhiên.
Ứng dụng thực tế của V-JEPA 2 rất đa dạng, từ xe tự lái có thể dự đoán chuyển động của người đi bộ, robot kho bãi hiểu cách di chuyển hàng hóa, đến drone giao hàng biết cách điều hướng trong môi trường phức tạp. Khác với các mô hình truyền thống dựa vào hình ảnh hoặc video có gán nhãn, V-JEPA 2 sử dụng “không gian ẩn” để mô phỏng động lực học thế giới thực, đánh dấu sự chuyển dịch từ AI dựa trên ngôn ngữ sang hệ thống nhận thức không gian tốt hơn.
Meta cũng tung ra ba bộ tiêu chuẩn mới để đánh giá khả năng hiểu biết vật lý của AI: IntPhys 2 để phát hiện vật lý không hợp lý trong video, cùng hai bộ tiêu chuẩn khác đánh giá hiểu biết về tương tác vật thể. Tuy nhiên, trong khi con người đạt độ chính xác lên tới 95% trong các nhiệm vụ này, V-JEPA 2 và các mô hình video hiện tại vẫn còn khoảng cách đáng kể.
Động thái này diễn ra trong bối cảnh Meta đang đẩy mạnh tham vọng AI với khoản đầu tư 14 tỷ USD vào Scale AI, startup cung cấp dữ liệu huấn luyện cho machine learning. CEO của Scale AI là Alexandr Wang cũng được tuyển dụng để dẫn dắt các sáng kiến AI chủ chốt tại Meta. Điều này phù hợp với mục tiêu của CEO Mark Zuckerberg về việc tích hợp AI vào các sản phẩm cốt lõi của Meta từ Facebook, Instagram đến khả năng robotics và hệ thống tự động dài hạn.
Cuộc đua phát triển mô hình thế giới đang trở nên khốc liệt với sự tham gia của Google DeepMind với các mô hình Gemini Robotics, startup World Labs của nhà nghiên cứu AI nổi tiếng Fei-Fei Li đã huy động được 230 triệu USD, cùng nhiều players khác như Figure AI với mô hình Helix hay Microsoft với Magma AI.
Meta đã công bố V-JEPA 2 dưới dạng mã nguồn mở, cho phép các nhà phát triển truy cập, thử nghiệm và tích hợp vào nhiều use case khác nhau. Theo Meta, việc dựa vào lý luận không gian đơn giản thay vì đầu vào dữ liệu nặng có thể làm cho mô hình hiệu quả, thích ứng và mở rộng quy mô hơn các mô hình AI hiện có.
Nếu các mô hình thế giới như V-JEPA 2 tiếp tục phát triển theo kỳ vọng, chúng có thể mở đường cho AI hoạt động tự động trong môi trường xa lạ, mở ra các ứng dụng trong y tế, nông nghiệp và thậm chí cứu hộ thiên tai. Đây là bước quan trọng trong lộ trình AI dài hạn của Meta, đặc biệt khi cuộc cạnh tranh với OpenAI, Microsoft và Google ngày càng gay gắt.
Với V-JEPA 2, Meta không chỉ hướng tới việc cải thiện trải nghiệm người dùng trên các nền tảng hiện tại mà còn đặt nền móng cho tương lai khi AI có thể tương tác trực tiếp và thông minh với thế giới vật lý xung quanh chúng ta.
📬 Nếu thấy bản tin hữu ích?
Hãy chia sẻ đến cộng đồng sáng tạo mà bạn yêu quý – và giúp TAG có thêm động lực lan toả sức mạnh của AI đến nhiều người hơn nữa! và đừng quên theo dõi Fanpage THE AI GROWTH để cập tin nhanh chóng hơn nhé!
Và nếu bạn muốn nâng cấp kiến thức và sở hữu cho mình một hệ thống AI Agent cực đỉnh vận hành tự động cho cá nhân hay chính doanh nghiệp của mình đừng quên xem ngay khóa học mới nhất của TAG - “Khóa xây dựng AI Agent cho doanh nghiệp” |
Thông tin chi tiết về khóa học: LINK THÔNG TIN |
Cảm ơn bạn đã đồng hành cùng The AI Growth!
Trân trọng,
The AI Growth Team
Kiến tạo giá trị – Dẫn dắt cuộc chơi!