- The AI Growth
- Posts
- Trải nghiệm Nano Banana: Mô hình tạo và chỉnh sửa ảnh miễn phí đỉnh nhất hiện tại
Trải nghiệm Nano Banana: Mô hình tạo và chỉnh sửa ảnh miễn phí đỉnh nhất hiện tại
Ngoài ra, Microsoft ra mắt 2 mô hình AI nội bộ đầu tiên

Welcome, Growth Pioneers! 🚀
Chào bạn,
Google vừa chính thức trình làng Nano Banana (còn gọi là Gemini 2.5 Flash Image), một mô hình trí tuệ nhân tạo chuyên sâu về tạo và chỉnh sửa hình ảnh. Được phát triển dựa trên phản hồi từ người dùng, công cụ này hứa hẹn mang lại những cải tiến vượt trội về chất lượng hình ảnh cũng như khả năng tùy biến, hiện đã vươn lên dẫn đầu bảng xếp hạng LMArena.
Tổng quan và những tính năng nổi bật của Nano Banana
Hiện tại, mô hình Nano Banana đã được cung cấp trên Gemini API, miễn phí cho các nhà phát triển thông qua Google AI Studio và tích hợp trên Vertex AI cho khách hàng doanh nghiệp. Về chi phí, mô hình này được tính giá 30 USD cho mỗi 1 triệu token đầu ra. Theo ước tính, mỗi hình ảnh được tạo ra sẽ tương đương 1.290 token, tức khoảng 0,039 USD.

Những khả năng nổi bật
Kết hợp và hòa trộn ảnh: Hợp nhất các yếu tố từ nhiều bức ảnh khác nhau để tạo ra một tác phẩm liền mạch và sáng tạo.
Duy trì nhân vật nhất quán: Giữ nguyên đặc điểm của một người hoặc vật thể qua nhiều hình ảnh, phù hợp để xây dựng bộ ảnh đồng nhất.
Chỉnh sửa bằng ngôn ngữ tự nhiên: Dễ dàng chỉnh sửa chi tiết, thay đổi trang phục hay xóa vật thể chỉ bằng những câu lệnh đơn giản.
Am hiểu bối cảnh thực tế: Tạo ra những bức ảnh chân thực và logic nhờ tận dụng kiến thức nền tảng của Gemini.
Sáng tạo đa dạng: Hỗ trợ tạo ra nhiều phiên bản ảnh khác nhau chỉ từ một yêu cầu duy nhất.
Trải nghiệm thực tế với Nano Banana
Sau đây là các trải nghiệm tạo hình và chỉnh sửa ảnh thực tế với mô hình này kèm theo đó là cả câu lệnh và nhận xét cụ thể cho từng trường hợp.
Làm ảnh thẻ (CV, hồ sơ, hộ chiếu)
Trong những tình huống cấp bách cần ảnh thẻ để nộp hồ sơ, người dùng có thể biến một bức ảnh chụp thông thường thành ảnh thẻ chuyên nghiệp với câu lệnh: “Chỉnh ảnh thành ảnh thẻ chuyên nghiệp, nền màu trắng, giữ gương mặt rõ nét, cân chỉnh ánh sáng tự nhiên, loại bỏ bóng mờ. Thay trang phục bằng áo sơ mi trắng cổ đứng, phong cách nghiêm túc, phù hợp làm ảnh CV/xin việc. Khung ảnh 3×4.”

Kết quả cho thấy Nano Banana xử lý tốt các yếu tố về biểu cảm, ánh sáng và trang phục. AI có khả năng điều chỉnh gương mặt trở nên nghiêm túc hơn nhưng vẫn giữ lại đường nét đặc trưng. Tuy nhiên, mô hình vẫn còn hạn chế khi ảnh kết quả chưa được tự động cắt theo tỷ lệ 3×4 và chất lượng chỉ dừng ở 720p, đòi hỏi người dùng phải chỉnh sửa thủ công thêm.
Xóa người lạ khỏi nền ảnh
Với những bức ảnh chụp tại các địa điểm đông người, việc có những người lạ vô tình lọt vào khung hình là điều khó tránh. Nano Banana có thể giải quyết vấn đề này một cách hiệu quả.

Bằng câu lệnh: “Xóa toàn bộ người ở trong nền, giữ lại nhân vật chính rõ nét. Hoàn thiện phần nền bằng cách phục hồi cảnh vật tự nhiên, làm cho bức ảnh giống như chụp khi địa điểm vắng người”, mô hình đã xóa hoàn toàn các đối tượng không mong muốn và tái tạo lại hậu cảnh một cách chính xác, trong khi vẫn giữ nguyên chủ thể.
Thay đổi trang phục + nhiều phụ kiện cùng lúc
Đối với ngành thời trang, việc thay đổi trang phục và phụ kiện cho người mẫu trở nên đơn giản hơn rất nhiều. Người dùng có thể ghép trang phục từ ảnh này sang ảnh khác bằng câu lệnh: “Thay trang phục trong ảnh 1 thành trang phục trong ảnh thứ 2, giữ đúng tư thế và gương mặt.”


Thậm chí, mô hình có thể xử lý nhiều chi tiết cùng lúc: “Thay trang phục trong ảnh 1 thành trang phục trong ảnh thứ 2 cùng với các phụ kiện trong ảnh 3, giữ đúng tư thế và gương mặt của người trong ảnh 1.” Thử nghiệm cho thấy trang phục và phụ kiện mới được ghép vào một cách chân thực, hòa hợp với tổng thể mà không làm thay đổi khuôn mặt hay dáng đứng của người mẫu.

Phục chế ảnh cũ
Khả năng “am hiểu bối cảnh thực tế” của Nano Banana được thể hiện rõ nét khi phục chế những bức ảnh cũ. Với một bức ảnh đen trắng, ố vàng, người dùng chỉ cần yêu cầu: “Hãy phục hồi và tô màu cho bức ảnh này.”

Mô hình không chỉ khôi phục chi tiết bị mờ mà còn tô màu cho trang phục và khung cảnh với màu sắc chân thực, phù hợp với bối cảnh xưa. Đặc biệt, thần thái và đường nét khuôn mặt được tái hiện chính xác, cho thấy sự vượt trội so với các mô hình trước đây.
Với những cải tiến đáng kể, mô hình Nano Banana của Google hứa hẹn sẽ mở ra nhiều ứng dụng sáng tạo trong các lĩnh vực như thiết kế, quảng cáo và nhiếp ảnh. Khả năng tạo ra những bức ảnh chân thực và dễ dàng tùy chỉnh sẽ giúp người dùng biến ý tưởng thành hiện thực một cách nhanh chóng và hiệu quả hơn.
Microsoft ra mắt 2 mô hình AI nội bộ đầu tiên
Microsoft AI, bộ phận AI của Microsoft đã công bố các mô hình AI nội bộ đầu tiên vào ngày 28/8: MAI-Voice-1 AI và MAI-1-preview. Công ty cho biết mô hình giọng nói MAI-Voice-1 mới của họ có thể tạo ra âm thanh dài một phút trong vòng chưa đầy một giây chỉ trên một GPU, trong khi MAI-1-preview "cung cấp cái nhìn thoáng qua về các sản phẩm tương lai bên trong Copilot".
Microsoft đã sử dụng MA1-Voice-1 để hỗ trợ một số tính năng của mình, bao gồm Copilot Daily, nơi người dẫn chương trình AI đọc lại những tin tức nổi bật trong ngày và tạo ra các cuộc thảo luận theo phong cách podcast để giúp giải thích các chủ đề.
Bạn có thể tự mình dùng thử MA1-Voice-1 trên Copilot Labs, nơi bạn có thể nhập nội dung bạn muốn mô hình AI nói, cũng như thay đổi giọng nói và phong cách nói của nó. Ngoài mô hình này, Microsoft còn giới thiệu MAI-1-preview, được cho là đã được đào tạo trên khoảng 15.000 GPU Nvidia H100. Nó được xây dựng cho những người dùng cần một mô hình AI có khả năng làm theo hướng dẫn và "cung cấp phản hồi hữu ích cho các truy vấn hàng ngày".
Giám đốc AI của Microsoft, Mustafa Suleyman, đã phát biểu trong một tập của Decoder năm ngoái rằng các mô hình AI nội bộ của công ty không tập trung vào các trường hợp sử dụng trong doanh nghiệp. "Theo tôi, chúng tôi phải tạo ra thứ gì đó hoạt động cực kỳ hiệu quả cho người dùng và thực sự tối ưu hóa cho trường hợp sử dụng của chúng tôi", Suleyman nói. "Vì vậy, chúng tôi có một lượng lớn dữ liệu rất có khả năng dự đoán và rất hữu ích về mặt quảng cáo, về dữ liệu từ xa của người dùng, v.v. Trọng tâm của tôi là xây dựng các mô hình thực sự hiệu quả cho người dùng đồng hành."
Microsoft AI dự định triển khai bản xem trước MAI-1 cho một số trường hợp sử dụng văn bản nhất định trong trợ lý AI Copilot, hiện đang dựa trên các mô hình ngôn ngữ lớn của OpenAI. Công ty cũng đã bắt đầu thử nghiệm công khai mô hình xem trước MAI-1 của mình trên nền tảng đánh giá AI LMArena.
"Chúng tôi có tham vọng lớn về hướng đi tiếp theo", Microsoft AI viết trong bài đăng trên blog. “Chúng tôi không chỉ theo đuổi những tiến bộ hơn nữa ở đây mà còn tin rằng việc sắp xếp một loạt các mô hình chuyên biệt phục vụ các mục đích và trường hợp sử dụng khác nhau của người dùng sẽ mang lại giá trị to lớn.”
📬 Nếu thấy bản tin hữu ích?
Hãy chia sẻ đến cộng đồng sáng tạo mà bạn yêu quý – và giúp TAG có thêm động lực lan toả sức mạnh của AI đến nhiều người hơn nữa! và đừng quên theo dõi Fanpage THE AI GROWTH để cập tin nha hơn nhé!
Và nếu bạn muốn nâng cấp kiến thức và sở hữu cho mình một hệ thống AI Agent cực đỉnh vận hành tự động cho cá nhân hay chính doanh nghiệp của mình đừng quên xem ngay các khóa học mới nhất của TAG
[KHÓA HỌC NÂNG CAO XÂY DỰNG AI AGENTS CHO DOANH NGHIỆP]: https://www.facebook.com/share/p/1ahMsEsSUy/
Một hệ thống giúp bạn:
Giảm 70% công việc lặp lại, tăng 300% output nội dung, tự động hóa 80% quy trình sale & marketing.
Tăng 40% chuyển đổi nhờ AI chatbot, giảm 60% chi phí marketing, nâng 200% chất lượng CSKH.
Vượt trội đối thủ 2-3 năm về công nghệ, sở hữu mô hình kinh doanh – dễ nhân bản, khó bị sao chép bởi USP độc quyền.
Dễ dàng mở rộng (Scale up) không giới hạn – bạn có thể x10, x100 với AI Agent mà không cần thêm nhân sự.

Cảm ơn bạn đã đồng hành cùng The AI Growth!
Trân trọng,
The AI Growth Team
Kiến tạo giá trị – Dẫn dắt cuộc chơi!