The AI Growth
Posts
Google và OpenAI cạnh tranh: Veo 2, Imagen 3 và ChatGPT Search miễn phí

Google và OpenAI cạnh tranh: Veo 2, Imagen 3 và ChatGPT Search miễn phí

Ngoài ra: DiffSensei - Công cụ biến văn bản thành truyện tranh, bước tiến mới của sáng tạo.

The AI Growth Team
December 19, 2024

Welcome, Growth Pioneers! 🚀

Google giới thiệu Veo 2 (tạo video 4K chân thực, tích hợp YouTube Shorts 2025) và Imagen 3 (nâng cấp hình ảnh, vượt qua Midjourney). OpenAI mở tính năng Tìm kiếm ChatGPT miễn phí, cải tiến hỗ trợ giọng nói và trải nghiệm di động.

DiffSensei biến văn bản thành truyện tranh Manga, tự động hóa việc tạo nhân vật, bố trí cảnh nền, và hộp thoại, giúp kể chuyện liền mạch và cá nhân hóa.

Email Newsletter này sẽ đề cập:

Veo 2 - Mô hình tạo video với độ chân thật đáng kinh ngạc
ChatGPT Search giờ đây miễn phí cho tất cả mọi người
DiffSensei: Biến văn bản thành truyện tranh Manga!

VEO 2
VEO 2 - MÔ HÌNH TẠO VIDEO VỚI ĐỘ CHÂN THẬT ĐÁNG KINH NGẠC

Nguồn: Veo 2

Google vừa công bố phát hành Veo 2, một mô hình tạo video tiên tiến tạo ra các đầu ra có độ phân giải cao với độ chân thực và chi tiết đáng kinh ngạc — cùng với Imagen 3, một mô hình hình ảnh được nâng cấp cũng cung cấp chất lượng tiên tiến.

Veo 2:

Veo 2 có thể tạo các clip dài 8 giây ở độ phân giải 4K (720p khi ra mắt) với những nâng cấp đáng kể về chất lượng kiểm soát điện ảnh.
Mô hình này cũng cho thấy những cải tiến lớn về mô phỏng vật lý và giảm ảo giác, dẫn đến chuyển động và chi tiết chân thực hơn.
Veo 2 đã vượt trội hơn tất cả các đối thủ cạnh tranh trong các đánh giá trực tiếp của con người và tuân thủ prompt, bao gồm cả Sora được OpenAI phát hành gần đây.
Mô hình này đang được triển khai dần dần thông qua danh sách chờ VideoFX, với kế hoạch tích hợp YouTube Shorts vào năm 2025.

Imagen 3:

Mô hình được nâng cấp mang đến độ rung màu và bố cục nâng cao trên các phong cách nghệ thuật, với khả năng xử lý tốt hơn các chi tiết, kết cấu và kết xuất văn bản tốt.
Các khả năng mới bao gồm diễn giải prompt chính xác hơn và kết xuất tốt hơn các cảnh phức tạp phù hợp với ý định của người dùng.
Imagen 3 đã vượt trội hơn tất cả các mô hình, bao gồm Midjourney, Flux và Ideogram, trong các đánh giá của con người về sở thích, chất lượng hình ảnh và tuân thủ prompt.
Mô hình hiện có sẵn thông qua ImageFX của Google Labs và đang được triển khai tại hơn 100 quốc gia.

Google đang có một kết thúc năm 2024 cực kỳ lớn — đầu tiên là Gemini 2.0 và bây giờ là Veo 2 và Imagen 3. Các mô hình này dường như nâng tầm trong cả hai danh mục, mang lại cho Google hiệu suất tiên tiến trong hầu hết mọi lĩnh vực của AI. OpenAI có thể có sự cường điệu trong mùa lễ này, nhưng Google đang cho thấy kết quả.

CHATGPT SEARCH
CHATGPT SEARCH GIỜ ĐÂY MIỄN PHÍ CHO TẤT CẢ MỌI NGƯỜI

Nguồn: ChatGPT

OpenAI vừa công bố việc mở rộng đáng kể tính năng Tìm kiếm ChatGPT, cung cấp miễn phí cho tất cả người dùng cùng với khả năng tìm kiếm bằng giọng nói và các tính năng di động được cải thiện.

Tính năng tìm kiếm trước đây chỉ dành cho người dùng trả phí, giờ đây được mở rộng cho tất cả người dùng đã đăng nhập, với tốc độ phản hồi nhanh hơn và có thể truy cập thông qua biểu tượng quả địa cầu trên nền tảng.

Tìm kiếm cũng đã được thêm vào Chế độ Giọng nói Nâng cao cho người dùng trả phí, cho phép họ thực hiện tìm kiếm thông qua các câu lệnh thoại tự nhiên.

Trải nghiệm Tìm kiếm trên thiết bị di động đã được cải tiến, với bố cục hình ảnh nâng cao cho các doanh nghiệp địa phương và tích hợp sẵn với Google và Apple Maps.

Người dùng cũng có thể đặt Tìm kiếm ChatGPT làm công cụ tìm kiếm mặc định, với các kết quả hiển thị các liên kết liên quan trước các phản hồi văn bản của ChatGPT để truy cập nhanh hơn.

Khả năng truy cập web và thông tin cập nhật của ChatGPT là một bước quan trọng hướng tới một tương lai chủ động, đặc biệt là trong Chế độ Giọng nói Nâng cao - biến công cụ này thành một phiên bản thông minh và mạnh mẽ hơn của Siri (và có thể cung cấp năng lượng cho nó sau này). Tìm kiếm sắp thay đổi theo một hướng lớn trong kỷ nguyên AI.

DIFFSENSEI
DIFFSENSEI: BIẾN VĂN BẢN THÀNH TRUYỆN TRANH MANGA!

Nguồn: Diffsensei

DiffSensei giúp tạo hình nhân vật và biểu cảm theo mô tả, và tự động bố trí các hộp thoại và cảnh nền để kể một câu chuyện liền mạch và hấp dẫn.

Điểm nổi bật:

Tùy chỉnh ngoại hình, trạng thái, hành động nhân vật từ nội dung văn bản.
Bố trí linh hoạt: biểu cảm, vị trí hộp thoại, cảnh nền.
Sử dụng dữ liệu MangaZero với 48 series truyện, 43,264 trang, 427,147 khung hình chú thích chi tiết.

📊 Hiệu quả vượt trội:

Đánh giá tự động: Chỉ số FID, CLIP, DINO khẳng định chất lượng hình ảnh cao, bám sát nội dung.
Nghiên cứu người dùng: Điểm cao về tính nhất quán nhân vật, phù hợp hình ảnh - nội dung, và chất lượng câu chuyện.
So sánh định tính: Khung truyện biểu cảm, bố cục logic, lời thoại phù hợp.

💡 Ứng dụng tiềm năng:

Tạo truyện tranh và phim hoạt hình tự động.
Giáo dục thông minh.
Marketing và nội dung cá nhân hóa.

PROMPT OF THE DAY (Prompt của ngày)
Tạo thiệp chúc mừng Giáng Sinh dành cho công ty gửi đến các đối tác với AI 📝

"Create an elegant and festive digital greeting card for a company to send to its partners, celebrating Christmas. The card should feature a modern design with a professional yet warm tone. Include elements like a Christmas tree, ornaments, and snowflakes, along with a message that says 'Merry Christmas & Happy New Year!' in elegant typography. Add the company's logo at the bottom corner and ensure the colors are in harmony, such as gold, green, and red, to evoke the holiday spirit. The layout should have space for the company name and a personal touch to make partners feel appreciated."

TAG

Cảm ơn bạn đã lắng nghe!

Hẹn gặp bạn ở lần tới.

The AI Growth Team 😄 😄 ❤️