- The AI Growth
- Posts
- Kling AI 2.0 chính thức ra mắt: Kỷ nguyên mới của video AI đã bắt đầu
Kling AI 2.0 chính thức ra mắt: Kỷ nguyên mới của video AI đã bắt đầu
Ngoài ra, ChatGPT tốn hàng chục triệu USD vì người dùng nói “cảm ơn”

Welcome, Growth Pioneers! 🚀
Kling AI 2.0 giải quyết triệt để những thiếu sót trong quá khứ, mang đến khả năng kiểm soát sáng tạo vô song để đáp ứng nhu cầu ngày càng tăng cao về các công cụ video do AI điều khiển.
OpenAI và nhiều công ty AI khác đang phải chi khoản tiền lớn khi người dùng sử dụng các cụm từ như "vui lòng" hay "cảm ơn" để tương tác với chatbot. Theo khảo sát của Future, 70% người dùng thể hiện sự lịch sự khi giao tiếp với trí tuệ nhân tạo, dù các hệ thống không cảm xúc và làm tăng chi phí điện năng.
_____________________________________________________________________
Trong bản tin hôm nay, bạn sẽ khám phá:
• Kling AI 2.0 chính thức ra mắt: Kỷ nguyên mới của video AI đã bắt đầu
• ChatGPT tốn hàng chục triệu USD vì người dùng nói “cảm ơn”
KLING AI
Kling AI 2.0 chính thức ra mắt: Kỷ nguyên mới của video AI đã bắt đầu
Trong tháng 4/2025 vừa qua, tại Bắc Kinh, Kuaishou đã chính thức giới thiệu phiên bản Kling AI 2.0 – bước tiến lớn của mô hình tạo video và ảnh bằng AI, đánh dấu sự thay đổi ngoạn mục trong khả năng sáng tạo thị giác. Chỉ sau 10 tháng kể từ bản đầu tiên, Kling đã được nâng cấp hơn 20 lần, thu hút hơn 22 triệu người dùng toàn cầu – nhưng bản 2.0 mới thực sự là bước nhảy vọt.
Kling AI 2.0 giải quyết triệt để những thiếu sót trong quá khứ, mang đến khả năng kiểm soát sáng tạo vô song để đáp ứng nhu cầu ngày càng tăng cao về các công cụ video do AI điều khiển.
Ảnh chụp màn hình Sự kiện ra mắt toàn cầu Kling AI 2.0 - Nguồn: Kling AI
Những điểm nổi bật của Kling AI 2.0
1. Ra mắt phiên bản Kling AI 2.0 Master
Phiên bản mới này nâng cao khả năng tạo video từ văn bản và hình ảnh, với chất lượng điện ảnh, chuyển động mượt mà và khả năng hiểu ngữ nghĩa tốt hơn.
Hỗ trợ hơn 60 phong cách hình ảnh khác nhau, cho phép người dùng tạo ra các video đa dạng và phong phú.
2. Ngôn ngữ hình ảnh đa phương thức (MVL)
MVL cho phép người dùng kết hợp nhiều loại dữ liệu đầu vào như văn bản, hình ảnh, video, âm thanh và chuyển động để truyền đạt ý tưởng sáng tạo một cách chính xác hơn.
Tính năng này giúp AI hiểu và phản hồi tốt hơn các yêu cầu phức tạp từ người dùng.
3. Công cụ chỉnh sửa đa yếu tố
Người dùng có thể thêm, xóa hoặc thay thế các yếu tố trong video bằng cách sử dụng văn bản hoặc hình ảnh, mang lại sự linh hoạt cao trong quá trình chỉnh sửa.
Hỗ trợ chỉnh sửa hình ảnh như vẽ lại một phần, mở rộng khung hình và thay đổi phong cách nghệ thuật mà vẫn giữ nguyên nội dung gốc.
4. Cải tiến về chất lượng hình ảnh và chuyển động
Kling AI 2.0 sử dụng cơ chế chú ý không gian-thời gian 3D, giúp mô phỏng chuyển động và vật lý một cách chân thực, từ các biểu cảm nhỏ đến các hành động phức tạp.
Khả năng tạo ra các video có độ phân giải cao, chi tiết phong phú và phong cách nhất quán.
Tính năng chi tiết và thông tin kỹ thuật
Kling AI 2.0 giới thiệu bốn trụ cột chính, mỗi trụ cột được thiết kế để cải thiện trải nghiệm của người dùng và chất lượng đầu ra:
Master Engine: Bản nâng cấp này giải quyết "hiệu ứng nhấp nháy", một vấn đề phổ biến trong các video do AI tạo ra, trong đó các khung hình không kết nối mượt mà. Nó tăng cường tính nhất quán về mặt thời gian, đảm bảo chuyển động tự nhiên, điều này rất quan trọng đối với các đầu ra chuyên nghiệp. Ví dụ, các chuỗi hành động như cảnh chiến đấu hiện tuân thủ vật lý thực tế, giảm các chuyển tiếp gây khó chịu.
Kiểm soát màu sắc nâng cao: Người sáng tạo giờ đây có thể tinh chỉnh ánh sáng, kết cấu và phối màu, mang lại sự linh hoạt nghệ thuật hơn. Điều này đặc biệt hữu ích để duy trì tính thẩm mỹ của thương hiệu trong video tiếp thị hoặc đạt được phong cách hình ảnh cụ thể trong các dự án nghệ thuật.
Công cụ biên tập cảnh: Người dùng có thể xây dựng từng phần tử của cảnh, kiểm soát tiền cảnh, trung cảnh và hậu cảnh. Phương pháp chi tiết này cho phép biên tập chính xác, tương tự như các kỹ thuật làm phim truyền thống và lý tưởng cho các cảnh quay phức tạp đòi hỏi phải lập kế hoạch chi tiết.
Tinh chỉnh sau khi tạo: Tính năng này cho phép chỉnh sửa sau khi tạo video, thu hẹp khoảng cách giữa AI và chỉnh sửa truyền thống. Người sáng tạo có thể điều chỉnh các yếu tố sau khi sản xuất, giúp tích hợp dễ dàng hơn vào quy trình làm việc hiện có.
Mô hình tận dụng các công nghệ tiên tiến, bao gồm sự chú ý chung không gian thời gian 3D, Diffusion Transformer và 3D Variational Autoencoder (VAE), như đã lưu ý trong tài liệu Kling AI trước đó (Stable Diffusion Art). Những công nghệ này hỗ trợ khả năng tạo video chất lượng cao dài tới 2 phút ở tốc độ 30 khung hình/giây, mặc dù phiên bản hiện tại bị giới hạn ở các phân đoạn 10 giây ở độ phân giải 720p, dự kiến sẽ sớm có độ phân giải 1080p.
Phân tích hiệu suất
Nguồn Kling AI
Chuyển văn bản thành video: Kling AI 2.0 cho thấy khả năng hiểu lời nhắc được cải thiện, xử lý các cảnh quay tuần tự phức tạp và hướng dẫn kỹ thuật về máy ảnh như "ống kính 85mm với độ sâu trường ảnh nông". Nó đảm bảo tương tác giữa nhân vật và đối tượng nhất quán và vật lý mạch lạc, khiến nó phù hợp với công việc thương mại. Tuy nhiên, đầu ra được mô tả là bảo thủ, có khả năng kém lý tưởng hơn đối với các dự án mang tính thử nghiệm hoặc nghệ thuật cao.
Image-to-Video: Đây vẫn là một tính năng nổi bật, tạo ra cảnh quay có thể sử dụng trong 1-2 lần thử. Hoạt ảnh đi bộ hiện hiển thị vị trí đặt chân thích hợp, phản ứng với kết cấu bề mặt và duy trì tính nhất quán trong tối đa 10 giây mà không biến đổi khuôn mặt. Tính năng này đặc biệt có giá trị đối với những người sáng tạo cần tạo hoạt ảnh cho hình ảnh tĩnh với nỗ lực tối thiểu.
Các hạn chế bao gồm giới hạn độ phân giải 720p và độ dài phân đoạn 10 giây, có thể yêu cầu tạo chuỗi thế hệ cho các video dài hơn. Tính nhất quán của nhân vật có thể bị ảnh hưởng khi kết hợp các phân đoạn, một thách thức đối với các câu chuyện dài.
Đánh giá của người dùng và phản hồi của cộng đồng
Phản ứng của công chúng đối với Kling AI 2.0, được thu thập từ các cộng đồng Reddit cho thấy sự pha trộn giữa sự phấn khích và chỉ trích, phản ánh tác động của nó đối với bối cảnh tạo video AI. Người dùng trên r/singularity đã ca ngợi những tiến bộ của nó, với một bài đăng có tiêu đề "KLING 2.0 là trình tạo video tốt nhất trên thế giới" thu hút được 61 lượt bình chọn và 31 bình luận, cho thấy sự tham gia mạnh mẽ của cộng đồng. Một người dùng đã ca ngợi tính mạch lạc và chất lượng của nó, nói rằng, "Tôi đã chơi với 2.0 và nó thực sự tuyệt vời cho đến nay! Đặc biệt là về tính mạch lạc + chất lượng, tôi rất ngạc nhiên", mặc dù họ đặt câu hỏi về tính hợp lệ của một số số liệu hiệu suất do Kuaishou đưa ra. Một bài đăng khác trên có tiêu đề "Kling 2.0 là ĐIÊN RỒ - Kể câu chuyện của bạn", mô tả đầu ra là "khá ấn tượng", đặc biệt là đối với phim ngắn, nhấn mạnh khả năng xử lý các lời nhắc phức tạp với chuyển động rõ ràng và ít hiện tượng nhiễu.
Tuy nhiên, không phải tất cả phản hồi đều tích cực. Một số người dùng đã báo cáo về sự thụt lùi so với Kling 1.6, một người lưu ý rằng, "Cho đến nay, các thế hệ img-vid của tôi tệ hơn đáng kể so với 1.6. Thay đổi phong cách tùy ý, tuân thủ nhanh hơn so với 1.6, một số thứ ngẫu nhiên kỳ lạ xuất hiện đột ngột". Điều này cho thấy sự không nhất quán về phong cách và độ trung thực nhanh, có thể khiến những người sáng tạo tìm kiếm đầu ra đáng tin cậy thất vọng. Giá cả cũng gây ra tranh cãi, với một người dùng trên r/singularity than thở rằng, "Rõ ràng là mọi người đang tức giận về giá cả, khoảng 2 đô la cho một clip 10 giây", so sánh nó với Veo 2 của Google và cho rằng nó không phù hợp với người dùng thông thường. Quan điểm này cũng được lặp lại ở những nơi khác, với những lời phàn nàn về chi phí khiến nó phù hợp hơn với những người chuyên nghiệp hơn là những người yêu thích.
Đánh giá tích cực thường tập trung vào những cải tiến cụ thể, chẳng hạn như khả năng chỉnh sửa đối tượng, cho phép người dùng thêm, xóa hoặc thay thế các thành phần trong video, mà một người dùng gọi là "bước ngoặt" đối với sản xuất phim ngắn. Cộng đồng r/aivideo nhấn mạnh tiềm năng kể chuyện của mình, với người dùng hào hứng tạo ra nội dung chất lượng cao, hướng đến cốt truyện. Tuy nhiên, vẫn còn những trục trặc kỹ thuật, bao gồm các hiện vật và thách thức thỉnh thoảng với tính nhất quán của nhân vật trong các chuỗi dài hơn, như đã lưu ý trong các cuộc thảo luận về việc nối nhiều phân đoạn dài 10 giây.
Nhìn chung, Kling AI 2.0 đã tạo nên tiếng vang đáng kể nhờ chất lượng nâng cao và khả năng kiểm soát sáng tạo, nhưng chi phí cao và đôi khi không nhất quán làm giảm sự nhiệt tình, đặc biệt là đối với những người dùng không chuyên nghiệp. Những hiểu biết sâu sắc này phản ánh một công cụ đang vượt qua ranh giới nhưng vẫn cân bằng giữa khả năng tiếp cận và sự hoàn hảo.
OPENAI
ChatGPT tốn hàng chục triệu USD vì người dùng 'cảm ơn'
Ngày 16/4, tài khoản @tomiinlove viết trên X: "Tôi tự hỏi OpenAI mất bao nhiêu tiền điện khi người dùng nói làm ơn hay cảm ơn". Câu hỏi nhanh chóng thu hút hơn 5 triệu lượt xem và hàng trăm nghìn lượt tương tác.
Sam Altman sau đó trả lời: "Hàng chục triệu USD", nhưng nói điều đó xứng đáng.
Phản hồi của Altman cho thấy OpenAI và nhiều công ty AI khác đang phải chi khoản tiền lớn khi người dùng sử dụng các cụm từ như "vui lòng" hay "cảm ơn" để tương tác với chatbot. Theo khảo sát của Future, 70% người dùng thể hiện sự lịch sự khi giao tiếp với trí tuệ nhân tạo, dù các hệ thống không cảm xúc và làm tăng chi phí điện năng.
Nguồn: TechCrunch
Biên tập viên Becca Caddy của TechRadar từng ngừng nói lời cảm ơn ChatGPT nhưng nhận thấy thái độ lịch sự có thể cải thiện chất lượng phản hồi. Cô đặt câu hỏi liệu có nên tiếp tục lịch sự với AI để có trải nghiệm tốt hơn, nhưng phải đánh đổi về tác động môi trường hay không.
Trang Dev.ua hỏi ChatGPT có muốn nhận lời cảm ơn từ người dùng không nếu chi phí xử lý lên hàng chục triệu USD. ChatGPT nói: "Không, tôi không mong đợi điều đó. Bạn có mọi quyền sử dụng tôi theo cách phù hợp: ngắn gọn, nhanh chóng, không có 'làm ơn' và 'cảm ơn'. Điều này không ảnh hưởng đến công việc của tôi, tôi không bị xúc phạm, tôi không mệt mỏi và tôi không cần sự lịch sự để phản hồi một cách định tính"
Trước đó, một số nghiên cứu đã chỉ ra, để tạo email 100 từ bằng ChatGPT với mô hình GPT-4 cần một chai nước hoặc 0,14 kWh điện, tương đương việc cung cấp năng lượng cho 14 bóng đèn LED trong một giờ.
Tương lai nội dung là do AI kiến tạo – Ai cập nhật sớm, là người làm chủ cuộc chơi.
Và nếu bạn muốn tiếp tục cập nhật và đào sâu kiến thức AI cho bản thân hoặc đội ngũ của mình, đừng bỏ lỡ các khóa học AI chuyên sâu và tài nguyên mà The AI Growth (TAG) đang cung cấp. Cơ hội để bạn dẫn đầu xu hướng AI ngay hôm nay!
👉 Khám phá khóa học AI mới nhất tại TAG: LINK KHÓA HỌC
📬 Nếu bạn thấy email này hữu ích, hãy chia sẻ cho cộng đồng sáng tạo của bạn!
Để TAG có thêm động lực tiếp tục cập nhật các tin tức mới nhất và hot nhất về chuyển động AI hiện tại!
Cám ơn đã đồng hành cùng TAG Chúc bạn thành công trên hành trình chinh phục AI,
The AI Growth Team ❤️
Bạn nghĩ nội dung hôm nay thế nào? Trước khi bạn rời đi, chúng tôi rất mong muốn biết ý kiến của bạn về bản tin hôm nay để giúp TAG cải thiện trải nghiệm nội dung cho bạn. |