- The AI Growth
- Posts
- Midjourney đã ra mắt mô hình tạo video AI đầu tiên cực sống động
Midjourney đã ra mắt mô hình tạo video AI đầu tiên cực sống động
Ngoài ra, Google ra mắt Search Live: Trò chuyện, lắng nghe và tìm kiếm theo thời gian thực


Welcome, Growth Pioneers! 🚀
Midjourney, nền tảng nổi tiếng với công nghệ tạo hình ảnh bằng trí tuệ nhân tạo (AI), vừa đánh dấu một bước tiến quan trọng khi ra mắt V1 – công cụ tạo video AI đầu tiên của hãng. Phiên bản V1 cho phép người dùng biến những hình ảnh tĩnh thành các video clip sống động.
Mô hình V1 của Midjourney hoạt động như thế nào?
V1 hoạt động dựa trên mô hình “image-to-video” (chuyển đổi từ hình ảnh sang video). Để bắt đầu, người dùng chỉ cần tải lên một hình ảnh có sẵn hoặc sử dụng một tác phẩm do chính Midjourney tạo ra. Từ đó, công cụ sẽ phân tích và chuyển đổi hình ảnh này thành một video clip ngắn 5 giây.
Người dùng có thể tùy chọn kéo dài thời lượng video lên tối đa 20 giây. Tương tự như khi tạo ảnh, mỗi lần yêu cầu, hệ thống sẽ đưa ra bốn phiên bản video khác nhau để người dùng lựa chọn. Ngoài ra, người dùng có thể cung cấp thêm các câu lệnh văn bản (prompt) để tinh chỉnh nội dung video, mang lại sự linh hoạt và khả năng sáng tạo không giới hạn.
Để sử dụng V1, người dùng cần đăng ký một trong các gói dịch vụ của Midjourney. Gói cơ bản có giá 10 USD/tháng, cung cấp khoảng 3,3 giờ xử lý GPU nhanh, đủ để tạo khoảng 200 hình ảnh. Tuy nhiên, việc tạo video tiêu tốn tài nguyên hơn đáng kể. Chi phí ước tính cao gấp tám lần so với tạo ảnh, có nghĩa là mỗi giây video sẽ tốn chi phí tương đương với việc tạo ra một hình ảnh.
Bên cạnh gói cơ bản, Midjourney còn có các gói cao cấp hơn như Pro (khoảng 60 USD/tháng) và Mega (khoảng 120 USD/tháng). Các gói này không chỉ cung cấp thêm thời gian xử lý GPU mà còn đi kèm chế độ “Video Relax Mode”, cho phép người dùng tạo video không giới hạn số lượng nhưng sẽ cần thời gian chờ xử lý. Người dùng đăng ký theo năm sẽ được giảm giá 20%, một lựa chọn tiết kiệm cho những ai có nhu cầu sử dụng thường xuyên.
Bên cạnh đó, Midjourney cũng đã tối ưu hóa quy trình mã hóa video nhằm giảm thiểu tình trạng suy giảm chất lượng (nén) khi chia sẻ lên các nền tảng mạng xã hội. Người dùng được khuyến khích sử dụng tùy chọn “Lưu cho Mạng xã hội” (Save for Social Media) khi xuất video để đảm bảo chất lượng hiển thị tốt nhất trên các nền tảng như Instagram hay TikTok.
Những video đầu tay được tạo bởi V1 đang nhận về phản hồi rất tích cực từ cộng đồng. Nhiều người dùng trên mạng xã hội đã bày tỏ sự ngạc nhiên khi kết quả “vượt xa mong đợi”, đồng thời đánh giá cao tốc độ xử lý và sức sáng tạo mà công cụ mang lại. Đây là tín hiệu cho thấy V1 của Midjourney có đủ tiềm năng để trở thành đối thủ cạnh tranh của Veo 3 do Google phát triển.
Google ra mắt Search Live: Trò chuyện, lắng nghe và tìm kiếm theo thời gian thực
Google đã giới thiệu tính năng mới “Search Live” với đầu vào bằng giọng nói. Hiện tại, tính năng này chỉ khả dụng tại Mỹ cho những người tham gia thử nghiệm AI Mode trong Google Labs. Với trải nghiệm trò chuyện giọng nói hai chiều, Google hứa hẹn sẽ thay đổi cách người dùng tương tác với công cụ tìm kiếm hàng đầu thế giới.
Search Live có gì đặc biệt?
Tính năng “Search Live” cho phép người dùng đặt câu hỏi bằng giọng nói và nhận ngay phản hồi âm thanh từ AI, đi kèm các liên kết web để khám phá thêm thông tin. Điểm đặc biệt nằm ở khả năng tiếp tục đặt câu hỏi mà không cần bắt đầu lại cuộc trò chuyện. Chẳng hạn, khi đang chuẩn bị hành lý, bạn có thể hỏi: “Làm sao để váy không bị nhăn?” rồi ngay sau đó hỏi tiếp: “Nếu váy vẫn nhăn thì làm thế nào?” Google sẽ phản hồi tức thì bằng cả giọng nói và thông tin hiển thị bổ sung.
Ngoài ra, tính năng này hỗ trợ đa nhiệm hiệu quả. Bạn có thể chuyển sang ứng dụng khác mà vẫn duy trì cuộc trò chuyện nhờ chế độ chạy nền. Lịch sử trò chuyện cũng được lưu trong AI Mode, giúp bạn dễ dàng tra cứu lại khi cần.
Để trải nghiệm, người dùng tại Mỹ chỉ cần mở ứng dụng Google trên Android hoặc iOS, tham gia chương trình thử nghiệm AI Mode qua Google Labs, sau đó nhấn vào biểu tượng “Live” mới xuất hiện bên dưới thanh tìm kiếm. Từ đây, bạn có thể thoải mái đặt câu hỏi bằng giọng nói. Giao diện thân thiện với các nút “Mute/Unmute” và lựa chọn giọng nói khác nhau. Nếu muốn, bạn cũng có thể xem lại nội dung dưới dạng văn bản qua nút “Transcript” hoặc nhập câu hỏi bằng tay. Tính năng được thiết kế để hoạt động trơn tru ngay cả khi ứng dụng bị khóa, mang lại sự tiện lợi tối đa cho những người bận rộn.
“Search Live” vận hành nhờ Gemini – mô hình AI tiên tiến do Google phát triển. Tính năng này kết hợp hệ thống thông tin chất lượng cao từ Google Search với kỹ thuật “query fan-out” – một phương pháp giúp tổng hợp và hiển thị nội dung web phong phú, đa dạng. Google dự kiến sẽ tích hợp thêm tính năng sử dụng camera trong vài tháng tới, cho phép người dùng tương tác thời gian thực.
Hiện tại, chỉ những người dùng tại Mỹ tham gia thử nghiệm AI Mode trong Google Labs mới có thể trải nghiệm tính năng này. Sau khi đăng ký, biểu tượng “Live” sẽ xuất hiện trong ứng dụng Google. Đây là giai đoạn thử nghiệm ban đầu để Google hoàn thiện tính năng trước khi mở rộng quy mô. Dù người dùng tại Việt Nam vẫn chưa sử dụng được nhưng với các kế hoạch trong lương lai như tích hợp camera và triển vọng mở rộng toàn cầu cho thấy Google đang hướng tới một tương lai tìm kiếm thông minh, trực quan hơn.
Grok AI vừa ra mắt Workspace tương tự GEM của Gemini
Mấy ngày gần đây chắc anh em cũng thấy Grok AI vừa thả nhẹ một tính năng mới tên là Workspace nghe là thấy hơi giống GEM bên Gemini của Google rồi đúng không. Mình cũng hóng từ lúc nó mới nhá hàng và giờ được trải nghiệm thì thấy khá là bất ngờ vì dùng ổn phết có nhiều cái tiện mà trước giờ phải tự workaround mới làm được
Workspace của Grok là gì và dùng để làm gì?
Hiểu đơn giản thì Workspace là kiểu khu vực làm việc riêng biệt, mỗi workspace giống như một dự án hoặc một chủ đề cụ thể để anh em tập trung vô đó làm việc với AI.
Điểm hay là ngay từ đầu anh em có thể nhập mô tả hoặc mục tiêu chính của workspace đó ví dụ như “Quản lý tài chính cá nhân” hoặc “Làm nội dung cho blog du lịch”. Grok sẽ dựa vào cái brief ban đầu đó để hiểu đúng ngữ cảnh rồi từ đó mọi cuộc hội thoại về sau trong workspace đều bám sát mục tiêu đó luôn không cần phải nhắc đi nhắc lại nữa.
Ngoài ra anh em có thể upload tài liệu, file PDF, Excel hoặc text vào Workspace để Grok đọc và phân tích dữ liệu luôn. Nên ví dụ như anh em đang làm báo cáo hoặc có tài liệu tham khảo thì chỉ cần quăng vô 1 lần là Grok nó nhớ và hiểu cả file, sau đó muốn hỏi gì thì cứ hỏi, không cần up lại cũng không cần giải thích lại context. Quá tiện luôn
Cảm nhận cá nhân sau khi xài thử
Cái mình thích nhất là sự liền mạch khi làm việc, thay vì mỗi lần mở chat mới lại phải kể lại hoàn cảnh, dán lại tài liệu rồi diễn giải lại mục tiêu thì với Workspace anh em chỉ cần làm 1 lần duy nhất. Từ đó mở ra bao nhiêu cuộc hội thoại mới cũng được Grok vẫn trả lời đúng ý vẫn hiểu việc đang làm là gì không bị lạc đề.
Mình thử tạo một workspace tên là "Học Python cho người mới bắt đầu" sau đó upload vài tài liệu học Python cơ bản rồi gõ câu hỏi như “Giải thích giúp mình về hàm lambda” hay “Tổng hợp bài tập về list comprehension” thì Grok trả lời cực kỳ sát nội dung đã up vô, đúng kiểu như có trợ lý AI chuyên theo dõi học hành luôn vậy
Một cái nữa là mình thử làm workspace "Quản lý chi tiêu tháng 6" rồi mỗi lần có khoản thu hoặc chi thì mình cứ gõ vô Grok cập nhật lại list giúp mình còn có thể tổng hợp theo tuần theo loại chi tiêu rất tiện
Anh em cũng có thể tạo workspace để:
Theo dõi tiến độ học code hoặc học tiếng Anh
Lên kế hoạch giảm cân tập gym theo tuần
Ghi chú và phân tích nội dung sách đang đọc
Viết blog cá nhân mỗi bài là một phần trong Workspace cho dễ quản lý
Nói chung là dùng kiểu gì cũng được miễn là nó có logic riêng để phân loại và Grok có ngữ cảnh để hỗ trợ đúng hướng
So sánh Workspace của Grok vs GEM của Gemini
📬 Nếu thấy bản tin hữu ích?
Hãy chia sẻ đến cộng đồng sáng tạo mà bạn yêu quý – và giúp TAG có thêm động lực lan toả sức mạnh của AI đến nhiều người hơn nữa! và đừng quên theo dõi Fanpage THE AI GROWTH để cập tin nhanh chóng hơn nhé!
Và nếu bạn muốn nâng cấp kiến thức và sở hữu cho mình một hệ thống AI Agent cực đỉnh vận hành tự động cho cá nhân hay chính doanh nghiệp của mình đừng quên xem ngay khóa học mới nhất của TAG - “Khóa xây dựng AI Agent cho doanh nghiệp” |
Thông tin chi tiết về khóa học: LINK THÔNG TIN |
Cảm ơn bạn đã đồng hành cùng The AI Growth!
Trân trọng,
The AI Growth Team
Kiến tạo giá trị – Dẫn dắt cuộc chơi!