The AI Growth
Posts
Gemini 2.0 - AI toàn diện có thể thay thế con người

Gemini 2.0 - AI toàn diện có thể thay thế con người

Ngoài ra: OpenAI ra mắt chế độ video với giọng nói nâng cao cho ChatGPT

The AI Growth Team
December 18, 2024

Welcome, Growth Pioneers! 🚀

Google vừa ra mắt Gemini 2.0, một trí tuệ nhân tạo đa năng có khả năng tạo văn bản, âm thanh và hình ảnh, chỉnh sửa hình ảnh bằng lệnh thoại, thay thế Photoshop.

OpenAI đã giới thiệu chế độ video và giọng nói nâng cao cho ChatGPT, cho phép nhận diện hình ảnh qua camera và chia sẻ màn hình, dành cho người dùng các gói Plus, Pro, Team và sẽ mở rộng cho Enterprise & Edu vào tháng 1.

Email Newsletter này sẽ đề cập:

Google ra mắt Gemini 2.0 - AI toàn diện có thể thay thế con người
Tạm biệt Photoshop, Gemini 2.0 giờ đây có thể chỉnh sửa hình ảnh bằng các câu lệnh
OpenAI ra mắt chế độ video với giọng nói nâng cao cho ChatGPT

GEMINI
GOOGLE: GEMINI 2.0 - AI TOÀN DIỆN CÓ THỂ THAY THẾ CON NGƯỜI

Nguồn: Gemini

Trí tuệ nhân tạo (AI) - Gemini 2.0 của Google hứa hẹn cực kỳ linh hoạt về khả năng tạo văn bản, âm thanh và hình ảnh.

Gemini 2.0 không chỉ cung cấp các tính năng đa phương thức mới mà còn đặt nền tảng cho một bước tiến lớn trong lĩnh vực AI: khả năng thay thế con người trong các hoạt động hằng ngày. Mô hình AI này được phát triển nhằm cải thiện hiệu suất và tiết kiệm năng lượng, đồng thời Google đang tích cực tích hợp AI vào các sản phẩm của mình để tạo ra những giải pháp thương mại thành công.

CEO Google DeepMind Demis Hassabis đã ca ngợi Gemini 2.0 là một mô hình toàn diện, mang lại một cấp độ khả năng hoàn toàn khác, đặc biệt trong lĩnh vực AI đặc vụ. Bot AI, có khả năng thực hiện các hành động thay mặt con người.

Ví dụ:

Project Astra, một hệ thống trực quan giúp nhận diện đồ vật và tìm kiếm đồ vật bị thất lạc.
Tiện ích mở rộng cho trình duyệt Chrome có tên Project Mariner, vốn cho phép mô phỏng hành vi của người dùng khi lướt web.
Bot AI Jules nhằm hỗ trợ các nhà phát triển trong việc tìm và sửa lỗi mã.

AI TOOLS
TẠM BIỆT PHOTOSHOP, GEMINI 2.0 GIỜ ĐÂY CÓ THỂ CHỈNH SỬA HÌNH ẢNH BẰNG CÁC CÂU LỆNH ĐƠN GIẢN

Nguồn: Awa K.Penn

Gemini 2.0 mang đến khả năng chỉnh sửa hình ảnh bằng lệnh thoại với các tính năng nổi bật:

1/ Chỉnh sửa dễ dàng và chính xác: Việc chỉnh sửa hình ảnh giờ đây cực kỳ đơn giản! Bạn không cần phải gõ bất cứ điều gì - chỉ cần nói chuyện với AI và mô tả cách bạn muốn chỉnh sửa hình ảnh.

2/ Xóa vật thể dễ dàng: Nhanh chóng loại bỏ bất kỳ vật thể không mong muốn nào khỏi hình ảnh—không cần công cụ, chỉ cần nói lệnh của bạn cho Gemini.

3/ Kết hợp hình ảnh dễ dàng: Không còn phải che phủ hoặc pha trộn tẻ nhạt nữa — dễ dàng di chuyển các đối tượng từ hình ảnh này sang hình ảnh khác.

4/ Khám phá hình ảnh của bạn: Xem các đối tượng từ các góc nhìn khác nhau và tương tác với chúng một cách dễ dàng.

5/ Điều khiển hình ảnh của bạn: Mở rộng khả năng sáng tạo của bạn—chỉ đạo các đối tượng trong hình ảnh của bạn để thực hiện các hành động phức tạp chỉ bằng cách ra lệnh cho AI.

OPENAI
OPENAI RA MẮT CHẾ ĐỘ VIDEO VỚI GIỌNG NÓI NÂNG CAO CHO CHATGPT

Nguồn: OpenAI

OpenAI vừa chính thức giới thiệu tính năng mới mang tên Chế độ giọng nói nâng cao với tầm nhìn cho ChatGPT. Tính năng này cho phép ChatGPT nhận diện hình ảnh trực tiếp thông qua camera điện thoại và chia sẻ màn hình, mang lại trải nghiệm tương tác phong phú hơn cho người dùng.

Chế độ Video hiện có sẵn cho những người đăng ký các gói ChatGPT Plus, Pro và Team. Người dùng có thể hướng camera điện thoại vào các vật thể hoặc chia sẻ màn hình máy tính để nhận phản hồi phù hợp với ngữ cảnh.

Để sử dụng chế độ Video, người dùng chỉ cần:

Nhấn vào biểu tượng giọng nói bên cạnh thanh trò chuyện.
Chọn biểu tượng video.
Để chia sẻ màn hình, truy cập thông qua menu ba chấm.

Tính năng này hữu ích cho các tác vụ như giải thích cách cài đặt thiết bị hoặc tìm giải pháp cho các vấn đề phức tạp.

Thời Gian Triển Khai:

Bắt đầu triển khai: Tuần này cho các người dùng hiện tại.
Người dùng Enterprise và Edu: Dự kiến sẽ được cấp quyền truy cập vào tháng 1.
Các khu vực chưa rõ: Người dùng tại EU, Thụy Sĩ, Iceland, Na Uy và Liechtenstein vẫn chưa có thông tin cụ thể về thời gian ra mắt.

Trong buổi trình diễn trên chương trình "60 Minutes" của CNN, Chủ tịch OpenAI, Greg Brockman, đã chứng minh khả năng của Chế độ Video bằng cách yêu cầu ChatGPT phân tích các bản vẽ giải phẫu của phóng viên Anderson Cooper. ChatGPT đã xác định chính xác các bộ phận cơ thể, nhưng cũng gặp phải một số lỗi nhỏ trong một bài thử thách về hình học, cho thấy vẫn còn tiềm năng để cải thiện.

Ngoài ra, OpenAI còn ra mắt "Chế độ Santa", mang đến giọng nói của Ông già Noel vào ChatGPT. Người dùng có thể kích hoạt chế độ này thông qua biểu tượng bông tuyết trong ứng dụng, tạo không khí lễ hội vui vẻ.

Các đối thủ cạnh tranh như Project Astra của Google cũng đang phát triển các tính năng tương tự về AI video thời gian thực, hứa hẹn sẽ mang lại nhiều lựa chọn hơn cho người dùng trong tương lai.

OpenAI tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực trí tuệ nhân tạo với những cập nhật mới, mang đến trải nghiệm người dùng đa dạng và tiện ích hơn.

PROMPT OF THE DAY (Prompt của ngày)
Tạo bài blog về lợi ích của SEO và GEO trong việc tăng lượng truy cập tự nhiên cho doanh nghiệp với AI 📝

Viết một bài blog về lợi ích của SEO&GEO trong việc tăng lượng truy cập tự nhiên cho doanh nghiệp vừa và nhỏ, tập trung vào cách sử dụng AI và Automation để đạt được kết quả gấp 10 lần.

TAG

Cảm ơn bạn đã lắng nghe!

Hẹn gặp bạn ở lần tới.

The AI Growth Team 😄 😄 ❤️