The AI Growth
Posts
Google ra mắt mô hình AI "Reasoning" mới Gemini 2.0 Flash Thinking Experimental

Google ra mắt mô hình AI "Reasoning" mới Gemini 2.0 Flash Thinking Experimental

Ngoài ra: Deep Research cho thấy Google có thể chiến thắng cuộc đua AI

The AI Growth Team
December 24, 2024

Welcome, Growth Pioneers! 🚀

Google vừa ra mắt mô hình AI mới Gemini 2.0 Flash Thinking Experimental, tập trung vào khả năng hiểu đa phương tiện, lý luận và lập trình, đồng thời giới thiệu công cụ Deep Research hỗ trợ nghiên cứu nâng cao cho người dùng.

Bytedance cũng không đứng ngoài xu hướng với việc giới thiệu INFP, một công nghệ AI độc đáo cho phép biến hình ảnh thành các nhân vật sống động có thể nói và hát từ bất kỳ tệp âm thanh nào, hứa hẹn cách mạng hóa lĩnh vực podcasting.

Email Newsletter này sẽ đề cập:

Google ra mắt mô hình AI "Reasoning" mới Gemini 2.0 Flash Thinking Experimental
Deep Research cho thấy Google có thể chiến thắng cuộc đua AI
Thật sự kinh ngạc! Bytedance ra mắt INFP - AI cho phép hình ảnh nói và hát từ bất kỳ tệp âm thanh nào!

GEMINI
GOOGLE RA MẮT MÔ HÌNH AI “REASONING” MỚI GEMINI 2.0 FLASH THINKING EXPERIMENTAL

Nguồn: Business Analytics

Google vừa công bố mô hình AI mới mang tên Gemini 2.0 Flash Thinking Experimental, hiện đang trong giai đoạn thử nghiệm trên nền tảng AI Studio.

Theo mô tả, Gemini 2.0 được thiết kế tối ưu cho khả năng hiểu đa phương tiện, lý luận và lập trình, với khả năng giải quyết các vấn đề phức tạp trong các lĩnh vực như lập trình, toán học và vật lý.

Logan Kilpatrick, trưởng bộ phận sản phẩm tại AI Studio, cho biết Gemini 2.0 Flash Thinking Experimental là "bước đầu tiên trong hành trình phát triển khả năng lý luận" của Google. Jeff Dean, nhà khoa học trưởng tại Google DeepMind, nhấn mạnh rằng mô hình này được huấn luyện để sử dụng tư duy nhằm củng cố khả năng lý luận.

Trong thử nghiệm ban đầu, Gemini 2.0 cho thấy tiềm năng nhưng vẫn cần cải thiện. Mô hình này thường mất thêm vài giây đến vài phút để đưa ra giải pháp do quá trình lý luận sâu hơn. Ví dụ, khi được hỏi về số lượng chữ "R" trong từ "strawberry", mô hình trả lời sai "hai" thay vì "ba".

Gemini 2.0 Flash Thinking Experimental được xây dựng dựa trên mô hình Gemini 2.0 Flash mới nhất của Google và tương tự như các mô hình lý luận khác như OpenAI’s o1. Những mô hình này có khả năng tự kiểm tra thông tin, giúp tránh được một số sai sót thường gặp ở các mô hình AI thông thường. Tuy nhiên, chi phí vận hành cao và khả năng duy trì tiến bộ lâu dài vẫn là những thách thức đối với các mô hình lý luận.

Sự ra mắt của Gemini 2.0 đã kích thích sự cạnh tranh trong lĩnh vực AI, với nhiều công ty khác như DeepSeek và Alibaba cũng nhanh chóng giới thiệu các mô hình lý luận tương tự. Xu hướng này phản ánh nhu cầu tìm kiếm các phương pháp mới để nâng cao hiệu quả của AI, khi các kỹ thuật mở rộng quy mô truyền thống không còn mang lại những cải tiến như trước.

GOOGLE
DEEP RESEARCH CHO THẤY GOOGLE CÓ THỂ CHIẾN THẮNG CUỘC ĐUA AI

Nguồn: Deep Research

Gần đây, Google đã trình làng công cụ AI mới mang tên Deep Research, một trợ lý nghiên cứu AI dành cho người dùng Gemini Advanced. Đây là một bước tiến đáng kể trong việc phát triển các mô hình ngôn ngữ lớn (LLM) như Gemini, giúp Google bắt kịp và thậm chí vượt qua các đối thủ cạnh tranh trong lĩnh vực AI.

Deep Research Là Gì?

Deep Research hoạt động như một trợ lý nghiên cứu con người, chuyên xử lý những câu hỏi phức tạp và đa diện yêu cầu sự giải thích chi tiết. Khi được đặt câu hỏi về thách thức trong việc tạo ra robot hình người có khả năng thực hiện các nhiệm vụ chưa được đào tạo, Deep Research không chỉ tìm kiếm các bài báo nghiên cứu liên quan mà còn lập kế hoạch nghiên cứu chi tiết và tổng hợp thông tin từ nhiều nguồn khác nhau để đưa ra câu trả lời hoàn chỉnh.

Trong quá trình thử nghiệm, Deep Research đã thể hiện khả năng tìm kiếm và tổng hợp thông tin một cách nhanh chóng và chính xác, với khả năng xử lý một lượng lớn dữ liệu nhờ mô hình Gemini 1.5 Pro có cửa sổ ngữ cảnh lên tới hơn 770,000 từ. Tuy nhiên, vẫn có những trường hợp mô hình mắc lỗi, như khi đếm số chữ "R" trong từ "strawberry" mà chỉ trả lời sai.

Với sự kết hợp giữa nguồn lực mạnh mẽ, kinh nghiệm dày dặn và dữ liệu phong phú, Google đang ở vị thế hàng đầu để dẫn dắt lĩnh vực AI tiêu dùng trong tương lai. Deep Research là minh chứng cho chiến lược tận dụng thế mạnh nội tại của Google để phát triển các công cụ AI tiên tiến.

Sự ra mắt của Gemini Deep Research đã thúc đẩy sự cạnh tranh mạnh mẽ từ các công ty AI khác như DeepSeek và Alibaba, những người cũng đang nhanh chóng phát triển các mô hình lý luận tương tự. Điều này phản ánh nhu cầu không ngừng tìm kiếm các phương pháp mới để nâng cao hiệu quả và khả năng của AI.

BYTEDANCE
THẬT SỰ KINH NGẠC! BYTEDANCE RA MẮT INFP - AI CHO PHÉP HÌNH ẢNH NÓI VÀ HÁT TỪ BẤT KỲ TỆP ÂM THANH NÀO!

Nguồn: Bytedance

Bytedance vừa công bố INFP, một công nghệ AI đột phá có khả năng biến bất kỳ hình ảnh đơn lẻ nào trở nên sống động, nói và hát một cách diễn cảm từ bất kỳ tệp âm thanh nào! Điều này hứa hẹn sẽ làm thay đổi hoàn toàn cách thức hoạt động của podcasting.

8 ví dụ về ứng dụng của INFP:

Mona Lisa nói chuyện: Biến bức tranh Mona Lisa nổi tiếng thành một nhân vật có thể trò chuyện.

Mona Lisa nói chuyện

Giao tiếp giữa các Agent trong thời gian thực: Cho phép các AI giao tiếp với nhau một cách liền mạch.
Phỏng vấn: Tạo các cuộc phỏng vấn động với hình ảnh nhân vật.

Phỏng vấn với hình ảnh nhân vật

Hát: AI có thể biến hình ảnh thành những nghệ sĩ có khả năng hát.
Chuyển đổi giữa người nghe và người nói: AI có thể chuyển đổi vai trò giữa người nói và người nghe.
Tranh vẽ nói chuyện: Tạo ra các bức tranh có thể trò chuyện một cách tự nhiên.
Thêm giao tiếp giữa các Agent: Mở rộng khả năng giao tiếp giữa các AI.
Lắng nghe: AI không chỉ nói mà còn có thể lắng nghe và phản hồi.

Với INFP, việc tạo ra những nội dung podcast sinh động và hấp dẫn hơn bao giờ hết trở nên dễ dàng. Từ việc tạo ra những cuộc trò chuyện sống động giữa các nhân vật lịch sử đến việc trình bày các cuộc phỏng vấn chân thực và sáng tạo, INFP mở ra nhiều cơ hội mới cho các nhà sáng tạo nội dung.

PROMPT OF THE DAY (Prompt của ngày)
Thu thập thông tin chất lượng cao từ các nguồn uy tín để nghiên cứu, viết bài hoặc tối ưu hóa SEO với AI📝

Cho tôi những Research, Study hoặc Evidences từ các nguồn uy tín trên thế giới về: [Các thông tin cần Research ở Outline] hoặc Interesting Information về [Keyword SEO chính]

Vincent Do

Cảm ơn bạn đã lắng nghe!

Hẹn gặp bạn ở lần tới.

The AI Growth Team 😄 😄 ❤️