- The AI Growth
- Posts
- Hướng dẫn chi tiết tạo giọng đọc AI có cảm xúc, đọc văn bản dài hàng ngàn ký tự hoàn toàn Miễn phí
Hướng dẫn chi tiết tạo giọng đọc AI có cảm xúc, đọc văn bản dài hàng ngàn ký tự hoàn toàn Miễn phí
Ngoài ra, Google DeepMind giới thiệu MedGemma, mô hình AI dành cho y tế


Welcome, Growth Pioneers! 🚀
Chào bạn,
Hôm nay, TAG chia sẻ với bạn một công cụ cực kỳ mạnh mẽ mà lại hoàn toàn miễn phí
Bạn đang muốn biến văn bản thành giọng đọc tự nhiên, có cảm xúc như con người? Dù là làm video, podcast, voice-over sản phẩm hay kể chuyện, giọng đọc AI giờ đây có thể làm được tất cả — và không cần tốn một xu hay dùng phần mềm phức tạp.
Chỉ với vài bước đơn giản trong Google AI Studio, bạn có thể tạo ra những giọng đọc chuyên nghiệp, cá nhân hóa và truyền cảm hứng mạnh mẽ.
Hướng Dẫn Chi Tiết Tạo Giọng Đọc AI Có Cảm Xúc (FREE) Với Google AI Studio
BƯỚC 1:
Truy cập: Google AI Studio
Chọn mục Generation media ở thanh menu bên trái

BƯỚC 2:
Nhấp chọn tính năng Gemini speech generation

BƯỚC 3:
Nhập phong cách giọng đọc vào phần Style instructions
Dán nội dung văn bản cần đọc vào ô Text
Chọn kiểu audio:
Single-Speaker Audio (Giọng đọc 1 người)
Multi-Speaker Audio (Cuộc hội thoại 2 người)

Google AI Studio cung cấp nhiều giọng đọc khác nhau với tone và năng lượng khác nhau.
📌 Bạn có thể lựa chọn các giọng như:
Zephyr – Giọng sáng, nhẹ, phù hợp với tâm sự nhẹ nhàng
Puck – Giọng vui tươi, phù hợp với nội dung hài hước
Charon – Giọng trầm, khách quan, thích hợp cho nội dung chuyên gia
Kore, Leda, Fenrir... – Mỗi giọng có cá tính riêng, sẵn sàng cho mọi phong cách bạn cần
………..
➡️ Chỉ cần click vào mục giọng (như hình minh họa), chọn giọng mong muốn trước khi bấm Run để tạo audio.

Đây là Gợi Ý 5 Phong Cách Giọng Đọc Bạn Nên Thử Tạo Ra bởi TAG Nhé!
Ngọt ngào – Như bạn thân tâm sự
Instruction:
Giọng nữ ngọt ngào, trẻ trung, đọc nhẹ nhàng như đang tâm sự với bạn thân.Chuyên gia – Uy tín, đáng tin cậy
Instruction:
Giọng nữ chững chạc, rõ ràng, truyền cảm, thể hiện sự am hiểu và tin cậy.Hài hước – Tếu táo, tự nhiên
Instruction:
Giọng nữ vui vẻ, lém lỉnh, nhấn nhá hài hước và tự nhiên như TikToker hài.Sang trọng – Lịch thiệp, tinh tế
Instruction:
Giọng nữ nhẹ, thanh lịch, tone trầm nhẹ, mang hơi hướng sang trọng.Kể chuyện – Có cảm xúc, dẫn dắt nhẹ nhàng
Instruction:
Giọng kể chuyện nhẹ nhàng, mượt, có cảm xúc như đang kể một hành trình.
📥 Lưu ngay hướng dẫn này, và thử nghiệm để tạo ra giọng đọc AI phù hợp nhất với nội dung của bạn.
Chúc bạn sáng tạo thật nhiều nội dung ấn tượng cùng AI!
Google DeepMind giới thiệu MedGemma, mô hình AI dành cho y tế
Đây là mô hình mã nguồn mở được thiết kê dành riêng cho mảng chăm sóc sức khỏe với kỳ vọng sẽ giúp các nhà nghiên cứu và phát triển có thêm những bộ công cụ đủ mạnh và linh hoạt để đáp ứng nhu cầu đặc thù của những ứng dụng chăm sóc sức khỏe.
Theo lời giới thiệu thì bộ công cụ này dựa trên khung của Gemma 3 với những mô hình đa mẫu có khả năng phân tích cả các hình ảnh và các chẩn đoán y tế. Có 2 phiên bản để chạy dữ liệu dựa vào 4 tỷ hay 27 tỷ thông số nhằm giúp đem lại hiệu quả tốt nhất để đưa ra các lựa chọn phù hợp nhất, song song với đó hệ thống cũng giúp kiểm soát dữ liệu cá nhân tốt hơn, vốn là 1 trong những điểm cực kỳ nhạy cảm khi liên quan đến thông tin về bệnh nhân.

Một số ví dụ điển hình mà hệ thống này có thể đem lại đó là tự diễn giải các thông tin trong sổ y bạ điện tử, lấy thông tin chẩn đoán hình ảnh X quang để trả lời những câu hỏi phức tạp liên quan đến bệnh án của người bệnh. Trong 1 ví dụ được chia sẻ đó là mô hình MedGemma 4B đã tự khởi tạo báo cáo kết quả chụp X-quang với số lượng thông tin đầy đủ trong 81% số trường hợp nếu đem so sánh với cách làm hiện tại.
Mô hình lớn hơn với 27 tỷ tham số (27B) cũng cho thấy khả năng thực hiện các phép tính và phản hồi dựa trên kiến thức y khoa và các thang điểm đánh giá đủ để cạnh tranh với các mô hình tương tự nhưng lại chỉ phải trả 1 khoản tiền nhỏ để thực hiện tính toán.
Điểm mạnh nhất của MedGemma đó là việc nó là phần mềm mã nguồn mở. Đây là cách để Google có thể giúp các nhà phát triển có thể tiếp cận và tùy chỉnh các mô hình theo các công việc đặc thù của từng chuyên khoa, từ đó giúp mở rộng kho dữ liệu của mình.
Được biết trước đó Google cũng đã cho ra mắt 1 số mô hình theo kiểu Gemma. Như hồi đầu năm họ có SignGemma, để giúp việc phiên dịch ngôn ngữ cơ thể. Hay "bay" hơn đó là mô hình DolphinGemma, được triển khai phiên dịch các âm thanh được phát ra từ cá heo sang ký tự để chúng ta có thể hiểu được.
📬 Nếu thấy bản tin hữu ích?
Hãy chia sẻ đến cộng đồng sáng tạo mà bạn yêu quý – và giúp TAG có thêm động lực lan toả sức mạnh của AI đến nhiều người hơn nữa! và đừng quên theo dõi Fanpage THE AI GROWTH để cập tin nhanh chóng hơn nhé!
Và nếu bạn muốn nâng cấp kiến thức và sở hữu cho mình một hệ thống AI Agent cực đỉnh vận hành tự động cho cá nhân hay chính doanh nghiệp của mình đừng quên xem ngay khóa học mới nhất của TAG - “Khóa xây dựng AI Agent cho doanh nghiệp”
Một hệ thống giúp bạn:
Giảm 70% công việc lặp lại, tăng 300% output nội dung, tự động hóa 80% quy trình sale & marketing.
Tăng 40% chuyển đổi nhờ AI chatbot, giảm 60% chi phí marketing, nâng 200% chất lượng CSKH.
Vượt trội đối thủ 2-3 năm về công nghệ, sở hữu mô hình kinh doanh – dễ nhân bản, khó bị sao chép bởi USP độc quyền.
Dễ dàng mở rộng (Scale up) không giới hạn – bạn có thể x10, x100 với AI Agent mà không cần thêm nhân sự.
Thông tin chi tiết về khóa học: LINK THÔNG TIN |
Cảm ơn bạn đã đồng hành cùng The AI Growth!
Trân trọng,
The AI Growth Team
Kiến tạo giá trị – Dẫn dắt cuộc chơi!