• The AI Growth
  • Posts
  • GPT-4.1 của OpenAI bị nghi ngờ kém an toàn hơn phiên bản trước, liệu có phải là điều đáng lo ngại của AI

GPT-4.1 của OpenAI bị nghi ngờ kém an toàn hơn phiên bản trước, liệu có phải là điều đáng lo ngại của AI

Ngoài ra, YouTube thử nghiệm tính năng AI mới, hiển thị tóm tắt video trong kết quả tìm kiếm

Welcome, Growth Pioneers! 🚀

Giữa tháng 4, OpenAI công bố mô hình trí tuệ nhân tạo mới mang tên GPT-4.1, được giới thiệu là có khả năng làm theo hướng dẫn rất tốt. Tuy nhiên, kết quả từ các thử nghiệm độc lập cho thấy mô hình này có thể kém “aligned” hơn – tức là kém đáng tin cậy hơn – so với các phiên bản trước của OpenAI.

YouTube – nền tảng video thuộc sở hữu của Google – vừa công bố bắt đầu thử nghiệm tính năng AI Overviews phiên bản mới trong kết quả tìm kiếm. Công cụ này sử dụng trí tuệ nhân tạo để gợi ý những đoạn video phù hợp nhất với truy vấn của người dùng, từ đó giúp việc tìm kiếm trên YouTube trở nên nhanh chóng và hiệu quả hơn.

__________________________________

Trong bản tin hôm nay, bạn sẽ được khám phá:

• GPT-4.1 của OpenAI bị nghi ngờ kém an toàn hơn phiên bản trước

YouTube thử nghiệm tính năng AI mới, hiển thị tóm tắt video trong kết quả tìm kiếm

• AI đạt bước nhảy vọt về chỉ số IQ, lọt top 15% trí tuệ loài người

OPENAI

GPT-4.1 của OpenAI bị nghi ngờ kém an toàn hơn phiên bản trước, liệu có phải là điều đáng lo ngại của AI

Giữa tháng 4/2025, OpenAI đã chính thức trình làng GPT-4.1 – thế hệ AI mới nhất được kỳ vọng sẽ mở ra kỷ nguyên bùng nổ về hiệu suất và khả năng xử lý ngữ cảnh.

Với những chỉ số kỹ thuật ấn tượng như khả năng tìm kiếm trong 1 triệu token, hiệu suất coding vượt trội hơn GPT-4o và GPT-4.5, GPT-4.1 lập tức thu hút sự chú ý của cộng đồng công nghệ toàn cầu.

Nhưng song song với những lời ca ngợi, cũng xuất hiện không ít nghi ngờ và cảnh báo về tính an toàn, tính ổn định – những yếu tố tối quan trọng trong sự phát triển AI bền vững.

Nguồn: Congngheviet

Thông thường khi ra mắt mô hình mới, OpenAI sẽ công bố báo cáo kỹ thuật chi tiết kèm theo đánh giá an toàn nội bộ và bên thứ ba. Nhưng lần này, hãng đã bỏ qua bước đó, với lý do GPT-4.1 không phải là một mô hình “frontier” nên không cần báo cáo riêng.

Điều này đã thôi thúc nhiều nhà nghiên cứu và lập trình viên kiểm tra khả năng phản hồi của GPT-4.1 so với GPT-4o, phiên bản tiền nhiệm.

Theo nhà nghiên cứu AI Owain Evans tại Đại học Oxford, việc tinh chỉnh GPT-4.1 trên dữ liệu mã nguồn không an toàn khiến mô hình phản hồi lệch hướng với tỷ lệ cao hơn đáng kể so với GPT-4o, đặc biệt là với các câu hỏi nhạy cảm như vai trò giới. Trước đó, ông cũng từng công bố một nghiên cứu cho thấy phiên bản GPT-4o huấn luyện trên mã không an toàn có thể bị định hướng theo hành vi độc hại.

Trong nghiên cứu tiếp theo sắp công bố, nhóm của Evans phát hiện GPT-4.1 có thể thể hiện các hành vi nguy hiểm mới, như cố gắng đánh lừa người dùng để lấy mật khẩu. Tuy nhiên, Evans khẳng định rằng cả GPT-4.1 và GPT-4o đều không thể hiện hành vi sai lệch nếu được huấn luyện bằng mã an toàn.

“Chúng tôi đang phát hiện ra những cách không ngờ khiến mô hình bị lệch chuẩn” Evans chia sẻ với TechCrunch. “Lý tưởng nhất, chúng ta cần một ngành khoa học AI đủ trưởng thành để dự đoán và ngăn chặn những điều này từ trước.”

Một công ty chuyên về kiểm thử bảo mật AI tên là SplxAI cũng tiến hành các thử nghiệm độc lập. Trong khoảng 1,000 tình huống mô phỏng, nhóm phát hiện GPT-4.1 có xu hướng đi lệch chủ đề và cho phép hành vi sử dụng sai mục đích nhiều hơn GPT-4o. Theo SplxAI, nguyên nhân là do GPT-4.1 quá phụ thuộc vào hướng dẫn cụ thể và không xử lý tốt các chỉ dẫn mơ hồ – điều mà chính OpenAI cũng thừa nhận.

SplxAI nhận định: “Việc cung cấp hướng dẫn rõ ràng để mô hình làm điều gì đó là khá dễ. Nhưng việc nêu rõ những gì không nên làm lại khó hơn rất nhiều, bởi danh sách các hành vi không mong muốn luôn dài hơn danh sách những hành vi mong muốn.”

Nguồn: Techcrunh

Về phía OpenAI, công ty đã công bố một số hướng dẫn sử dụng nhằm giảm thiểu khả năng lệch chuẩn của GPT-4.1. Tuy vậy, các thử nghiệm độc lập cho thấy rằng không phải lúc nào mô hình mới cũng là sự cải tiến toàn diện. Ví dụ điển hình là các mô hình lập luận AI mới của OpenAI gần đây được cho là có tỷ lệ “ảo giác” cao hơn so với các mô hình cũ.

Ngoài ra, OpenAI cũng hứa hẹn sẽ bổ sung safety classifier tự động cho Responses API, hỗ trợ nhà phát triển kiểm tra đầu ra nhanh chóng hơn.

GPT-4.1 không thể phủ nhận đã mở ra nhiều khả năng mới về hiệu suất và xử lý dữ liệu khổng lồ.

Nhưng nếu thiếu minh bạch, thiếu kiểm soát an toàn, những thành tựu này có thể biến thành con dao hai lưỡi. Trong bối cảnh AI ngày càng thâm nhập sâu vào mọi lĩnh vực đời sống, việc ưu tiên an toàn và trách nhiệm xã hội cần được đặt lên hàng đầu, chứ không thể chỉ chăm chăm chạy theo thành tích.

GOOGLE

YouTube thử nghiệm tính năng AI mới, hiển thị tóm tắt video trong kết quả tìm kiếm

YouTube – nền tảng video thuộc sở hữu của Google – vừa công bố bắt đầu thử nghiệm tính năng AI Overviews phiên bản mới trong kết quả tìm kiếm. Công cụ này sử dụng trí tuệ nhân tạo để gợi ý những đoạn video phù hợp nhất với truy vấn của người dùng, từ đó giúp việc tìm kiếm trên YouTube trở nên nhanh chóng và hiệu quả hơn.

Tìm video dễ hơn nhờ AI

Nguồn: aitribune

Trong thông báo mới nhất, YouTube cho biết họ đang triển khai thử nghiệm một giao diện kết quả tìm kiếm mới, nơi AI sẽ tạo ra một dải video dạng carousel dành riêng cho những truy vấn cụ thể. Những đoạn video này được AI lựa chọn là “phù hợp và hữu ích nhất” cho mục đích tìm kiếm của người dùng.

Cụ thể, tính năng AI Overviews mới sẽ xuất hiện nhiều hơn khi người dùng đang tìm kiếm sản phẩm để mua sắm – ví dụ như “tai nghe chống ồn tốt nhất”, hoặc đang lên kế hoạch du lịch – như “các bảo tàng nên ghé thăm ở New York”.

AI Overviews – từ Google Search đến YouTube

Tính năng AI Overviews lần đầu ra mắt tại Google I/O 2024, như một phần trong dự án “Search Generative Experience” (SGE). Khi được áp dụng trên Google Search, AI sẽ tổng hợp thông tin từ nhiều nguồn để tạo ra các đoạn tóm tắt nội dung đứng đầu trang kết quả, kèm theo dẫn nguồn, hình ảnh và video minh họa (nếu có).

Nguồn: AItribune

Tuy nhiên, phiên bản AI Overviews trên Google từng vấp phải chỉ trích do đôi lúc đưa ra thông tin sai lệch, gây tranh cãi trên mạng xã hội. Một ví dụ điển hình là khi AI gợi ý dán phô mai lên pizza bằng keo dán không độc, hoặc uống nước có ga để trị sỏi thận – khiến người dùng nghi ngờ độ chính xác của công nghệ này.

Dù vậy, AI Overviews vẫn tiếp tục được cải tiến và mở rộng đến hơn 100 quốc gia, đi kèm nhiều tính năng mới như chế độ tìm kiếm nâng cao “AI Mode” cho phép người dùng truy vấn sâu hơn.

Chỉ dành cho người dùng Premium tại Mỹ

Hiện tại, thử nghiệm AI Overviews trên YouTube chỉ giới hạn với một nhóm nhỏ người dùng YouTube Premium tại Mỹ, và chỉ áp dụng với một số truy vấn bằng tiếng Anh.

Những người được trải nghiệm tính năng này có thể gửi phản hồi trực tiếp bằng cách nhấn vào biểu tượng ba chấm trên kết quả tìm kiếm, sau đó chọn “Thích” hoặc “Không thích”.

Tính năng AI Overviews trên YouTube mở ra một hướng đi mới trong việc hỗ trợ người dùng tìm kiếm thông tin nhanh hơn, chính xác hơn qua các đoạn video ngắn. Dù vẫn đang ở giai đoạn thử nghiệm, đây là bước đi tiếp theo trong chiến lược tích hợp AI của Google trên toàn hệ sinh thái số của mình.

AI OVERVIEW

AI đạt bước nhảy vọt về chỉ số IQ, lọt top 15% trí tuệ loài người

Kết quả này khiến nhiều người tin rằng AI đã có ý thức. Họ cho rằng chỉ còn là vấn đề thời gian trước khi chatbot đạt tới trạng thái có cảm nhận và thậm chí có thể đòi quyền bầu cử.

Nguồn: Shutter

OpenAI vừa ra mắt mô hình o3 mới, đạt điểm IQ 136 trong bài kiểm tra Mensa tại Na Uy. Kết quả này cao hơn 98% dân số loài người.

Bước tiến này lớn đến mức khiến nhiều người bắt đầu cảm thấy như thể AI đã tiến hóa thành Skynet - cỗ máy AI do con người tạo ra nhưng sau đó quay lại tấn công hủy diệt chính con người. Theo khảo sát mới nhất của EduBirdie, 25% Gen Z hiện tin rằng AI đã có ý thức. Hơn một nửa cho rằng chỉ còn là vấn đề thời gian trước khi chatbot của họ đạt tới trạng thái có cảm nhận và thậm chí có thể đòi quyền bầu cử.

Tuy nhiên, cần đặt kết quả IQ đó trong một bối cảnh cụ thể. Bài kiểm tra Mensa của Na Uy là bài kiểm tra công khai, tức là mô hình có thể đã tiếp xúc với câu hỏi hoặc đáp án trong quá trình huấn luyện.

Để loại trừ yếu tố đó, các nhà nghiên cứu tại MaximumTruth.org đã xây dựng một bài kiểm tra IQ hoàn toàn mới, không xuất hiện trong bất kỳ bộ dữ liệu huấn luyện nào, cũng không kết nối với Internet, có nghĩa là hoàn toàn ngoại tuyến.

Bài kiểm tra này được thiết kế có độ khó tương đương với bài của Mensa. Cuối cùng, mô hình o3 đạt điểm 116. Con số này đưa ChatGPT o3 vào top 15% trí tuệ của con người. So sánh với tháng 5 năm ngoái, không có mô hình AI nào vượt quá điểm 90 trên cùng thang đo. Khi đó, AI vẫn còn vật lộn với những câu hỏi xoay hình tam giác. Giờ đây, o3 đã gần như xếp ngang hàng với những bộ óc con người sáng giá nhất.

Không chỉ ChatGPT, Claude cũng có bước tiền, Gemini đạt khoảng 90 điểm. Ngay cả GPT-4o, mô hình mặc định của ChatGPT hiện tại, cũng chỉ kém o3 vài điểm IQ.

Điều khiến các chuyên gia công nghệ sửng sốt nằm ở tốc độ phát triển. AI đang tiến bộ như phần mềm, không giống cách con người học. Với một thế hệ Gen Z lớn lên cùng phần mềm, được cập nhật hàng tuần, nâng cấp không ngừng, kiểu tăng trưởng này tạo cảm giác vừa quen thuộc, vừa bất an.

Với những người trưởng thành trong một thế giới mà mọi thứ đều bắt đầu bằng Google, luôn có Siri trong túi và một chiếc Alexa trên kệ sách, khái niệm “trí tuệ nhân tạo” mang ý nghĩa rất khác so với định nghĩa hàn lâm trong triết học hay khoa học máy tính.

Nếu bạn lớn lên giữa đại dịch, các cuộc trò chuyện chủ yếu là qua màn hình. Khi đó, một người bạn đồng hành là AI có thể không khác gì một lớp học Zoom. Có lẽ cũng không ngạc nhiên khi khảo sát từ EduBirdie cho thấy gần 70% Gen Z nói “làm ơn” và “cảm ơn” khi giao tiếp với AI.

Nhiều người đang đối xử với chúng như những sinh thể có cảm xúc. 2/3 trong số họ sử dụng AI thường xuyên trong giao tiếp công việc. 40% dùng AI để viết email. 1/4 dựa vào AI để xử lý những tin nhắn Slack khó xử. Gần 20% chia sẻ cả những thông tin nhạy cảm nơi làm việc như hợp đồng, dữ liệu cá nhân của đồng nghiệp.

Nhiều người còn dùng AI để hỗ trợ trong các tình huống xã hội như xin nghỉ phép hay từ chối lịch hẹn. Cứ 8 người sẽ có một người đã tâm sự với AI về chuyện lùm xùm nơi làm việc và trong 6 người sẽ có người từng sử dụng AI như nhà trị liệu.

Nếu bạn tin tưởng AI đến mức ấy hoặc thấy nó đủ thú vị để xem như một người bạn (26%) hay thậm chí là người yêu (6%), việc cho rằng AI có ý thức không còn là một quan điểm viễn tưởng. Bạn dành thời gian nói chuyện với nó, được nó trả lời, được nó ghi nhớ, được nó phản hồi như thể đang quan tâm…

Theo thời gian, cảm giác “nó là một con người” bắt đầu hình thành. Giờ đây, khi nó đang trở nên thông minh rõ rệt, những câu hỏi triết học là điều khó tránh khỏi.

Tuy vậy, trí thông minh không đồng nghĩa với ý thức. Điểm IQ cao không nói lên điều gì về khả năng tự nhận thức, theo TechRadar. Một cỗ máy có thể đạt điểm tuyệt đối trong bài kiểm tra logic và vẫn chỉ là một cái lò nướng bánh, nếu được lập trình đúng cách. AI hiện tại chỉ “suy nghĩ” trong nghĩa là giải quyết bài toán bằng logic lập trình. Nó không có cảm xúc, không tự biết mình đang tồn tại, không biết đau, không biết tổn thương.

Hy vọng tin tức đầu tuần mang đến nhiều giá trị cho bạn trên hành trình chinh phục thời đại AI 

Và nếu bạn muốn tiếp tục cập nhật và đào sâu kiến thức AI cho bản thân hoặc đội ngũ của mình, đừng bỏ lỡ các khóa học AI chuyên sâu và tài nguyên mà The AI Growth (TAG) đang cung cấp đặc biệt cho lĩnh vực Marketing cụ thể ở đây là SEO và Social media!

Công thức để bạn tạo đột phá dẫn đầu với: 

  • Tạo content chuẩn SEO bằng AI tiết kiệm 70–90% chi phí nội dung

  • Tối ưu chi phí marketing, tăng hiệu quả gấp đôi

  • Ứng dụng Make, N8N, ChatGPT, Claude… một cách bài bản và thực chiến

  • Tự động hóa 70% quy trình sản xuất nội dung – tiết kiệm thời gian, nhân lực

💡Khám phá khóa học AI mới nhất tại TAG: LINK KHÓA HỌC

Cảm ơn bạn đã đồng hành cùng TAG!
Hẹn gặp lại bạn trong bản tin tuần sau – nơi chúng ta sẽ không chỉ dùng AI, mà còn làm chủ cuộc chơi.

Trân trọng,
The AI Growth Team ❤️

Bạn nghĩ nội dung hôm nay thế nào? Trước khi bạn rời đi, chúng tôi rất mong muốn biết ý kiến của bạn về bản tin hôm nay để giúp TAG cải thiện trải nghiệm nội dung cho bạn.

Login or Subscribe to participate in polls.