• The AI Growth
  • Posts
  • OpenAI ra mắt chuẩn đánh giá mới cho kỹ sư phần mềm AI

OpenAI ra mắt chuẩn đánh giá mới cho kỹ sư phần mềm AI

Ngoài ra: Tạo hình ảnh không giới hạn, chinh phục mọi ý tưởng với NEX

Welcome, Growth Pioneers! 🚀

OpenAI giới thiệu SWE-Lancer, tiêu chuẩn đánh giá AI lập trình với 1.400 nhiệm vụ từ Upwork. Claude 3.5 Sonnet dẫn đầu, kiếm được 400.000 USD trên tổng 1 triệu USD tiền thưởng.

 Fiverr ra mắt Fiverr Go, giúp freelancer huấn luyện AI cá nhân hóa (25 USD/tháng) và dùng trợ lý AI (29 USD/tháng) để tự động hóa công việc. Fiverr cũng sẽ tặng cổ phần cho freelancer xuất sắc.  AI có thể tạo thông tin sai dù có dữ liệu đúng, do hoạt động dựa trên xác suất.

Email Newsletter này sẽ đề cập:

  • OpenAI ra mắt chuẩn đánh giá mới cho kỹ sư phần mềm AI

  • Fiverr ra mắt nền tảng AI hỗ trợ freelancer

  • Thói quen khó chịu nhất của AI: Nói dối một cách tự tin

OPENAI
OPENAI RA MẮT CHUẨN ĐÁNH GIÁ MỚI CHO KỸ SƯ PHẦN MỀM AI

Nguồn: OpenAI

OpenAI vừa công bố SWE-Lancer, một bộ tiêu chuẩn mới nhằm đánh giá khả năng lập trình của AI trong các công việc thực tế của kỹ sư phần mềm tự do. Bài kiểm tra này đặt các mô hình AI vào thử thách với tổng giá trị phần thưởng lên tới 1 triệu USD từ các nhiệm vụ thực tế.

Chi tiết về SWE-Lancer:

  • SWE-Lancer bao gồm hơn 1.400 nhiệm vụ lập trình tự do từ nền tảng Upwork, trải dài từ sửa lỗi nhỏ cho đến phát triển tính năng lớn có giá trị cao.

  • Bộ tiêu chuẩn này không chỉ đánh giá khả năng viết mã của AI mà còn kiểm tra khả năng ra quyết định kỹ thuật trong quá trình quản lý dự án.

  • Đặc biệt, SWE-Lancer sử dụng tiêu chí tài chính để đo lường mức độ thành công, tính toán số tiền mà một mô hình AI có thể "kiếm được" nếu hoàn thành chính xác các nhiệm vụ.

  • Claude 3.5 Sonnet là mô hình AI hoạt động tốt nhất trong thử nghiệm, giải quyết được gần 50% số nhiệm vụ và thu về 400.000 USD trên tổng số 1 triệu USD.

Các tiêu chuẩn đánh giá AI ngày càng trở nên khó khăn hơn để theo kịp sự phát triển nhanh chóng của công nghệ. Dù vậy, dù các mô hình AI vẫn còn gặp nhiều khó khăn, việc một AI có thể đạt giá trị 400.000 USD từ các công việc lập trình thực tế cho thấy tầm ảnh hưởng lớn của AI đối với ngành phát triển phần mềm trong tương lai.

FIVERR
FIVERR RA MẮT NỀN TẢNG AI HỖ TRỢ FREELANCER

Nguồn: Google

Nền tảng dịch vụ tự do Fiverr vừa giới thiệu Fiverr Go, một bộ công cụ AI mới cho phép freelancer huấn luyện mô hình AI dựa trên công việc của họ và tự động hóa các nhiệm vụ trong tương lai. Đồng thời, Fiverr cũng công bố chương trình cấp cổ phần cho những freelancer xuất sắc nhất.

Chi tiết về Fiverr Go:

  • Mô hình AI cá nhân hóa: Freelancer có thể huấn luyện mô hình AI AI Creation Model với chi phí 25 USD/tháng, giúp họ tạo ra các sản phẩm từ AI mà vẫn giữ quyền sở hữu nội dung gốc.

  • Trợ lý AI cá nhân: Với 29 USD/tháng, trợ lý AI này sẽ hỗ trợ quản lý giao tiếp với khách hàng và xử lý các công việc thường xuyên, sử dụng dữ liệu tương tác trước đó để tạo phản hồi phù hợp.

  • Quyền truy cập ban đầu: Fiverr Go chỉ mở cho hàng nghìn freelancer đã được xét duyệt ở cấp độ Level 2 trở lên, trong các lĩnh vực như lồng tiếng, thiết kế và viết nội dung.

  • Chương trình cổ phần: Fiverr sẽ trao cổ phần công ty cho những freelancer có hiệu suất cao nhất, tuy nhiên, các chi tiết cụ thể chưa được tiết lộ.

Ý nghĩa của Fiverr Go:

AI đang thay đổi nhanh chóng cách làm việc tự do, và Fiverr muốn giúp freelancer tận dụng tự động hóa thay vì bị thay thế bởi nó. Dù nền tảng này có thể giúp một số người mở rộng quy mô công việc, nó cũng có thể gặp phản ứng trái chiều từ những freelancer lo ngại rằng việc tích hợp AI đang trở thành điều không thể tránh khỏi.

AI
THÓI QUEN KHÓ CHỊU NHẤT CỦA AI: NÓI DỐI MỘT CÁCH TỰ TIN

Nguồn: TAG

Chúng ta đều đã nghe về hiện tượng AI ảo giác - những khoảnh khắc AI tự tin đưa ra thông tin hoàn toàn sai lệch. Điều này thường xảy ra khi AI không có câu trả lời chính xác và quyết định tự “lấp đầy khoảng trống”. Nhưng điều kỳ lạ là AI vẫn có thể tạo ra thông tin sai ngay cả khi nó đã biết câu trả lời đúng.

Vì sao AI lại ảo giác ngay cả khi có dữ liệu chính xác?

AI không "suy nghĩ" như con người. Nó hoạt động dựa trên xác suất thống kê, không phải lý luận logic. Khi AI tạo ra phản hồi, nó không chọn đáp án đúng hay sai như con người mà dựa vào sự liên kết từ dữ liệu huấn luyện. Nếu quy trình này đi lệch hướng, AI có thể tạo ra câu trả lời trôi chảy nhưng không đúng sự thật.

Ngoài ra, việc đưa ra yêu cầu quá chung chung hoặc mơ hồ cũng có thể khiến AI “sáng tạo” quá mức. Khi không có thông tin rõ ràng, AI ưu tiên sự mạch lạc thay vì độ chính xác, dẫn đến những phản hồi tưởng chừng hợp lý nhưng lại hoàn toàn sai.

Với những người làm tiếp thị nội dung, dịch vụ khách hàng hoặc chatbot AI, đây là một vấn đề lớn. Hãy tưởng tượng một trợ lý AI cung cấp thông tin sai về sản phẩm cho khách hàng, mặc dù dữ liệu đúng đã có sẵn trong hệ thống. Hoặc một báo cáo AI tự tạo ra số liệu không có thật, dù dữ liệu chính xác vẫn ở ngay trong kho dữ liệu.

Những lỗi như vậy có thể làm mất lòng tin từ khách hàng và gây tổn hại nghiêm trọng đến uy tín doanh nghiệp.

Cách giảm thiểu ảo giác AI:

Đặt câu hỏi cụ thể hơn:
Thay vì một yêu cầu chung chung như "Phân tích phản hồi khách hàng", hãy chia nhỏ thành các nhiệm vụ rõ ràng như:

  • "Tóm tắt các chủ đề phổ biến trong đánh giá khách hàng"

  • "Xác định những phàn nàn thường gặp về sản phẩm"

Cho phép AI thừa nhận khi không biết:
Buộc AI phải đưa ra câu trả lời ngay cả khi thiếu dữ liệu dễ dẫn đến thông tin sai lệch. Một cách hay là yêu cầu AI nói “Tôi không biết” khi không có đủ dữ liệu, thay vì đoán mò. Điều này đặc biệt quan trọng trong các lĩnh vực như hỗ trợ khách hàng, tài chính, y tế.

Yêu cầu AI trích dẫn nguồn:
Khi AI cung cấp thông tin, yêu cầu nó dẫn nguồn cụ thể thay vì tạo ra các tuyên bố chung chung. Điều này giúp đảm bảo độ tin cậy và tránh những nội dung sai lệch nghiêm trọng.

Luôn kiểm tra lại thông tin AI tạo ra:
Không nên tin tưởng hoàn toàn vào phản hồi của AI. Hãy đối chiếu với các nguồn dữ liệu đã được xác minh, thử nghiệm nhiều lần với các câu hỏi khác nhau để so sánh và xác định tính nhất quán.

AI không tư duy như con người, nhưng khi được hướng dẫn đúng cách, nó có thể tổng hợp thông tin từ nhiều nguồn một cách chặt chẽ hơn. Dù vậy, việc kiểm tra lại dữ liệu và sử dụng AI một cách có kiểm soát là điều cần thiết để tránh những sai sót có thể gây hậu quả nghiêm trọng.

PROMPT OF THE DAY (Prompt của ngày)
Xác định các trang web uy tín để xây dựng liên kết ngược chất lượng cho nội dung với AI 📝 

Tìm các trang web có thẩm quyền để có được liên kết ngược cho nội dung [chủ đề].

TAG

Bạn nghĩ nội dung hôm nay thế nào?

Trước khi bạn rời đi, chúng tôi rất mong muốn biết ý kiến của bạn về bản tin hôm nay để giúp TAG cải thiện trải nghiệm nội dung cho bạn.

Login or Subscribe to participate in polls.

Cảm ơn bạn đã lắng nghe!

Hẹn gặp bạn ở lần tới.

The AI Growth Team 😄 😄 ❤️