Khoảng cách học tăng cường — hoặc tại sao một số kỹ năng AI cải thiện nhanh hơn những kỹ năng khác

Công nghệ AI đang phát triển không đồng đều, tạo ra “khoảng cách học tăng cường”. Các công cụ lập trình AI cải thiện nhanh chóng nhờ khả năng kiểm tra tự động và dữ liệu đo lường rõ ràng. Ngược lại, những kỹ năng chủ quan như viết email hay phản hồi chatbot tiến…

GettyImages 1575097396

Công cụ lập trình trí tuệ nhân tạo (AI) đang có những bước tiến vượt bậc, với các mô hình như GPT-5, Gemini 2.5 và Sonnet 4.5 liên tục nâng cao khả năng tự động hóa công việc của các nhà phát triển. Tuy nhiên, sự phát triển này lại không đồng đều. Nhiều kỹ năng AI khác, chẳng hạn như khả năng viết email, hầu như không có cải thiện đáng kể so với một năm trước.

Sự khác biệt rõ rệt này được lý giải bằng khái niệm “học tăng cường” (reinforcement learning – RL), một động lực lớn thúc đẩy tiến bộ AI trong sáu tháng qua. Học tăng cường hoạt động hiệu quả nhất khi có các tiêu chí đánh giá rõ ràng, chẳng hạn như “đạt” hay “không đạt”, cho phép lặp lại quá trình thử nghiệm hàng tỷ lần mà không cần sự can thiệp của con người. Ngành phát triển phần mềm, với hệ thống kiểm thử tự động (unit testing, integration testing, security testing) đã có sẵn, là môi trường lý tưởng cho RL.

Điều này tạo ra “khoảng cách học tăng cường”: những kỹ năng dễ kiểm thử tự động như sửa lỗi lập trình hay giải toán cạnh tranh đang phát triển rất nhanh, trong khi các kỹ năng mang tính chủ quan như viết lách lại chỉ tiến bộ nhỏ giọt. Tuy nhiên, một số lĩnh vực tưởng chừng khó kiểm thử lại đang cho thấy những bước tiến bất ngờ. Chẳng hạn, mô hình Sora 2 mới của OpenAI đã đạt được những cải thiện đáng kinh ngạc trong việc tạo video chân thực, tôn trọng quy luật vật lý, cho thấy hệ thống RL mạnh mẽ đã được áp dụng.

Theo nhận định của Russell Brandom trên TechCrunch, chừng nào học tăng cường còn giữ vai trò trọng tâm trong phát triển sản phẩm AI, “khoảng cách học tăng cường” này sẽ ngày càng mở rộng. Điều này đặt ra những thách thức và cơ hội lớn cho các công ty khởi nghiệp và nền kinh tế toàn cầu. Những công việc thuộc nhóm có thể được RL tự động hóa có thể sẽ thay đổi đáng kể, buộc nhiều người phải tìm kiếm hướng phát triển nghề nghiệp mới. Ví dụ, việc xác định những dịch vụ chăm sóc sức khỏe nào có thể được huấn luyện bằng RL sẽ có ý nghĩa to lớn đối với nền kinh tế trong hai thập niên tới.


follow nhận tin mới

tin mới


Tin NỔI BẬT


Tin Chính trị


Tin Hoa Kỳ


Tin Di trú