OpenAI: GPT-5 ngang hàng với con người trong nhiều ngành nghề

Tháng 9 25, 2025

OpenAI ra mắt chuẩn mực GDPval mới, đánh giá khả năng của các mô hình AI như GPT-5 và Claude Opus 4.1 so với chuyên gia con người trong nhiều ngành nghề. Kết quả ban đầu cho thấy GPT-5 và Claude Opus 4.1 đang tiến gần đến chất lượng làm việc của con người, đạt…

Công ty OpenAI vừa công bố một chuẩn mực đánh giá mới mang tên GDPval, nhằm kiểm định mức độ hiệu quả của các mô hình Trí Tuệ Nhân Tạo (AI) khi đối chiếu với khả năng của các chuyên gia trong nhiều lĩnh vực và ngành nghề khác nhau. Đây là một nỗ lực ban đầu của OpenAI để hiểu rõ hơn về mức độ tiệm cận của các hệ thống AI với khả năng vượt trội con người trong những công việc có giá trị kinh tế, một phần cốt lõi trong sứ mệnh thành lập công ty để phát triển Trí Tuệ Tổng Quát Nhân Tạo (AGI).

Theo OpenAI, các mô hình như GPT-5 và Claude Opus 4.1 của Anthropic “đang dần đạt đến chất lượng công việc do các chuyên gia ngành nghề thực hiện.”

Mặc dù một số CEO dự đoán AI sẽ thay thế công việc của con người trong vài năm tới, OpenAI thừa nhận rằng GDPval hiện tại chỉ bao gồm một số lượng hạn chế các tác vụ mà con người thực hiện trong công việc thực tế. Tuy nhiên, đây là một trong những cách mới nhất mà công ty này đang sử dụng để đo lường tiến bộ của AI hướng tới mục tiêu lớn hơn. Chuẩn mực GDPval dựa trên chín ngành công nghiệp đóng góp nhiều nhất vào Tổng Sản Phẩm Quốc Nội của Hoa Kỳ, bao gồm y tế, tài chính, sản xuất và chính phủ. Bài kiểm tra đánh giá hiệu suất của mô hình AI trong 44 ngành nghề, từ kỹ sư phần mềm đến y tá và nhà báo.

Trong phiên bản đầu tiên của bài kiểm tra, GDPval-v0, OpenAI đã yêu cầu các chuyên gia giàu kinh nghiệm so sánh các báo cáo do AI tạo ra với các báo cáo của những chuyên gia khác, sau đó chọn ra báo cáo tốt nhất. Ví dụ, một yêu cầu đã được đưa ra cho các nhà đầu tư ngân hàng để tạo ra một phân tích cạnh tranh cho ngành giao hàng chặng cuối, và so sánh chúng với các báo cáo do AI tạo ra. OpenAI sau đó tính trung bình “tỷ lệ thắng” của mô hình AI so với các báo cáo của con người trên tất cả 44 ngành nghề.

Đối với GPT-5-high, một phiên bản tăng cường của GPT-5 với sức mạnh tính toán bổ sung, công ty cho biết mô hình AI này được đánh giá là tốt hơn hoặc ngang bằng với các chuyên gia ngành nghề trong 40.6% số trường hợp. Mô hình Claude Opus 4.1 của Anthropic đạt tỷ lệ tốt hơn hoặc ngang bằng là 49%, nhưng OpenAI cho rằng con số này có thể cao do xu hướng tạo ra đồ họa đẹp mắt của mô hình này, hơn là hiệu suất thuần túy.

Các chuyên gia nhận định rằng hầu hết các công việc thực tế của con người phức tạp hơn nhiều so với việc chỉ nộp các báo cáo nghiên cứu, vốn là tất cả những gì GDPval-v0 đang kiểm tra. OpenAI cũng thừa nhận điều này và cho biết họ dự định tạo ra các bài kiểm tra mạnh mẽ hơn trong tương lai, có thể tính đến nhiều ngành công nghiệp và quy trình làm việc tương tác hơn. Tuy nhiên, công ty vẫn xem tiến bộ trên GDPval là đáng chú ý.

Trao đổi với TechCrunch, Tiến Sĩ Aaron Chatterji, nhà kinh tế trưởng của OpenAI, cho biết kết quả của GDPval gợi ý rằng những người làm việc trong các ngành nghề này hiện có thể sử dụng các mô hình AI để dành thời gian cho những nhiệm vụ có ý nghĩa hơn. Bà Tejal Patwardhan, trưởng nhóm đánh giá của OpenAI, chia sẻ với TechCrunch rằng bà rất phấn khởi về tốc độ tiến bộ của GDPval. Mô hình GPT-4o của OpenAI, ra mắt khoảng 15 tháng trước, chỉ đạt 13.7% (thắng và hòa với con người), trong khi GPT-5 hiện đã tăng gần gấp ba lần, một xu hướng mà bà Patwardhan kỳ vọng sẽ tiếp diễn, theo tin từ TechCrunch ngày 25 tháng 9 năm 2025.

Đường dẫn: Tin Mới US > Công nghệ > OpenAI: GPT-5 ngang hàng với con người trong nhiều ngành nghề

follow nhận tin mới

tin mới

Di trú
Chủ hãng startup: Phí H-1B 100 ngàn đô của TT Trump ‘rào cản’ nhân tài
Các nhà sáng lập startup lo ngại việc tăng phí visa H-1B lên $100,000 theo chính sách của Tổng Thống Donald Trump sẽ gây tổn hại đến đổi mới. Họ cho rằng phí cao ngăn cản startup nhỏ thuê nhân tài quốc tế, ảnh hưởng đến cạnh tranh và có thể khiến ngành công nghệ…
Công nghệ
visionOS 26: Hai tính năng iPhone được mong đợi từ lâu
visionOS 26 ra mắt với hai tính năng mới: mở khóa iPhone không cần mật mã và nhìn thấy iPhone trong môi trường thực tế ảo. Bản cập nhật này cho thấy Apple vẫn coi trọng vai trò của iPhone dù điện toán không gian có phát triển.
Chính trị
Ứng viên Thống đốc New Jersey bị chặn tốt nghiệp vì bê bối gian lận
Dân biểu Mikie Sherrill, ứng cử viên Thống đốc New Jersey, bị cáo buộc liên quan đến bê bối gian lận tại Học viện Hải quân, khiến bà không được tham gia lễ tốt nghiệp. Vụ việc xảy ra khi bà đang dẫn đầu trong các cuộc thăm dò, nhưng một cuộc thăm dò gần…
Công nghệ
iPhone Fold sẽ mỏng như iPhone Air?
iPhone Fold có thể có thiết kế tương tự iPhone Air và mỏng hơn. iPhone 20 kỷ niệm 20 năm iPhone có thể dùng màn hình COE, thiết kế “toàn kính”. Apple có thể mang đến đột phá lớn cho iPhone?
Giải trí
Dwayne Johnson: Cha ‘vượt lằn ranh’ trước cuộc trò chuyện cuối
Dwayne “The Rock” Johnson tiết lộ về mối quan hệ phức tạp với cha mình, Rocky Johnson. Họ đã cãi nhau về cuốn hồi ký của cha, dẫn đến những căng thẳng kéo dài. Johnson nhớ lại những khó khăn trong quá khứ và sự nghiệp của mình, đồng thời nhấn mạnh tầm quan trọng…
Chính trị
Công tố viên tìm cách truy tố Comey
Các công tố viên liên bang đang tìm cách truy tố cựu Giám đốc FBI James Comey vì cáo buộc khai gian trước Quốc Hội. Vụ việc diễn ra trước khi hết thời hiệu truy tố. Theo Fox News, ông Comey cáo buộc Tổng Thống Donald Trump đòi hỏi “cam kết trung thành” và vẫn…
Chính trị
Dân biểu Michigan đòi luận tội Bộ trưởng Y tế RFK Jr.
Dân biểu Haley Stevens của Michigan tuyên bố sẽ đệ trình luận tội Bộ trưởng Y tế Robert F. Kennedy Jr. vì “sự hỗn loạn y tế” và chi phí tăng. Bà cáo buộc ông Kennedy cắt giảm tài trợ nghiên cứu, hạn chế vaccine, lan truyền thuyết âm mưu và nói dối trước Quốc…
Thể thao
Đội Washington dùng chiến lược NFL để phân bổ ngân sách
Đội Đại học Washington áp dụng mô hình NFL để quản lý ngân sách, HLV Jedd Fisch dùng cách phân bổ ngân sách giống các đội NFL để đầu tư vào các vị trí khác nhau trong đội hình.
Chính trị
Tesla yêu cầu EPA không nới lỏng quy định khí thải
Tesla đề nghị EPA giữ nguyên tiêu chuẩn khí thải, trái ngược với các hãng xe khác và tuyên bố của Tổng Thống Donald Trump về biến đổi khí hậu. Tesla hưởng lợi từ quy định chặt chẽ, bán tín chỉ khí thải cho hãng xe khác. Dù vậy, Tesla sẵn sàng thảo luận để…
Hoa Kỳ
Gia đình nạn nhân vụ Camp Mystic viết thư sau thông báo mở cửa lại
Gia đình bé Cile Steward, 8 tuổi, viết thư gửi Camp Mystic sau khi trại hè thông báo kế hoạch mở cửa trở lại sau trận lụt kinh hoàng làm 27 người chết. Gia đình yêu cầu trại dừng kế hoạch mở cửa và lập đài tưởng niệm cho đến khi tìm thấy thi thể…