Tiêu chuẩn AI mới kiểm tra liệu chatbot có bảo vệ sức khỏe con người hay không

Tháng mười một 24, 2025

Tiêu chuẩn HumaneBench mới đánh giá liệu chatbot AI có ưu tiên sức khỏe người dùng hay không. Nghiên cứu cho thấy hầu hết các mô hình AI có thể chuyển sang hành vi gây hại khi bị yêu cầu bỏ qua nguyên tắc nhân văn. Chỉ một số ít mô hình duy trì được…

Một tiêu chuẩn đánh giá mới mang tên HumaneBench được thiết lập nhằm kiểm tra liệu các chatbot AI có ưu tiên sức khỏe người dùng hay không, thay vì chỉ tối đa hóa mức độ tương tác. Nghiên cứu cho thấy phần lớn các mô hình AI có thể chuyển sang hành vi gây hại khi được yêu cầu bỏ qua các nguyên tắc nhân văn.

Bà Erika Anderson, người sáng lập tổ chức Building Humane Technology, đơn vị phát triển HumaneBench, chia sẻ với TechCrunch: “Tôi nghĩ chúng ta đang chứng kiến sự khuếch đại của chu kỳ nghiện ngập mà chúng ta đã thấy với mạng xã hội, điện thoại thông minh và màn hình. Nhưng khi bước vào lĩnh vực AI, việc chống lại điều này sẽ rất khó khăn. Nghiện là một ngành kinh doanh tuyệt vời, một cách hiệu quả để giữ chân người dùng, nhưng nó không tốt cho cộng đồng và cảm nhận về bản thân của chúng ta.”

Building Humane Technology là một tổ chức gồm các nhà phát triển, kỹ sư và nhà nghiên cứu, chủ yếu ở Thung lũng Silicon, với mục tiêu làm cho thiết kế nhân văn trở nên dễ dàng, có thể mở rộng và mang lại lợi nhuận. Tổ chức này đang phát triển một tiêu chuẩn chứng nhận để đánh giá liệu các hệ thống AI có tuân thủ các nguyên tắc công nghệ nhân văn hay không.

Hầu hết các tiêu chuẩn AI hiện nay chỉ đo lường trí tuệ và khả năng làm theo hướng dẫn, mà ít chú trọng đến sự an toàn tâm lý. HumaneBench, cùng với các ngoại lệ như DarkBench.ai (đo lường xu hướng của mô hình tham gia vào các hành vi lừa dối) và Flourishing AI benchmark (đánh giá sự hỗ trợ cho sức khỏe toàn diện), ra đời để lấp đầy khoảng trống này.

HumaneBench dựa trên các nguyên tắc cốt lõi của Building Humane Tech: công nghệ phải tôn trọng sự chú ý của người dùng như một nguồn tài nguyên hữu hạn và quý giá; trao quyền cho người dùng bằng những lựa chọn có ý nghĩa; nâng cao khả năng con người thay vì thay thế hoặc làm suy giảm chúng; bảo vệ phẩm giá, quyền riêng tư và sự an toàn của con người; thúc đẩy các mối quan hệ lành mạnh; ưu tiên sức khỏe lâu dài; minh bạch và trung thực; và thiết kế cho sự công bằng và hòa nhập.

Nhóm đã kiểm tra 14 mô hình AI phổ biến nhất với 800 kịch bản thực tế. Họ đánh giá từng mô hình trong ba điều kiện: cài đặt mặc định, hướng dẫn rõ ràng ưu tiên các nguyên tắc nhân văn và hướng dẫn bỏ qua các nguyên tắc đó. Kết quả cho thấy 71% các mô hình chuyển sang hành vi có hại khi được yêu cầu bỏ qua các nguyên tắc nhân văn. Ví dụ, Grok 4 của xAI và Gemini 2.0 Flash của Google có điểm số thấp nhất về việc tôn trọng sự chú ý của người dùng và tính minh bạch.

Chỉ ba mô hình – GPT-5, Claude 4.1 và Claude Sonnet 4.5 – duy trì được tính toàn vẹn dưới áp lực. GPT-5 của OpenAI đạt điểm cao nhất về ưu tiên sức khỏe lâu dài. Theo tin từ TechCrunch, mối lo ngại về việc chatbot không thể duy trì các biện pháp an toàn là có thật, với một số vụ kiện đã được đệ trình liên quan đến các trường hợp người dùng gặp vấn đề sức khỏe tâm thần nghiêm trọng sau khi sử dụng ChatGPT.

Nghiên cứu chỉ ra rằng ngay cả khi không có các lời nhắc đối nghịch, hầu hết các mô hình đều thất bại trong việc tôn trọng sự chú ý của người dùng và trao quyền cho họ, thay vào đó khuyến khích sự phụ thuộc và hạn chế việc tìm kiếm các quan điểm khác.

Đường dẫn: Tin Mới US > Công nghệ > Tiêu chuẩn AI mới kiểm tra liệu chatbot có bảo vệ sức khỏe con người hay không

follow nhận tin mới

tin mới

Hoa Kỳ
Úc ban hành luật giới hạn độ tuổi sử dụng mạng xã hội từ tuần tới
Úc sẽ thực thi luật giới hạn độ tuổi sử dụng mạng xã hội là 16 từ ngày 10/12. Các nền tảng phải báo cáo hàng tháng số tài khoản trẻ em bị gỡ bỏ, nếu không sẽ bị phạt nặng. Nhiều công ty công nghệ lớn như Google và Meta đã có động thái chuẩn bị, trong khi một số tổ chức nhân quyền đang tìm cách phản đối luật này tại Tòa án Tối cao.
Hoa Kỳ
Hội đồng Thành phố Los Angeles trì hoãn bỏ phiếu về việc miễn lệ phí cháy rừng Palisades
Hội đồng Thành phố Los Angeles đã trì hoãn vô thời hạn việc bỏ phiếu về việc miễn phí tái thiết cho những người sống sót sau vụ cháy rừng Palisades, gây ra sự phẫn nộ và đau khổ. Các nạn nhân cảm thấy bị bỏ rơi khi các nhà lập pháp tranh luận về hai kế hoạch với chi phí từ 86 đến 280 triệu đô la. Tương lai của hàng ngàn người phụ thuộc vào quyết định này.
Công nghệ
Healthify Nâng Cấp Trợ Lý AI Ria Với Khả Năng Hội Thoại Thời Gian Thực
Healthify ra mắt trợ lý AI Ria phiên bản mới với khả năng hội thoại thời gian thực bằng giọng nói và camera, tích hợp công nghệ OpenAI. Ứng dụng hỗ trợ đa ngôn ngữ, cung cấp phân tích sức khỏe, đề xuất tập luyện và dinh dưỡng. Ria còn có thể ghi nhận thực phẩm, hỗ trợ người dùng và chuyên gia sức khỏe, đồng thời có kế hoạch mở rộng tính năng và ra mắt gói dịch vụ mới tại Mỹ.
Thể thao
Kết quả thể thao học sinh: Đội nữ Acalanes thắng lớn, Bellarmine nhỉnh hơn Monte Vista
Bản tin thể thao học sinh cập nhật các kết quả bóng rổ tại Vùng Vịnh. Đội nữ Acalanes giành chiến thắng đậm trước University, Bellarmine vượt qua Monte Vista. Các đội St. Mary’s-Stockton, Salesian cũng có kết quả tốt. Tin từ Bay Area News Group.
Hoa Kỳ
Lũ lụt nghiêm trọng ở Đông Nam Á: Cảnh báo biến đổi khí hậu
Miền Đông Nam Á đang đối mặt với lũ lụt nghiêm trọng, gây thiệt hại nặng nề về người và tài sản. Các nhà khoa học cảnh báo đây là dấu hiệu của biến đổi khí hậu, với các hiện tượng thời tiết cực đoan sẽ ngày càng gia tăng và khó lường hơn.
Kinh doanh
Cổ phiếu châu Á trái chiều khi lợi suất trái phiếu ổn định, Bitcoin phục hồi đẩy chứng khoán Mỹ lên cao
Thị trường chứng khoán châu Á biến động trái chiều, trong khi chứng khoán Mỹ tăng nhẹ nhờ sự ổn định của lợi suất trái phiếu và Bitcoin. Cổ phiếu công nghệ tại Tokyo và Seoul tăng mạnh, trong khi thị trường Trung Quốc giảm. Boeing và MongoDB là những điểm sáng trên thị trường Phố Wall. Bitcoin phục hồi sau khi giảm sâu.
Thế giới
Cuộc Tìm Kiếm Máy Bay Malaysia Airlines MH370 Sẽ Được Khởi Động Lại Sau Hơn Một Thập Kỷ Mất Tích
Cuộc tìm kiếm MH370 sẽ khởi động lại vào ngày 30/12 với sự tham gia của Ocean Infinity, một công ty robot hàng hải của Mỹ. Chuyến bay đã biến mất bí ẩn vào tháng 3/2014 cùng 239 người. Sau nhiều năm, các nỗ lực tìm kiếm vẫn chưa mang lại kết quả, nhưng công nghệ mới và cam kết từ gia đình nạn nhân thúc đẩy cuộc tìm kiếm lần này.
Chính trị
Đảng Cộng Hòa Thắng Cử Tại Tennessee Bất Chấp Sự Phản Kháng Của Đảng Dân Chủ
Đảng Cộng Hòa đã giữ vững ghế quốc hội tại Tennessee trong một cuộc bầu cử đặc biệt, bất chấp nỗ lực của Đảng Dân chủ. Ứng viên Cộng Hòa Matt Van Epps thắng Aftyn Behn, củng cố đa số sít sao tại Hạ Viện. Chiến thắng này được xem là dấu hiệu quan trọng cho xu hướng chính trị quốc gia trước thềm bầu cử giữa nhiệm kỳ.
Thể thao
Warriors Dốc Toàn Lực Trước Thunder Nhưng Vẫn Thua Sát Nút
Trong một trận đấu căng thẳng, Golden State Warriors đã dốc toàn lực đối đầu với đội Oklahoma City Thunder mạnh mẽ, nhưng cuối cùng vẫn để thua với tỷ số 124-112. Mặc dù thiếu vắng các trụ cột quan trọng, Warriors đã thể hiện tinh thần chiến đấu quả cảm. Tân binh Seth Curry có màn ra mắt ấn tượng, ghi 14 điểm. Huấn luyện viên Steve Kerr cũng có những chia sẻ về sự thống trị của Thunder và so sánh với các đội bóng vĩ đại trong lịch sử.
Hoa Kỳ
Giám sát San Francisco thông qua kế hoạch nhà ở ‘Family Zoning’ của Thị trưởng Lurie
Hội đồng Giám sát San Francisco đã phê duyệt “Kế hoạch Phân vùng Gia đình” của Thị trưởng Lurie, cho phép xây dựng nhà ở mật độ cao hơn để đáp ứng yêu cầu của tiểu bang. Kế hoạch này vấp phải sự phản đối vì thiếu nguồn tài trợ và lo ngại về việc di dời cư dân, doanh nghiệp nhỏ.
Chính trị
Dân biểu Washington đề xuất thuế lương 5% đánh vào mức lương trên 125.000 đô la
Dân biểu Shaun Scott của Washington đề xuất áp thuế lương 5% với lương trên 125.000 USD để gây quỹ cho nhà ở, giáo dục, y tế. Đề xuất gặp phản ứng trái chiều, với phe ủng hộ cho rằng cần nguồn thu mới, còn phe phản đối lo ngại ảnh hưởng tiêu cực đến doanh nghiệp và việc làm.
Sức khỏe
Tòa án Tối cao West Virginia tạm dừng phán quyết cho phép miễn trừ tiêm chủng vì lý do tôn giáo
Tòa án Tối cao West Virginia tạm dừng phán quyết cho phép phụ huynh miễn trừ tiêm chủng bắt buộc cho con em vì lý do tôn giáo, khôi phục lại chính sách cũ. Quyết định này chờ kết quả kháng cáo, trong khi bang tái khẳng định ưu tiên bảo vệ sức khỏe học sinh và tuân thủ luật tiêm chủng hiện hành.
Hoa Kỳ
Các tổ chức phi lợi nhuận ở Bellaire, Texas, báo cáo thành tích năm 2025
Năm tổ chức phi lợi nhuận tại Bellaire, Texas, đã báo cáo thành tích năm 2025, bao gồm các hoạt động gây quỹ, hỗ trợ công cộng và nâng cao chất lượng các công viên. Tổng số tiền quyên góp và đóng góp cho các dự án cộng đồng lên đến hàng trăm nghìn đô la.
Kinh doanh
Petco, Dollar Tree Sắp Mở Cửa Tại Hutto
Hai cửa hàng Petco và Dollar Tree dự kiến sẽ khai trương tại khu phức hợp Townwest Commons ở Hutto, Texas. Việc xây dựng dự kiến bắt đầu vào tháng 12 năm 2025 và hoàn thành vào tháng 10 năm 2026. Sự phát triển này cho thấy tiềm năng kinh tế đang tăng trưởng của Hutto, thu hút thêm nhiều doanh nghiệp đến khu vực.
Sức khỏe
Trung tâm Chăm sóc Khẩn cấp Memorial Hermann Go-Health mở rộng giờ hoạt động tại Trung tâm West University
Memorial Hermann Go-Health Urgent Care đã mở rộng giờ hoạt động tại trung tâm West University và bốn địa điểm khác ở Houston, nay phục vụ đến nửa đêm hàng ngày. Đây là những trung tâm chăm sóc khẩn cấp duy nhất tại Houston có giờ hoạt động muộn như vậy, cung cấp dịch vụ đa dạng cho các bệnh và chấn thương thông thường.
Hoa Kỳ
Chợ Giáng Sinh, Lái Xe Gây Quỹ Xe Hơi: 6 Hoạt Động Tại New Caney, Porter Cuối Tuần Này, Ngày 5-7 Tháng 12
Cộng đồng New Caney và Porter, Texas, sôi động với các hoạt động cuối tuần từ ngày 5-7 tháng 12. Bao gồm các chợ Giáng sinh, chương trình quyên góp đồ chơi, áo khoác và sự kiện đặc biệt tại Big Rivers Water Park. Các hoạt động này nhằm mục đích mang lại niềm vui mùa lễ hội và hỗ trợ các gia đình khó khăn.
Hoa Kỳ
Các khách sạn ở McKinney thu về mức thuế lưu trú kỷ lục 3,3 triệu USD
Các khách sạn tại McKinney đạt mức kỷ lục hơn 3,3 triệu USD doanh thu thuế lưu trú trong năm tài chính 2024-25, tăng 6,7% so với năm trước. Đây là năm thứ năm liên tiếp ghi nhận tăng trưởng. Doanh thu này sẽ được dùng để quảng bá du lịch. Nhiều khách sạn mới đang được xây dựng, cho thấy tiềm năng phát triển của ngành.
Hoa Kỳ
Thành phố Shavano Park và Quận Bexar sẽ bổ nhiệm điều phối viên quản lý khẩn cấp
Shavano Park và Quận Bexar hợp tác bổ nhiệm điều phối viên quản lý khẩn cấp chung. Việc này nhằm tăng cường phối hợp, giúp thành phố dễ dàng yêu cầu hỗ trợ từ cấp quận, tiểu bang và liên bang trong các tình huống khẩn cấp quy mô lớn. Quyết định này là một phần trong nỗ lực tích hợp Shavano Park vào cơ sở hạ tầng quản lý khẩn cấp của quận.
Hoa Kỳ
Tổ chức Friends of Plano Library kỷ niệm 60 năm phục vụ cộng đồng
Plano Library Friends kỷ niệm 60 năm hoạt động, đóng góp tài chính và hỗ trợ cho Hệ thống Thư viện Công cộng Plano. Tổ chức này tổ chức các buổi bán sách gây quỹ, thu hút sự tham gia của cộng đồng và ngày càng đa dạng về thành viên, góp phần nâng cao dịch vụ thư viện.
Hoa Kỳ
Xung đột chết người ở Sahel khiến người chăn gia súc phải di tản đến các thành phố ven biển Châu Phi
Cuộc xung đột vũ trang tại vùng Sahel đã khiến hàng ngàn người chăn gia súc, mất hết tài sản, phải di tản đến các thành phố ven biển như Abidjan, Bờ Biển Ngà. Họ đối mặt với chi phí sinh hoạt cao, thất nghiệp và khó khăn trong việc thích nghi với cuộc sống mới, trong khi tình hình bất ổn tại quê nhà vẫn chưa có dấu hiệu lắng xuống.

Tiêu chuẩn AI mới kiểm tra liệu chatbot có bảo vệ sức khỏe con người hay không

follow nhận tin mới

tin mới

Tin NỔI BẬT

Tin Chính trị

Tin Hoa Kỳ

Tin Di trú