Viện Laude vừa công bố lô cấp vốn Slingshots đầu tiên, một chương trình được thiết kế để thúc đẩy khoa học và thực hành trí tuệ nhân tạo (AI). Chương trình này hoạt động như một vườn ươm cho các nhà nghiên cứu, cung cấp các nguồn lực như tài trợ, năng lực tính toán, cùng với sự hỗ trợ về sản phẩm và kỹ thuật, những điều thường khó có được trong môi trường học thuật thông thường.
Đổi lại, những người nhận tài trợ cam kết tạo ra một sản phẩm cuối cùng, có thể là một công ty khởi nghiệp, một kho mã nguồn mở, hoặc một hiện vật khác. Đợt đầu tiên bao gồm 15 dự án, tập trung vào vấn đề đánh giá AI, một lĩnh vực quan trọng và đầy thách thức. Một số dự án nổi bật trong danh sách bao gồm Terminal Bench, một công cụ đánh giá mã nguồn, và phiên bản mới nhất của dự án ARC-AGI lâu đời.
Các dự án khác đưa ra cách tiếp cận mới cho các vấn đề đánh giá AI đã được thiết lập từ lâu. Ví dụ, Formula Code, do các nhà nghiên cứu từ CalTech và UT Austin phát triển, nhằm mục đích đánh giá khả năng tối ưu hóa mã hiện có của các tác nhân AI. Trong khi đó, BizBench, có trụ sở tại Columbia, đề xuất một hệ thống đánh giá toàn diện cho các tác nhân AI trong lĩnh vực kinh doanh.
John Boda Yang, đồng sáng lập SWE-Bench, cũng tham gia vào chương trình này với dự án CodeClash. Lấy cảm hứng từ thành công của SWE-Bench, CodeClash sẽ đánh giá mã thông qua một khuôn khổ cạnh tranh năng động, một phương pháp mà Yang tin rằng sẽ thúc đẩy sự tiến bộ trong việc đánh giá AI, theo TechCrunch.



























