Tập đoàn công nghệ Apple vừa công bố những điểm nổi bật từ hội thảo kéo dài hai ngày về Xử lý Ngôn ngữ Tự nhiên (NLP) và Hệ thống Tương tác Ngôn ngữ (NLIS) 2025, diễn ra vào ngày 15-16 tháng 5 vừa qua. Hội thảo quy tụ nhiều nhà nghiên cứu từ các trường đại học và viện nghiên cứu danh tiếng, cũng như các chuyên gia từ các tập đoàn công nghệ lớn.
Ba lĩnh vực nghiên cứu chính được nhấn mạnh bao gồm: Hệ thống Tương tác Ngôn ngữ Nói, Huấn luyện và Căn chỉnh Mô hình Ngôn ngữ Lớn (LLM), và Tác nhân Ngôn ngữ. Dưới đây là một số điểm chính:
1. Sụp đổ Mô hình AI và Phát hiện “Ảo Giác” của LLM
Các nghiên cứu do Yarin Gal, Giáo sư tại Đại học Oxford trình bày, đã chỉ ra nguy cơ sụp đổ của các mô hình AI do việc sử dụng dữ liệu tổng hợp ngày càng tăng từ chính các mô hình này. Ông đề xuất phát triển các công cụ mới để phân biệt nội dung do AI và con người tạo ra, cùng với các quy định chặt chẽ hơn. Một phương pháp mới cũng được giới thiệu để phát hiện “ảo giác” (hallucinations) của LLM bằng cách đánh giá mức độ tin cậy khi mô hình tạo ra câu trả lời.
2. Học Tăng cường cho Tác nhân LLM Tương tác Dài hạn
Kevin Chen, nhà nghiên cứu tại Apple, đã giới thiệu một phương pháp huấn luyện tác nhân LLM có tên là Leave-one-out proximal policy optimization (LOOP). Phương pháp này giúp tác nhân thực hiện các tác vụ đa bước phức tạp, chẳng hạn như xử lý các khoản thanh toán trên Venmo dựa trên ghi chú về chi phí chuyến đi, với ít lỗi và giả định hơn. Dù vậy, mô hình vẫn còn hạn chế ở khả năng tương tác đa lượt với người dùng.
3. “Speculative Streaming”: Suy luận LLM Nhanh chóng mà không cần Mô hình Phụ trợ
Irina Belousova, Quản lý Kỹ thuật tại Apple, đã trình bày kỹ thuật “speculative decoding” (giải mã suy đoán). Kỹ thuật này cho phép sử dụng mô hình nhỏ hơn để tạo ra các chuỗi câu trả lời ứng viên, sau đó được mô hình lớn hơn kiểm tra. Nếu mô hình lớn chấp nhận, quá trình hoàn tất. Phương pháp này giúp giảm thiểu việc sử dụng bộ nhớ, tăng tốc độ xử lý và đơn giản hóa việc triển khai hệ thống, theo tin từ Apple.
Các video và bài báo cáo chi tiết từ hội thảo đã được Apple công bố, mang đến cái nhìn sâu sắc về những tiến bộ trong lĩnh vực NLP.