Nền tảng ghi âm podcast trực tuyến Riverside đã tung ra phiên bản tổng kết cuối năm, tương tự như ‘Wrapped’ của Spotify. Bản tóm tắt này, mang tên ‘Rewind’, tạo ra ba video tùy chỉnh cho người làm podcast.
Thay vì chia sẻ các số liệu thống kê như thời lượng ghi âm hoặc số tập đã thực hiện, Riverside đã tạo ra một đoạn video 15 giây tập hợp những khoảnh khắc cười, cho thấy một chuỗi các clip ngắn trong đó người dẫn chương trình podcast và tôi khiến nhau cười ồ lên. Video tiếp theo tương tự, ngoại trừ việc nó là một bản tóm tắt chúng tôi liên tục nói ‘ừm’.
Sau đó, Riverside quét các bản ghi được tạo bởi AI của bạn để tìm ra từ duy nhất mà bạn nói nhiều nhất (chúng tôi cho rằng họ đã cắt bỏ những từ như ‘và’ hoặc ‘the’).
Thật trớ trêu, nhưng trong podcast của tôi về văn hóa internet, người đồng dẫn chương trình của tôi và tôi đã nói từ ‘book’ (sách) thường xuyên hơn bất kỳ từ nào khác (điều này có lẽ bị ảnh hưởng bởi việc ghi âm ‘câu lạc bộ sách’ chỉ dành cho người đăng ký… hoặc việc người đồng dẫn chương trình của tôi sắp xuất bản một cuốn sách, mà chúng tôi quảng cáo không ngừng). Một chương trình khác trên mạng lưới podcast của chúng tôi, Spirits, đã nói ‘Amanda’ thường xuyên hơn bất kỳ từ nào khác (không phải vì họ bị ám ảnh bởi tôi, mà vì họ cũng có một người dẫn chương trình tên là Amanda).
Trong Slack của mạng lưới podcast, chúng tôi đã trao đổi các video Rewind của mình. Có điều gì đó hài hước vốn có về một video mọi người nói ‘ừm’ lặp đi lặp lại. Nhưng chúng tôi cũng biết những video này đại diện cho điều gì: các công cụ sáng tạo của chúng tôi đang ngày càng bão hòa với các tính năng AI, nhiều tính năng trong số đó chúng tôi không muốn hoặc không cần. Riverside Rewind chỉ ra sự vô dụng của chính những công cụ này – tại sao tôi cần một video về việc người đồng dẫn chương trình và tôi lặp đi lặp lại từ ‘book’? Nó tốt để cười phá lên một chút, nhưng không có gì đáng kể.
Mặc dù tôi thích bản tóm tắt AI của Riverside, sự xuất hiện của nó đến vào thời điểm mà những người cùng ngành của tôi đang mất đi cơ hội tạo, chỉnh sửa và sản xuất các podcast mới, nhờ vào cùng một công cụ AI đã tạo ra video Rewind của chúng tôi. Nhưng trong khi AI cho phép chúng ta tự động hóa một số tác vụ – như chỉnh sửa ‘ừm’ và khoảng lặng của chúng ta – thì podcasting không hoàn toàn mang tính cơ học như vậy.
AI có thể nhanh chóng tạo ra một bản ghi âm podcast của tôi, điều này rất quan trọng vì lý do khả năng truy cập, giúp tự động hóa một hoạt động từng tốn nhiều thời gian và tẻ nhạt. Tuy nhiên, AI không có khả năng đưa ra các lựa chọn về biên tập xung quanh cách điều khiển âm thanh hoặc video để kể một câu chuyện một cách hiệu quả. Không giống như những người biên tập mà tôi làm việc cùng, AI không thể xác định khi nào một cuộc trò chuyện lan man trong một podcast là hài hước và khi nào nó nên bị cắt vì nó nhàm chán.
Bất chấp sự trỗi dậy của các công cụ âm thanh AI được cá nhân hóa, như NotebookLM của Google, khả năng của nó trong việc phục vụ như một công cụ sáng tạo cũng đã chứng kiến những thất bại nổi bật, gần đây.
Tuần trước, The Washington Post bắt đầu tung ra các podcast được tạo ra bằng AI, được cá nhân hóa về tin tức trong ngày.
Bạn có thể thấy tại sao điều này có vẻ như là một ‘ý tưởng hay’ đối với những người điều hành tham lam lợi nhuận – thay vì trả tiền cho một nhóm để thực hiện công việc chuyên sâu về nghiên cứu, ghi âm, chỉnh sửa và phân phối một chương trình hàng ngày, bạn có thể tự động hóa nó – ngoại trừ bạn không thể.
Các podcast đã đưa ra những trích dẫn bịa đặt và các lỗi thực tế, điều này rất nguy hiểm cho một tổ chức tin tức. Theo Semafor, thử nghiệm nội bộ của The Post cho thấy rằng từ 68% đến 84% các podcast AI không đáp ứng các tiêu chuẩn của ấn phẩm. Điều này có vẻ như là một sự hiểu sai cơ bản về cách hoạt động của LLM. Bạn không thể huấn luyện một LLM để phân biệt thực tế với hư cấu vì nó được thiết kế để cung cấp kết quả có khả năng thống kê nhất cho một lời nhắc, điều này không phải lúc nào cũng là kết quả trung thực nhất – đặc biệt là trong các tin tức nóng hổi.
Riverside đã làm rất tốt việc tạo ra một sản phẩm cuối năm thú vị, nhưng nó cũng là một lời nhắc nhở. AI đang xâm nhập vào mọi ngành công nghiệp, bao gồm cả podcasting. Nhưng trong thời điểm ‘bùng nổ AI’ này, khi các công ty mày mò với công nghệ mới, chúng ta cần phân biệt giữa khi nào AI phục vụ chúng ta và khi nào nó là thức ăn cho những thứ vô dụng.
Theo TechCrunch, công cụ AI Rewind của Riverside mang đến những trải nghiệm thú vị cho người làm podcast, nhưng đồng thời, AI cũng đặt ra những thách thức đáng kể về chất lượng và tính xác thực trong ngành công nghiệp podcasting. Sự phát triển này đặt ra câu hỏi về vai trò của AI trong tương lai của ngành.


































