Tin vui này đã được công bố tại sự kiện VidCon vào tuần trước. YouTube đã hợp tác cùng dịch vụ lồng tiếng Aloud do AI cung cấp, một thành tựu đến từ Google Khu vực 120, nơi các ý tưởng sáng tạo được thổi hồn vào đời.
Đầu năm nay, YouTube đã chào đón tính năng mới giúp hỗ trợ âm thanh đa ngôn ngữ, cho phép những người sáng tạo thêm lớp âm thanh mới vào video hiện có hoặc video mới của mình, giúp họ kết nối với nhiều khán giả quốc tế hơn bao giờ hết. Vào tháng 6/2023, hàng ngàn video đã được lồng tiếng bằng hơn 70 ngôn ngữ, theo thông tin từ công ty được TechCrunch đăng tải.
Trước đây, việc lồng tiếng video phụ thuộc hoàn toàn vào sự hợp tác với các nhà cung cấp lồng tiếng bên thứ ba, một quá trình đòi hỏi không ít thời gian và tiền bạc. Nhưng giờ đây, với sự xuất hiện của Aloud, mọi thứ đã thay đổi. Aloud cho phép các nhà sáng tạo lồng tiếng video của mình mà không cần phải trả thêm chi phí.
Aloud, phiên bản AI lồng tiếng, đã được Google giới thiệu lần đầu vào 2022. Công nghệ này giúp tạo ra bản ghi âm của video, sau đó tự động dịch và lồng tiếng. Nhờ Aloud, các nhà sáng tạo có thể xem lại và chỉnh sửa bản chép lời trước khi tạo ra phiên bản lồng tiếng cuối cùng.
YouTube đang tiến hành thử nghiệm công cụ mới này với hàng trăm nhà sáng tạo. Amjad Hanif, Phó Giám đốc Sản phẩm dành cho Người sáng tạo của YouTube, đã chia sẻ thêm thông tin thú vị trong một cuộc phỏng vấn gần đây. Ông cho biết công ty sẽ sớm mở rộng công cụ này cho tất cả các nhà sáng tạo trên nền tảng. Hiện tại, Aloud đã có sẵn trong ba ngôn ngữ: tiếng Anh, tiếng Tây Ban Nha và tiếng Bồ Đào Nha. Tuy nhiên, trong tương lai, sẽ còn nhiều ngôn ngữ khác được cung cấp, bao gồm tiếng Hindi và tiếng Bahasa Indonesia.
Hanif cũng chia sẻ thêm rằng YouTube đang nỗ lực để làm cho âm thanh được dịch sao cho giống với giọng nói của người sáng tạo, với sự biểu đạt và những giai điệu thú vị hơn. YouTube đã xác nhận với TechCrunch rằng trong tương lai, công nghệ tổng hợp giọng nói của AI sẽ giúp Aloud mang đến nhiều tính năng hấp dẫn hơn, bao gồm việc bảo toàn giọng nói, tái hiện cảm xúc tốt hơn.