Những trợ lý âm thanh như Siri của Apple hay Alexa của Amazon đều cải tiến khả năng phát âm theo thời gian, cho phép nó phát âm giống con người hơn, âm thanh thực hơn.
Theo Pocket-lint, sau khi ra mắt lần đầu tiên trên iPhone 4S vào năm 2011, Siri ngày càng được cải tiến về âm thanh mỗi năm với mục đích làm cho âm thanh của cô gần giống với con người hơn bằng cách kết hợp các kỹ thuật tổng hợp tiếng nói cũ và mới. Kết quả cuối cùng là một trợ lý giọng nói sống động nhất có thể.
Với sự ra mắt của iOS 11, Siri của Apple có một bước đột phá đáng kể về chất lượng tiếng nói. Công ty hy vọng rằng điều này sẽ giúp người dân thân thiện với Siri hơn so với trước đây.
“Đối với iOS 11, chúng tôi đã chọn một giọng nữ mới với mục tiêu cải thiện tính tự nhiên, tính cách và diễn tả cảm xúc”, bộ phận Siri của Apple giải thích.
Sau khi đánh giá hàng trăm ứng viên trước khi chọn người tốt nhất, họ đã chọn một nữ ca sĩ và yêu cầu đọc một bài phát biểu dài. Nội dung ghi lại sau đó được cắt thành các thành phần cơ bản trước khi kết hợp lại tùy thuộc vào văn bản nhập của người dùng để tạo ra bài phát biểu hoàn toàn mới. Người dùng có thể ngay lập tức nhận ra những cải tiến khi nói “Hey Siri”.
Mặc dù quá trình ghi âm lời nói và cắt nó thành những từ mới sau đó đã chứng minh sự thành công trong quá khứ nhưng Apple cho biết rằng công ty có thể làm tốt hơn.
|
Siri mới sẽ chính thức đến với người dùng thông qua bản cập nhật iOS 11 |
Vấn đề là cách tiếp cận của Apple đã không dễ dàng. Họ phải chọn các phân đoạn thoại thích hợp và kết hợp chúng với nhau. Các đặc tính âm thanh của mỗi đoạn thoại phụ thuộc vào điện thoại và khuôn mẫu cũng như nhịp điệu lời nói - thường làm cho các giọng nói không tương thích với nhau. Đó là lý do tại sao nội dung thoại trước đây của Siri trông giống như từ robot.
Để giải quyết vấn đề này, Apple đã chuyển sang máy học và tạo ra một hệ thống có thể dự đoán chính xác các mục tiêu và nối chúng lại với nhau. Trong khi một số lời nói ổn định thì một số lại khá nhanh, điều này buộc các mô hình phải điều chỉnh thông số theo sự biến đổi. Kết quả là Siri giờ không chỉ có khả năng phát âm thanh giống con người hơn mà còn cải thiện đáng kể xử lý tốc độ phát âm so với phiên bản cũ.
Khi người dùng nói chuyện với Siri trong iOS 11 (hiện trong giai đoạn beta), có những khác biệt đáng chú ý trong cách cô ấy trả lời câu hỏi của bạn. Theo dự kiến, mọi người sẽ được tiếp cận với Siri mới chính thức ngay trong tháng này, thời điểm Apple công bố iOS 11 vào ngày 12.9.
Theo Kiến Văn (Thanh Niên Online)