Theo Bộ Thông tin và Truyền thông, Viettel AI Open Platform cung cấp những công nghệ nền tảng sử dụng trí tuệ nhân tạo, giúp cho việc vận hành công việc của các tổ chức, doanh nghiệp được tự động hóa, tối ưu và hiệu quả hơn thông qua những kỹ thuật tiên tiến nhất trên thế giới. Viettel AI Open Platform hiện đang tập trung khai thác những lĩnh vực như: công nghệ xử lý giọng nói tiếng Việt, công nghệ xử lý ngôn ngữ tự nhiên tiếng Việt, công nghệ thị giác máy tính...
Hệ thống được phát triển bởi Trung tâm Không gian mạng thuộc Tập đoàn Công nghiệp - Viễn thông Quân đội Viettel với mục đích đưa các công nghệ ngang tầm thế giới trong lĩnh vực trí tuệ nhân tạo phục vụ người Việt.
Phát biểu tại lễ ra mắt, Thứ trưởng Bộ Thông tin và Truyền thông Nguyễn Thành Hưng cho biết, Viettel AI Open Platform là một trong những nền tảng số 'Make in Vietnam' được Bộ Thông tin và Truyền thông lựa chọn để giới thiệu và bảo trợ truyền thông. Đây cũng là một trong số ít các nền tảng cung cấp đầy đủ công cụ về trí tuệ nhân tạo cho các ứng dụng chuyển đổi số tại Việt Nam, qua đó có thể tích hợp nhằm tự động hóa, nâng cao trải nghiệm người dùng và tối ưu chi phí.
Để tăng cường hợp tác nghiên cứu, góp phần thúc đẩy đề án chuyển đổi số quốc gia, Viettel áp dụng chính sách cung cấp nền tảng AI mở miễn phí đối với các cá nhân, doanh nghiệp, tổ chức đăng ký sử dụng trong giai đoạn phát triển ứng dụng của mình, chỉ tính phí hoặc hợp tác kinh doanh khi thương mại hóa sản phẩm.
Các công nghệ nổi bật mà Viettel AI Open Platform cung cấp bao gồm:
- Text to Speech: Công nghệ tổng hợp giọng nói cho phép chuyển văn bản thành giọng nói nhân tạo tiếng Việt có độ tự nhiên đạt điểm MOS 4.4, tương đương 95% giọng người thật, hỗ trợ đa dạng 12 giọng đọc nhân tạo 3 miền Bắc - Trung - Nam, giới tính nam, nữ khác nhau, tùy chỉnh định dạng phát âm các danh từ riêng theo yêu cầu.
- Speech to Text: Công nghệ nhận dạng giọng nói cho phép chuyển giọng nói tiếng Việt thành văn bản với độ chính xác nhận dạng lên tới 95%, hỗ trợ nhận dạng đa dạng giọng, đa dạng định dạng âm thanh đầu vào (8k, 16k), tùy chỉnh văn bản đầu ra theo yêu cầu.
- Computer Vision: Công nghệ thị giác máy tính cho phép nhận dạng hình ảnh với độ chính xác nhận dạng lên tới 98%, hỗ trợ nhận dạng ký tự văn bản, tài liệu tiếng Việt, nhận dạng và so khớp mặt người, nhận dạng các phương tiện giao thông, biển số xe theo thời gian thực.
- NLP: Công nghệ xử lý ngôn ngữ tự nhiên tiếng Việt cho phép thay thế một phần khả năng suy luận của con người như nhận diện các từ, loại từ, thực thể, ý định trong văn bản, nhận diện sắc thái tiêu cực, tích cực của một bài viết, kiểm tra và sửa lỗi chính tả văn bản.
Theo Thanh Mạnh (Nguoiduatin.vn)