Trận chiến bá chủ không gian AI khởi động cuối năm 2022 khi OpenAI – startup được Microsoft hậu thuẫn – ra mắt chatbot ChatGPT. Ngay sau đó, các hãng công nghệ lớn như Alphabet, Baidu đều thông báo những nỗ lực tương tự.
Meta LLaMA, viết tắt của Large Language Model Meta AI, sẽ có mặt dưới dạng bằng sáng chế phi thương mại cho các nhà nghiên cứu và tổ chức liên kết với chính phủ, xã hội, học viện.
Các mô hình ngôn ngữ lớn khai thác lượng văn bản khổng lồ để tổng hợp thông tin và tạo ra nội dung. Chúng có thể trả lời câu hỏi bằng những câu dài như con người viết. Meta cho biết, mô hình của họ cần ít điện toán máy tính hơn nhiều so với các mô hình khác. LLaMA được đào tạo dựa trên 20 ngôn ngữ, trọng tâm là các ký tự Latinh và Cyrillic.
Theo nhà phân tích phần mềm cấp cao Gil Luria, Meta dường như đang thử nghiệm chức năng AI tạo sinh để tích hợp vào các sản phẩm, dịch vụ của mình trong tương lai. AI tạo sinh là một ứng dụng mới của AI mà Meta chưa có nhiều kinh nghiệm, song rõ ràng rất quan trọng với việc kinh doanh của hãng.
AI nổi lên như một điểm sáng đầu tư của ngành công nghệ, vốn đang trải qua tăng trưởng chậm dẫn đến sa thải hàng loạt và cắt giảm các dự án mang tính thử nghiệm. Meta tự tin LLaMA có thể đánh bại đối thủ do thuật toán xét đến nhiều tham số hơn. Cụ thể, một phiên bản LLaMA với 13 tỷ tham số sẽ vượt trội hơn GPT3, nền tảng của ChatGPT.
Meta so sánh mô hình LLaMA với 65 tỷ tham số với Chinchilla70B và PaLM-540B của Google, hai mô hình thậm chí còn lớn hơn cả mô hình Google dùng để giới thiệu chatbot Bard.
Người phát ngôn của Meta chia sẻ, hiệu suất của LLaMA có được là nhờ dữ liệu “sạch hơn” và “cải thiện trong kiến trúc” mô hình. Năm ngoái, Meta công bố mô hình ngôn ngữ lớn OPT-175B, cũng dành cho các nhà nghiên cứu. Tiếp đến, hãng còn tung ra mô hình Galactica, có thể viết các bài báo khoa học và giải toán nhưng nhanh chóng đóng cửa do cung cấp các đáp án sai.
Theo Du Lam (ICT News)