Weibo hôm 13/07 thông báo sẽ mở chiến dịch kiểm tra "hành vi bất hợp pháp khi dùng các chữ đồng âm, các dạng khác nhau của từ ngữ và những từ sai chính tả để lan truyền thông tin gây hại".
"Chúng tôi sẽ củng cố cơ chế giám sát ngôn ngữ của nền tảng Weibo, và sẽ tối ưu hóa mô hình xác định từ khóa," công ty này nói thêm.
Động thái trên được đưa ra trong bối cảnh giới chức Trung Quốc tiếp tục nỗ lực "làm sạch" không gian mạng. Do có nhiều từ khóa được cho là bị kiểm duyệt, người dùng mạng xã hội Trung Quốc lâu nay thường dùng từ đồng âm hoặc viết sai chính tả để né tránh.
Chẳng hạn, tuần này, một số người dùng sử dụng từ "Hà Lan" để thảo luận về các cuộc tập trung liên quan tới hoạt động của một số ngân hàng ở tỉnh Hà Nam (Trung Quốc). Do "Hà Lan" cũng là từ chỉ nước Hà Lan, người dùng mạng xã hội Trung Quốc sử dụng từ Amsterdam, thủ đô Hà Lan, để ám chỉ thành phố Trịnh Châu, thủ phủ tỉnh Hà Nam.
"Tình hình ngân hàng ở Amsterdam, Hà Lan ra sao rồi?", một người dùng đặt câu hỏi trên Weibo.
Trước đó, hàng trăm ngàn người trên khắp Trung Quốc từng gửi tiền ở bốn ngân hàng tại tỉnh Hà Nam đang nỗ lực đòi lại tiền từ tháng 04/2022.
Thời điểm kể trên, tài khoản của họ bị đóng băng sau khi một cuộc điều tra về những cáo buộc cho rằng Henan Xincaifu Group Investment Holding, một công ty đầu tư tư nhân có cổ phần ở cả bốn ngân hàng trên, đã cấu kết với nhân viên ngân hàng để thu hút trái phép nguồn vốn thông qua các nền tảng tài chính trực tuyến.
Một số người dùng mạng xã hội bày tỏ sự không hài lòng với động thái mới của Weibo. "Nếu viết đúng chính tả thì các vị không cho tôi đăng bài đúng không?," một người bình luận. "Các vị muốn chúng tôi đăng bài trên Weibo bằng mã Morse phải không?," một người khác viết.
Wong Kam-fai, giáo sư chuyên về phân tích ngôn ngữ của Đại học Trung Văn Hong Kong, cho rằng các nền tảng mạng xã hội có thể sử dụng nhiều phương pháp để theo dõi việc người dùng sử dụng từ đồng âm hoặc từ sai chính tả. Chẳng hạn, các nền tảng có thể bổ sung từ khóa mới cho từ điển của họ, sau đó huấn luyện cho các mô hình hiểu được tác giả bài đăng có ý gì dựa trên thông tin văn cảnh.
Chẳng hạn, đối với trường hợp từ Hà Nam, phương pháp được sử dụng thường xuyên nhất là phân tích diễn ngôn. Khi người dùng thảo luận về các vụ tập trung đòi tiền liên quan đến ngân hàng, hệ thống có thể hiểu ý tác giả bằng cách tìm hiểu câu trước đó, và dựa trên thông tin văn cảnh.
"Khi nói, chúng ta không nói từng từ riêng lẻ. Trí thông minh nhân tạo có thể xác định ý của bạn bằng cách phân tích văn cảnh," giáo sư Wong giải thích.
Hà An (Nguoiduatin.vn)