Xử lí ngôn ngữ
Quy tắc đặt dấu thanh trong tiếng Việt | |||||||||||||||||||||||||
VŨ XUÂN LƯƠNG - Trung Tâm Từ Điển Học | |||||||||||||||||||||||||
Tiếng Việt được thể hiện qua hai dạng chữ viết, chữ Nôm và chữ quốc ngữ. Các vấn đề nghiên cứu để biểu diễn chữ Nôm trong công nghệ thông tin mới được nghiên cứu và gần đây đã thu được những thành công bước đầu. Mối quan tâm chính của giới công nghệ thông tin trong những năm qua là tập trung nghiên cứu chữ quốc ngữ để biểu diễn bên trong máy tính. Kết quả của quá trình nghiên cứu là đã công bố được một bảng mã tiêu chuẩn cho tiếng Việt, viết tắt là TCVN-5712 (1993). Cùng với bảng mã TCVN-5712 là sự ra đời của bộ font chữ ABC, được quy định là tiêu chuẩn quốc gia. Tuy nhiên, do còn nhiều hạn chế mà bảng mã TCVN-5712 không được sự ủng hộ của giới làm phần mềm, và kết quả là trên lãnh thổ Việt Nam cũng như ở nước ngoài đã sản sinh ra rất nhiều bộ mã cho chữ Việt, dẫn đến một tình trạng hỗn độn chữ Việt trên thị trường công nghệ thông tin. Việc ra đời của nhiều phần mềm gõ chữ Việt có tích hợp nhiều cách bỏ dấu khác nhau cũng góp phần tạo nên sự hỗn độn đó. Hậu quả là gây trở ngại không nhỏ cho việc lưu trữ, xử lí cũng như trao đổi ngữ liệu trên máy tính cá nhân, trên mạng máy tính, trên Internet, v.v.
|
Bài đăng trước: