Trang nhất

THUYỀN NAN hay THUYỀN LAN?

Trong quá trình nhập văn bản cho Kho ngữ liệu tiếng Việt của Vietlex, nhân viên đánh máy đã tự ý sửa hai chữ “thuyền lan” trong sách gốc thành “thuyền nan”, vì cho rằng sách in sai. Cũng dễ hiểu thôi, do hai chữ “thuyền lan” nghe xa lạ, đến Wikipedia cũng ghi là “thuyền nan” kia mà!

 

(Ảnh chụp màn hình trang vi.wikipedia.org)

 

Vậy “thuyền nan” hay “thuyền lan” mới đúng đây?

Khảo sát kho ngữ liệu của Vietlex thì “thuyền lan” xuất hiện 15 lần, phổ biến ở các tác phẩm thơ cổ điển. Chẳng hạn, “thuyền lan” xuất hiện trong tác phẩm “Ai tư vãn” (Ngọc Hân công chúa) do Nguyễn Thạch Giang biên khảo và chú giải:

Rút dây vâng mệnh phụ hoàng,
Thuyền lan chèo quế thuận đường vu quy.

Nguyễn Thạch Giang giải thích: “thuyền lan chèo quế: thuyền gỗ lan chèo gỗ quế. Chỉ thuyền chèo quý, sang trọng đưa Ngọc Hân về nhà chồng.”

 

(Ảnh chụp màn hình Concordancer ...

Chi tiết
 
QUÁN trong câu ca dao “CÓ QUÁN TÌNH PHỤ CÂY ĐA” là cái gì?

Trong tâm thức của người Việt hiện đại, khi nhắc đến QUÁN thì hầu hết mọi người đều nghĩ ngay đến một gian nhà hoặc một căn nhà nhỏ có cấu trúc đơn giản, dùng làm nơi bán hàng như quán nước, quán cháo, quán bún ốc, quán cơm bình dân, quán cà phê, v.v. Điều này thật khó lí giải khi ta bắt gặp câu ca dao “Có quán tình phụ cây đa, Ba năm quán đổ cây đa hãy còn.” QUÁN nếu được hiểu như đã nêu ở trên thì có liên quan gì đến CÂY ĐA được nhỉ?

 

(Nguồn ảnh: Internet)

 

CÂY ĐA thuộc dạng cây to, sống lâu năm, có nhiều rễ phụ mọc từ cành thõng xuống, thường trồng nơi cổng làng, đình chùa ở các vùng nông thôn Việt Nam để lấy bóng mát. Vóc dáng và sự hữu dụng của cây đa đã trở nên thân thuộc với người nông dân. CÂY ĐA vừa là nơi tránh nắng, trú mưa, vừa là nơi nghỉ ngơi cho người ...

Chi tiết
 
NHẬN DẠNG THỰC THỂ ĐỊNH DANH TRONG VĂN BẢN TIẾNG VIỆT

(Bài báo cập nhật trên cơ sở bài gửi tham gia Hội thảo khoa học Giữ gìn sự trong sáng của tiếng Việt trên các phương tiện thông tin đại chúng. 5-11-2016)


 

1. Giới thiệu

Nhận dạng thực thể định danh (Named Entity Recognition – NER), còn gọi là nhận dạng thực thể có tên, là nhiệm vụ nhận biết các từ xuất hiện trong văn bản là tên gọi của một đối tượng nào đó, như tên người (nhân danh), tên đất (địa danh, địa điểm), tên tổ chức, tên tác phẩm, tên sự kiện, thời gian, tiền tệ, v.v. NER đóng vai trò quan trọng trong các ứng dụng tự động trích xuất thông tin, khai phá dữ liệu, dịch máy, v.v.

NER đã được quan tâm nghiên cứu trên thế giới từ đầu những năm 1990. Hiện nay các hệ thống NER cho tiếng Anh, tiếng Đức, tiếng Hà Lan, v.v. đã được xây dựng và được đánh giá cao. Điểm chung của các hệ thống NER này là tập trung đi vào nhận dạng 3 ...

Chi tiết
 
XÂY DỰNG MÔ HÌNH NGỮ NGHĨA ÁP DỤNG CHO VIỆC BIÊN SOẠN TỪ ĐIỂN GIẢI THÍCH

1. ĐẶT VẤN ĐỀ

Quá trình con người nhận biết, hiểu biết về thế giới khách quan hầu như không có sự khác biệt giữa các dân tộc trên thế giới. Có chăng đó là sự khác biệt về cách thức tư duy, tức là cách thức sử dụng các đơn vị ngôn ngữ để phản ánh và tái hiện hiện thực vào trong tư duy. Người ta có thể hiểu biết về một đối tượng nào đó không có ở trước mặt khi nhắc đến tên gọi của nó. Tên gọi đó được biểu thị thông qua đơn vị từ. Như vậy, giữa từ và các đối tượng của hiện thực có một mối liên hệ với nhau. Tất cả những gì được thể hiện qua mối liên hệ ấy chính là nội dung của từ, cũng tức là ý nghĩa của từ. “Ý nghĩa là cái quyết định, là lí do tồn tại của ngôn ngữ. Không một đối tượng nào của ngôn ngữ học mà không liên hệ với ý nghĩa.” [3]

Cách thức tư duy ở mỗi cộng ...

Chi tiết
 
TIẾNG VIỆT CÓ PHẢI LÀ MỘT NGÔN NGỮ KHÓ KHÔNG?

 

1. LỜI ĐỒN ĐẠI HAY LÀ SỰ THẬT?

 

1.1. Học tiếng Việt có khó không?

Anh

Jack Halpern

Học tiếng Việt có khó không? Đa số mọi người cho rằng tiếng Việt là “một ngôn ngữ rất khó.” Nhiều người Việt tin rằng người nước ngoài gần như không thể nào sử dụng ngôn ngữ này một cách thành thạo được. Dùng Google để tìm kiếm những cụm từ như tiếng Việt khó sẽ đưa ra hàng chục nghìn kết quả. Theo lời của George Milo:

Việc thứ tiếng chính thức của Việt Nam được cho là một ngôn ngữ “khó” chính là một điểm đáng tự hào đối với 90 triệu người dân đất nước này, và cứ có cơ hội là những người bản xứ sẽ không ngần ngại gì mà nói với bạn rằng “tiếng Việt khó!”.

Trong tiếng Việt có một câu thành ngữ: Phong ba bão táp không bằng ngữ pháp Việt Nam.

 

1.2. Vạch trần sự thật

Trong bài viết ...

Chi tiết