Trang nhất

NHẬN DẠNG THỰC THỂ ĐỊNH DANH TRONG VĂN BẢN TIẾNG VIỆT

(Bài báo cập nhật trên cơ sở bài gửi tham gia Hội thảo khoa học Giữ gìn sự trong sáng của tiếng Việt trên các phương tiện thông tin đại chúng. 5-11-2016)


 

1. Giới thiệu

Nhận dạng thực thể định danh (Named Entity Recognition – NER), còn gọi là nhận dạng thực thể có tên, là nhiệm vụ nhận biết các từ xuất hiện trong văn bản là tên gọi của một đối tượng nào đó, như tên người (nhân danh), tên đất (địa danh, địa điểm), tên tổ chức, tên tác phẩm, tên sự kiện, thời gian, tiền tệ, v.v. NER đóng vai trò quan trọng trong các ứng dụng tự động trích xuất thông tin, khai phá dữ liệu, dịch máy, v.v.

NER đã được quan tâm nghiên cứu trên thế giới từ đầu những năm 1990. Hiện nay các hệ thống NER cho tiếng Anh, tiếng Đức, tiếng Hà Lan, v.v. đã được xây dựng và được đánh giá cao. Điểm chung của các hệ thống NER này là tập trung đi vào nhận dạng 3 ...

Chi tiết
 
XÂY DỰNG MÔ HÌNH NGỮ NGHĨA ÁP DỤNG CHO VIỆC BIÊN SOẠN TỪ ĐIỂN GIẢI THÍCH

1. ĐẶT VẤN ĐỀ

Quá trình con người nhận biết, hiểu biết về thế giới khách quan hầu như không có sự khác biệt giữa các dân tộc trên thế giới. Có chăng đó là sự khác biệt về cách thức tư duy, tức là cách thức sử dụng các đơn vị ngôn ngữ để phản ánh và tái hiện hiện thực vào trong tư duy. Người ta có thể hiểu biết về một đối tượng nào đó không có ở trước mặt khi nhắc đến tên gọi của nó. Tên gọi đó được biểu thị thông qua đơn vị từ. Như vậy, giữa từ và các đối tượng của hiện thực có một mối liên hệ với nhau. Tất cả những gì được thể hiện qua mối liên hệ ấy chính là nội dung của từ, cũng tức là ý nghĩa của từ. “Ý nghĩa là cái quyết định, là lí do tồn tại của ngôn ngữ. Không một đối tượng nào của ngôn ngữ học mà không liên hệ với ý nghĩa.” [3]

Cách thức tư duy ở mỗi cộng ...

Chi tiết
 
TIẾNG VIỆT CÓ PHẢI LÀ MỘT NGÔN NGỮ KHÓ KHÔNG?

 

1. LỜI ĐỒN ĐẠI HAY LÀ SỰ THẬT?

 

1.1. Học tiếng Việt có khó không?

Anh

Jack Halpern

Học tiếng Việt có khó không? Đa số mọi người cho rằng tiếng Việt là “một ngôn ngữ rất khó.” Nhiều người Việt tin rằng người nước ngoài gần như không thể nào sử dụng ngôn ngữ này một cách thành thạo được. Dùng Google để tìm kiếm những cụm từ như tiếng Việt khó sẽ đưa ra hàng chục nghìn kết quả. Theo lời của George Milo:

Việc thứ tiếng chính thức của Việt Nam được cho là một ngôn ngữ “khó” chính là một điểm đáng tự hào đối với 90 triệu người dân đất nước này, và cứ có cơ hội là những người bản xứ sẽ không ngần ngại gì mà nói với bạn rằng “tiếng Việt khó!”.

Trong tiếng Việt có một câu thành ngữ: Phong ba bão táp không bằng ngữ pháp Việt Nam.

 

1.2. Vạch trần sự thật

Trong bài viết ...

Chi tiết
 
Việc định nghĩa các hư từ trong TỪ ĐIỂN GIẢI THÍCH dành cho học sinh tiểu học

ABSTRACT
In some dictionaries, functional don not receive any concerns so they are not taken into some explanatory dictionaries sufficiently. Of the functional words collected and explained, their parts of speech are not sufficiently and correctly showed. This may cause a provision of wrong and deficient knowledge. Therefore, the paper helps to overcome that when the same kind of dictionary is compiled.

1. Một số vấn đề chung

1.1. Về định nghĩa trong từ điển giải thích

Trong Dictionary of lexicography, mục từ Definition được giải thích như sau: “Bộ phận trong cấu trúc vi mô của một công trình tra cứu, các công trình này có đưa ra việc giải thích nghĩa của từ, ngữ hay thuật ngữ. Định nghĩa cung cấp một chức năng chủ yếu: nó là nơi mà người biên soạn ấn định và người dùng tìm kiếm các thông tin ngữ nghĩa. Từ điển phổ thông đơn ngữ cung cấp các định nghĩa trong một vị trí nổi bật ngay đầu các mục từ (do đó, nó còn ...

Chi tiết
 
CÂU CHUYỆN KHÔNG NHỎ VỀ HAI CON CHỮ I, Y TRONG CHÍNH TẢ TIẾNG VIỆT

ABSTRACT
The paper presents some ideas of the book “I và Y trong chính tả tiếng Việt” (I and Y in Vietnamese Orthography) by Cao Tự Thanh. For the paper writer, in this work, Cao Tự Thanh did not only discussed an orthographical issue of morphemes [i] graphically shown with [I] and [Y] (in Vietnamese) but also went into details of Sino phonology, a contact of Sino and Vietnamese languages and some other discussions in the development of Vietnamese.

 

Anh

GS. Vũ Đức Nghiệu

Đó là những điều có thể thấy được trong cuốn sách I và Y trong chính tả tiếng Việt của Cao Tự Thanh, một nhà nghiên cứu chuyên nghiệp rất quen thuộc trong giới Hán Nôm hiện nay, do NXB Văn hoá Văn nghệ TP Hồ Chí Minh ấn hành vào quý 3 năm 2014.

Cầm trên tay, đọc tên sách, chúng tôi tưởng cuốn sách chỉ bàn thảo ...

Chi tiết