Xử lí ngôn ngữ

XÂY DỰNG MÔ HÌNH NGỮ NGHĨA ÁP DỤNG CHO VIỆC BIÊN SOẠN TỪ ĐIỂN GIẢI THÍCH
     

VŨ XUÂN LƯƠNG – Vietlex

1. ĐẶT VẤN ĐỀ

Quá trình con người nhận biết, hiểu biết về thế giới khách quan hầu như không có sự khác biệt giữa các dân tộc trên thế giới. Có chăng đó là sự khác biệt về cách thức tư duy, tức là cách thức sử dụng các đơn vị ngôn ngữ để phản ánh và tái hiện hiện thực vào trong tư duy. Người ta có thể hiểu biết về một đối tượng nào đó không có ở trước mặt khi nhắc đến tên gọi của nó. Tên gọi đó được biểu thị thông qua đơn vị từ. Như vậy, giữa từ và các đối tượng của hiện thực có một mối liên hệ với nhau. Tất cả những gì được thể hiện qua mối liên hệ ấy chính là nội dung của từ, cũng tức là ý nghĩa của từ. “Ý nghĩa là cái quyết định, là lí do tồn tại của ngôn ngữ. Không một đối tượng nào của ngôn ngữ học mà không liên hệ với ý nghĩa.” [3]

Cách thức tư duy ở mỗi cộng đồng người cũng khác nhau do có cách nhìn khác nhau về cùng một sự vật, hiện tượng. Chẳng hạn, để gọi tên “loài cá dữ ăn thịt (ăn cá con, côn trùng...) ở nước ngọt, thân tròn dài, có nhiều đốm đen, đầu nhọn” thì chúng ta có thể nhìn vào hình dáng của nó để đặt tên là “cá quả” (giống hình các loại quả có thân tròn dài), “cá chuối” (giống hình quả chuối); hoặc có thể nhìn vào động tác di chuyển “len lách ngược dòng nước để vượt lên” của nó để đặt tên là “cá lóc”. Tên gọi “cá quả” phổ biến ở miền Bắc, tên gọi “cá chuối” phổ biến ở miền Trung, và tên gọi “cá lóc” phổ biến ở miền Nam.

Có thể thấy rằng: “Vấn đề nghĩa là một trong những vấn đề nan giải nhất của ngôn ngữ học, bởi vì nghĩa thuộc vào số những hiện tượng mà ta không thể quan sát hoặc đo đạc trực tiếp được.” [12]. Công việc của người biên soạn từ điển là phải hiện thực hoá vấn đề nan giải đó bằng những thông tin hiện hữu trong từ điển.

Tác giả trình bày Báo cáo tại Hội thảo khoa học
HƯỚNG TỚI XÂY DỰNG MẠNG TỪ TIẾNG VIỆT

 

2. MỘT SỐ KHÁI NIỆM CƠ BẢN

Những thông tin của mục từ trong từ điển thường được trình bày một cách có hệ thống. Trong từ điển giải thích ngôn ngữ, phần giải thích ý nghĩa (định nghĩa) của từ luôn đóng vai trò hạt nhân. Một từ điển giải thích ngôn ngữ nhất thiết không thể thiếu phần giải thích ý nghĩa. Vậy, những yếu tố nào sẽ thuộc nội dung của lời giải thích đó? Các phần tiếp theo sẽ phần nào trả lời cho câu hỏi này.

2.1. Nét nghĩa (semantic feature):

Trong nghiên cứu ngữ nghĩa học, người ta thường áp dụng phương pháp phân tích thành tố để miêu tả ngữ nghĩa của từ vựng. Đây là kĩ thuật miêu tả những quan hệ về nghĩa bằng cách phân nghĩa ý niệm (ideational meaning) ra thành các thành tố nhỏ nhất, gọi là nét nghĩa.

Thí dụ, từ mẹcha có thể phân tích ra các thành tố ngữ nghĩa sau [theo Hoàng Phê, 4]:

- mẹ: “phụ nữ” – “đã có con” – “trong mối quan hệ với con”.

- cha: “đàn ông” – “đã có con” – “ trong mối quan hệ với con”.

Chúng ta thấy, các thành tố nghĩa “đã có con”, “trong mối quan hệ với con” là những nét nghĩa chung cho cả mẹcha. Còn thành tố nghĩa “phụ nữ” là nét nghĩa riêng cho từ mẹ, thành tố nghĩa “đàn ông” là nét nghĩa riêng cho từ cha.

Việc phân tích nghĩa từ ra thành các nét nghĩa đòi hỏi phải tuân theo nguyên tắc, chứ không thể tuỳ tiện. Giữa các nét nghĩa có một quan hệ logic nhất định, “nét nghĩa đứng trước là tiền đề cho nét nghĩa đứng sau (...); nét nghĩa đứng sau thuyết minh cho nét nghĩa đứng trước, “phụ nghĩa” cho nét nghĩa đứng trước.” [4]

2.2. Trường từ vựng - ngữ nghĩa

Từ và ý nghĩa của từ không tồn tại tách rời nhau mà liên kết với nhau trong ý nghĩ của chúng ta, chúng luôn có xu hướng tạo thành những nhóm nhất định tồn tại độc lập với ý thức của chúng ta.

Một tập hợp các đơn vị từ vựng nào đó có quan hệ với nhau nhờ sự đồng nhất của một nét nghĩa sẽ tạo nên một trường từ vựng (lexical field). Chẳng hạn, nét nghĩa “có màu như màu của son” quy tụ các từ đỏ, đỏ au, đỏ hoét, đỏ khè, đỏ lòm, đỏ lừ, đỏ rực, v.v. làm thành một trường từ vựng.

Một phạm vi ý nghĩa nhất định nào đó bao trùm lên một tập hợp từ ngữ, tạo thành một trường nghĩa (semantic field). Chẳng hạn, trường nghĩa “thời gian” quy tụ các từ năm, tháng, tuần, ngày, đêm, giờ, phút, giây ; trường nghĩa “màu sắc” quy tụ các từ đen, đỏ, tím, trắng, vàng, xanh, v.v.

2.3. Đẳng cấu ngữ nghĩa

Phân tích hai từ vợchồng, ta có [theo Hoàng Phê, 4]:

- vợ: “ phụ nữ” – “đã kết hôn” – “trong mối quan hệ với chồng”.

- chồng: “đàn ông” – “đã kết hôn” – “trong mối quan hệ với vợ”.

Chúng ta thấy rằng nghĩa của hai từ này có: a) số lượng nét nghĩa giống nhau, b) trật tự giữa các nét nghĩa giống nhau, c) quan hệ giá trị giữa các nét nghĩa giống nhau - tức là chúng có cùng một kiểu cấu trúc nghĩa. Như vậy, đẳng cấu ngữ nghĩa là hiện tượng một số từ có cùng một kiểu cấu trúc ngữ nghĩa. Các từ có quan hệ đẳng cấu ngữ nghĩa bao giờ cũng nằm trong cùng một trường từ vựng - ngữ nghĩa.

Hiện tượng đẳng cấu ngữ nghĩa cho phép tập hợp vào cùng một nhóm những từ tưởng là chẳng có liên quan gì đến nhau. Chẳng hạn cứng (có khả năng không biến dạng – dưới tác động của lực cơ học) và gan, bạo (có khả năng không mất tinh thần – trước đe doạ của nguy hiểm), ba từ này có cùng một cấu trúc nghĩa khái quát là “có khả năng không biến đổi thuộc tính x ” – “khi chịu tác động y ”.

Tương tự, ba từ mềm (có khả năng biến dạng – dưới tác dụng của lực cơ học) và nhụt, chờn (có khả năng bị mất tinh thần – trước đe doạ của nguy hiểm) có cùng một cấu trúc nghĩa khái quát là “có khả năng biến đổi thuộc tính x ” – “khi chịu tác động y ”.

Khi so sánh các từ thuộc hai cấu trúc nghĩa ở trên, chúng ta có các nhóm từ đồng nghĩa ganbạonhụtchờn. Đem đối lập hai cấu trúc nghĩa này với nhau, chúng ta lại được các nhóm từ trái nghĩa: cứngmềmgan, bạonhụt, chờn.

2.4. Từ loại ngữ nghĩa

Hiện tượng đẳng cấu ngữ nghĩa của các từ mở ra một hướng phân loại từ mới, đó là phân loại từ theo cấu trúc nghĩa. Theo Hoàng Phê, “Khác với từ loại cú pháp, phù hợp với cái gọi là cấu trúc bề mặt, từ loại ngữ nghĩa, phân theo cấu trúc nghĩa, phù hợp với cái gọi là cấu trúc sâu. Vì vậy từ loại ngữ nghĩa có tính phổ quát: các ngôn ngữ có thể có một hệ thống từ loại ngữ nghĩa căn bản giống nhau.” [4].

Nói một cách đơn giản hơn, từ loại ngữ nghĩa được chia thành hai loại lớn, một loại biểu thị thực thể - gọi là thể từ, và một loại biểu thị thuộc tính của thực thể hoặc thuộc tính của thuộc tính - gọi là thuộc từ (mang ý nghĩa trừu tượng). Đại từ và phần lớn danh từ là thể từ, nhưng cũng có nhiều danh từ là thuộc từ (danh từ chỉ tình cảm, màu sắc, hình dáng, v.v.). Còn động từ, tính từ, phụ từ, v.v. đều là thuộc từ. Từng loại trong hai loại lớn đó lại phân chia ra thành các loại nhỏ, và mỗi loại nhỏ lại được phân chia tiếp thành các loại nhỏ hơn.

Cũng theo Hoàng Phê, cấu trúc nghĩa của thể từ thường được phân tích thành hai thành tố S và v, lấy từ “bàn” làm thí dụ:

bàn = đồ dùng (S) – có mặt phẳng, để bày đồ đạc lên trên (v)

S bao quát được “bàn” trong đó, còn v thường gồm những yếu tố không hoàn toàn xác định nên rất phức tạp. S có thể được hiểu là nét nghĩa chung cho hàng loạt đồ dùng khác trong đó có “bàn”. Còn v là những đặc trưng riêng của “bàn”, nhờ đó có thể phân biệt được “bàn” với những đồ dùng khác được bao quát trong S.

Cấu trúc nghĩa của thể từ ở mức khái quát thường tương đối đơn giản. Có thể biểu diễn thành: W = S + v. Trong khi đó, cấu trúc nghĩa của thuộc từ thì phức tạp hơn nhiều, rất khó phân tích thuộc từ nếu xem xét nó một cách cô lập.

2.5. Phương pháp dùng từ bao trong định nghĩa

Khi một từ được định nghĩa theo cấu trúc nghĩa W = S + v, trong đó S là một từ có cùng phạm trù với W nhưng rộng hơn W, tức là S có khái niệm bao hàm khái niệm của W, thì đó là một định nghĩa bằng phương pháp dùng từ bao. Như vậy S chính là từ bao. Có thể khái quát hoá mô hình định nghĩa bằng phương pháp dùng từ bao là A (là) B ʌ n1, n2..., trong đó A là mục từ được định nghĩa, B là từ bao, n1, n2,... là những đặc trưng khu biệt riêng của A, phân biệt A với những lớp từ khác cùng được bao hàm trong B [theo Hoàng Thị Tuyền Linh, 5].

Chúng ta hãy so sánh định nghĩa của từ “hình chữ nhật” trong hai từ điển khác nhau để có được hình dung cụ thể hơn.

Thí dụ 1: hình chữ nhật: “Tứ giác có bốn góc vuông (thường được hiểu là bốn cạnh không bằng nhau, không phải là hình vuông)” [1] có từ bao là “tứ giác”, yếu tố “có bốn góc vuông” là đặc trưng khu biệt của hình chữ nhật, phân biệt hình chữ nhật với các loại hình tứ giác khác như hình thang, hình bình hành, hình thoi, phần chú thích trong ngoặc đơn là để phân biệt với hình vuông, cũng là “tứ giác có bốn góc vuông”. [theo Hoàng Thị Tuyền Linh, 5].

Thí dụ 2: hình chữ nhật: “hình bình hành có một góc vuông [do đó bốn góc là góc vuông]” [2] có từ bao là “hình bình hành”, yếu tố “có một góc vuông” là đặc trưng khu biệt của hình chữ nhật, phân biệt hình chữ nhật với hình bình hành, hình thoi, phần chú thích trong ngoặc là để làm rõ thêm.

Như vậy, từ bao “tứ giác” ở thí dụ 1 có nội hàm rộng hơn từ bao “hình bình hành” ở thí dụ 2. Mặt khác, theo quy ước về tri thức từ điển học, thì các phần đưa ra trong ngoặc của định nghĩa thường chỉ đóng vai trò giải thích thêm. Phần giải thích thêm này không đóng vai trò chính trong cấu trúc nghĩa, vì vậy ta có thể bỏ nó đi mà không ảnh hưởng đến nội dung định nghĩa. Sau khi lược bỏ phần chú thích thêm trong ngoặc ta được kết quả như sau:

Thí dụ 1: hình chữ nhật: “Tứ giác có bốn góc vuông”.

Thí dụ 2: hình chữ nhật: “hình bình hành có một góc vuông”.

Dễ nhận thấy, theo logic thông thường, nội dung ở thí dụ 1 không chỉ thoả mãn riêng cho “hình chữ nhật”, mà còn thoả mãn cả cho “hình vuông”. Nếu từ bao có nội hàm rộng hơn, đòi hỏi phải đưa nhiều nét nghĩa đặc trưng hơn thì mới có khả năng khu biệt.

Các sự vật, hiện tượng của thế giới khách quan thường được phân chia thành những hệ thống khác nhau. Một trong những nguyên lí quan trọng của hệ thống là nguyên lí cấp bậc: mỗi hệ thống có thể có nhiều hệ thống con, đồng thời, chính nó lại là một bộ phận của hệ thống lớn hơn. Các từ trong trường từ vựng - ngữ nghĩa có thể liên quan với nhau bởi mối quan hệ ngữ nghĩa, chẳng hạn:

- Quan hệ chỉ ra một từ mà ý nghĩa của nó bao hà mý nghĩa của một hoặc nhiều từ khác cùng loại (quan hệ giữa cái tổng quát và cái cụ thể), gọi là hypernym (quan hệ thượng danh); thí dụ: musical instrument (nhạc cụ) là hypernym của piano (đàn pianô).

- Quan hệ chỉ ra một từ mà từ đó thể hiện một ý nghĩa cụ thể hơn so với từ liên quan khác (quan hệ giữa cái cụ thể và cái tổng quát), gọi là hyponym (quan hệ hạ danh); thí dụ: father (cha) là hyponym của parent (cha mẹ).

- Quan hệ chỉ ra một từ mà nó là tên gọi tổng thể của một từ là tên gọi bộ phận của nó (quan hệ giữa chỉnh thể và bộ phận), gọi là holonym (quan hệ tổng danh); thí dụ: hat (mũ) là một holonym của brim (vành) và crown (đỉnh).

- Quan hệ chỉ ra một từ mà nó là tên gọi bộ phận của một vật lớn hơn (quan hệ giữa bộ phận và chỉnh thể), gọi là meronym (quan hệ phân danh); thí dụ: brim (vành) và crown (đỉnh) là những meronym của hat (mũ).

- Quan hệ chỉ ra một từ mà từ đó là kết quả trực tiếp sinh ra từ một việc khác, gọi là entailment (quan hệ kéo theo); thí dụ: snore (ngáy) là hành động kéo theo của sleep (ngủ), v.v...

Như vậy, để định nghĩa một từ biểu thị một sự vật, hiện tượng, ta có thể lựa chọn một trong số nhiều từ bao biểu thị những sự vật, hiện tượng thuộc các hệ thống ở cấp bậc cao hơn. Tìm từ bao thế nào cho phù hợp, là vấn đề đầu tiên phải giải quyết khi định nghĩa bằng phương pháp này.

2.6. Cây ngữ nghĩa

Cây ngữ nghĩa là một thuật ngữ có ý nghĩa khác nhau trong các ngành khoa học, đặc biệt là khoa học máy tính. Cây ngữ nghĩa trong bài báo này được hiểu là sự phân loại các thực thể trong một ontology (bản thể luận – học thuyết về bản chất của sự tồn tại) theo hướng mở rộng. Hầu như tất cả các đối tượng, địa điểm, khái niệm, sự kiện, thuộc tính và các mối quan hệ đều có thể được phân loại thành một hệ thống phân cấp có tôn ti trật tự.

Việc phân loại các từ theo một hệ thống có tôn ti trật tự là một công việc vừa đòi hỏi tính khoa học cao, vừa phải có tính thực hành. Bất cứ một sự phân loại nào nếu không áp dụng được vào thực tế biên soạn từ điển thì đều không có ý nghĩa.

Thông thường, các sự vật, hiện tượng, trạng thái, quá trình được chia ra thành hai loại lớn, loại vật thể (concrete thing) và loại trừu tượng (abstraction). Từ loại vật thể lại được chia ra thành vật hữu sinhvật vô sinh. Tiếp tục phân chia mỗi loại thành những loại nhỏ hơn, cứ như thế cho đến khi nhận thấy không cần thiết phải phân chia nữa. Kết quả của quá trình phân chia này đã tạo nên một mối quan hệ tôn ti theo dạng hình cây như sau:

Điểm bắt đầu cho một cấp độ trong cây ngữ nghĩa được gọi là nút/nốt (node). Nút vừa là điểm để cho các “cành nhỏ mọc ra”, vừa là điểm cuối cùng cho các “lá” hội tụ. Cái nút cuối cùng mà các “lá” hội tụ chính là cấp độ được xác định để lựa chọn từ bao.

 

3. XÂY DỰNG MÔ HÌNH NGỮ NGHĨA

Sự phát hiện ra các nét nghĩa trong một cấu trúc ngữ nghĩa, cùng với năng lực phân loại từ ra thành hai loại từ loại ngữ nghĩa thể từthuộc từ, đã giúp cho việc phân tích nghĩa của từ được hiệu quả hơn. Tuy nhiên, nếu chỉ áp dụng để phân tích các từ một cách cô lập thì sẽ không có khả năng bao quát rộng hơn, và cũng không có năng lực giải thích lớn hơn đối với hệ thống từ vựng. Việc hệ thống hoá các thành tựu đạt được về phân tích ngữ nghĩa luôn là một thách thức đối với những người biên soạn từ điển. Chỉ khi phân loại các từ thuộc vào một cấu trúc nghĩa nào đó thì việc giải thích nghĩa của từ mới được toàn diện. Từ đó có thể rút ra những mô hình ngữ nghĩa khái quát, giúp cho việc định nghĩa từ trong từ điển nhất quán một cách có hệ thống.

Phần lớn các từ đều có cấu trúc nghĩa W = S + v, trong đó S là từ bao, v là các giá trị đặc trưng của W. Dựa vào sự phân loại trong cây ngữ nghĩa, chúng tôi đề xuất mô hình mang tính tổng quát sau: W = H + V(v1 + v2 + ... +vn). Trong đó W (word) là từ cần được giải thích và cũng là “lá”, H (hypernym) là từ bao, V (value) là giá trị đặc trưng của W, và v1, v2, vn là những đặc trưng cụ thể của V. Từ bao (H) được chọn là nútcuối cùng mà các “lá” (W) hội tụ. Chẳng hạn, “đồ dùng” là nút cuối cùng trong dãy cấp độ:

(0) W (bàn, ghế...) > (1) đồ dùng > (2) vật dụng > (3) vật vô sinh > (4) vật thể.

Cùng cấp với (1) còn có “công cụ”, “thiết bị”, “máy móc”, v.v. Chúng tôi cho rằng, có thể xác định được mô hình ngữ nghĩa khái quát ở mỗi nút cuối cùng.

3.1. Mô hình ngữ nghĩa của những từ có quan hệ hạ danh

Quan hệ hạ danh chỉ ra một từ mà từ đó thể hiện một ý nghĩa cụ thể hơn so với từ liên quan ở cấp độ trên nó. Từ mô hình tổng quát W = H + V(v1 + v2 + ... +vn), khi áp dụng vào từng từ cụ thể sẽ được chi tiết hoá sao cho có hiệu lực trong việc định nghĩa. Nếu xác định W thuộc cấp (1) trong dãy cấp độ nêu ở trên thì ta có mô hình chi tiết sau:

W = H + V[St + Ap]  (St = structure, Ap = aplication)

Cụ thể trong trường hợp này như sau:

W (bàn) = H (đồ dùng) + V[St (có cấu tạo) + Ap (dùng để làm gì)]

W (giường) = H (đồ dùng) + V[St (có cấu tạo) + Ap (dùng để làm gì)]

W (cày) = H (công cụ) + V[St (có cấu tạo) + Ap (dùng để làm gì)]

W (cuốc) = H (công cụ) + V[St (có cấu tạo) + Ap (dùng để làm gì)]

Nhiệm vụ của người biên soạn từ điển là lấp đầy thông tin cho St, Ap. Khi thông tin được điền vào mô hình thì sẽ có dạng như sau:

bàn = H (đồ dùng) + St (làm bằng gỗ, có mặt phẳng và chân đỡ) + Ap (dùng để bày đồ đạc hay để làm việc, làm nơi ăn uống, v.v.)

giường = H (đồ dùng) + St (làm bằng gỗ, ở trên trải chiếu hoặc đệm ) + Ap (dùng để nằm ngủ)

cày = H (công cụ) + St (có lưỡi bằng sắt hoặc gang) + Ap (dùng để lật, xới hoặc làm vỡ lớp đất trồng trọt)

cuốc = H (công cụ) + St (gồm một lưỡi sắt tra vuông góc vào cán dài) + Ap (dùng để bổ, xới đất)

Hệ quả: Nếu H mà thuộc W thì H là hypernym của W, và do đó W là hyponym của H. Tức là “đồ dùng” là hypernym của “bàn” và “giường”, còn “bàn” và “giường” là hyponym của “đồ dùng”; “công cụ” là hypernym của “cày” và “cuốc”, còn “cày” và “cuốc” là hyponym của “công cụ”.

3.2. Mô hình ngữ nghĩa của những từ có quan hệ phân danh

Quan hệ phân danh chỉ ra một từ mà nó là tên gọi bộ phận của một vật lớn hơn. Do tính đặc thù là quan hệ giữa bộ phận và chỉnhthể nên thành tố H ở loại này luôn mang giá trị là “bộ phận”. Ta có mô hình tổng quát sau:

W = H + V[Lo + Of + Ap] → Lo = location

Cụ thể trong trường hợp này sẽ như sau:

W (tay) = H (bộ phận) + V[Lo (ở đâu) + Of (của cái gì) + Ap (dùng để làm gì)]

W (chân) = H (bộ phận) + V[Lo (ở đâu) + Of (của cái gì) + Ap (dùng để làm gì)]

W (móng) = H (bộ phận) + V[Lo (ở đâu) + Of (của cái gì) + Ap (dùng để làm gì)]

Sau khi lấp đầy thông tin cho Lo, Of, Ap thì sẽ có dạng như sau:

tay = H (bộ phận) + Lo (từ vai đến các ngón) + Of (của cơ thể người) + Ap (dùng để cầm, nắm)

chân = 1. H (bộ phận) + Lo (ở dưới cùng) + Of (của cơ thể người) + Ap (dùng để đi, đứng, chạy, nhảy, v.v.)

chân = 2. H (bộ phận) + Lo (ở dưới cùng) + Of (của cơ thể động vật) + Ap (dùng để đi, đứng, chạy, nhảy, v.v.)

chân = 3. H (bộ phận) + Lo (ở dưới cùng) + Of (của đồ vật) + Ap (để tiếp giáp và bám chặt vào mặt nền)

vuốt = H (bộ phận) + Lo (ở đầu ngón chân) + Of (của cơ thể động vật) + Ap (để ôm giữ chặt con mồi)

vành = H (bộ phận) + Lo (ở ngoài cùng) + Of (của đồ vật) + Ap (để cho cứng, cho chắc)

Hệ quả: Do H mang giá trị là “bộ phận” của cái gì, nên giá trị chân thực của H ở trường hợp này sẽ là H = H + Of. Suy ra, H + Of là holonym của W, và W là meronym của H + Of. Tức là “bộ phận cơ thể người” là holonym của “tay” và “chân” (nghĩa 1), còn “tay” và “chân” (nghĩa 1) là meronym của “bộ phận của cơ thể người”; “bộ phận của cơ thể động vật” là holonym của “chân” (nghĩa 2) và “vuốt”, còn “chân” (nghĩa 2) và “vuốt” là meronym của “bộ phận cơ thể động vật”; “bộ phận của đồ vật” là holonym của “chân” (nghĩa 3) và “vành”, còn “chân” (nghĩa 3) và “vành” là meronym của “bộ phận của đồ vật”.

Tóm lại, theo hướng triển khai như trên, chúng ta có thể xây dựng được phần lớn các mô hình định nghĩa cho hàng loạt lớp từ. Chẳng hạn, có thể xây dựng mô hình ngữ nghĩa cho lớp từ có quan hệ kéo theo (ngáy khi ngủ ; đau, nhức khi có nhọt sưng tấy), lớp từ có quan hệ nhân quả (nước mắt khi khóc, cháy sinh nhiệt, mưa tạo ra nước), v.v.

 

4. KẾT LUẬN

Cùng với sự phát hiện ra nét nghĩa và hiện tượng đẳng cấu ngữ nghĩa trong cấu trúc nghĩa từ, phương pháp phân tích thành tố có ý nghĩa đặc biệt quan trọng khi xem xét tính hệ thống của từ vựng - ngữ nghĩa. Trong từ điển giải thích, thông tin ngữ nghĩa là thông tin chủ yếu và quan trọng nhất. Đi sâu nghiên cứu, làm sáng tỏ những đặc trưng ngữ nghĩa và phương thức thể hiện của những thành phần đặc trưng này là nội dung cơ bản của bài báo.

Phương pháp giải thích nghĩa của từ thông qua các mô hình ngữ nghĩa được thiết lập sẵn là một hướng đi mới trong từ điển học. Chỉ khi áp dụng các mô hình ngữ nghĩa trong việc định nghĩa từ thì mới có khả năng miêu tả được một cách hệ thống toàn bộ từ vựng của một ngôn ngữ. Nghĩa từ vựng được phân tích thành một cấu trúc bao gồm những nét nghĩa có quan hệ cấp bậc với nhau. Và do đó, các từ ngữ có cùng cấu trúc ngữ nghĩa sẽ được định nghĩa nhất quán theo cùng một kiểu. Chỉ có thể có được một cuốn từ điển tốt khi nó được biên soạn dựa trên cơ sở lí thuyết ngôn ngữ học toàn diện và hiện đại.

TÀI LIỆU THAM KHẢO

[1] Christiane Fellbaum (1998). WordNet: An Electronic Lexical Database. The MIT Press. Cambridge, Massachusetts London, England.

[2] Đinh Điền, Hồ Hải Thuỵ (2011). Ngôn ngữ học máy tính và việc xây dựng từ điển. Tạp chí Từ điển học & Bách khoa thư, số 4 (12).

[3] Đỗ Hữu Châu (1981). Từ vựng - ngữ nghĩa tiếng Việt. NXB Giáo dục.

[4] Hoàng Phê (2003). Logic - ngôn ngữ học. NXB Đà Nẵng – Trung tâm Từ điển học.

[5] Hoàng Thị Tuyền Linh (2002). Một số vấn đề về thông tin ngữ nghĩa trong từ điển giải thích tiếng Việt. Luận án tiến sĩ ngữ văn.

[6] Nguyễn Ngọc Trâm (chủ biên) (1997). Một số vấn đề từ điển học. NXB Khoa học Xã hội.

[7] Nguyễn Như Ý (chủ biên) (1996). Từ điển giải thích thuật ngữ ngôn ngữ học. NXB Giáo dục.

[8] Nguyễn Thiện Giáp (1985). Từ vựng học tiếng Việt. NXB ĐH và THCH.

[9] Princeton University (2003). WordNet 2.0. Babylon.

[10] Vietlex (2013). Từ điển tiếng Việt. NXB Đà Nẵng – Trung tâm Từ điển học.

[11] Vũ Xuân Lương (2012). Xác định dãy từ đồng nghĩa khi xây dựng Wordnet tiếng Việt. Tạp chí Từ điển học & Bách khoa thư, số 3 (17).

[12] Xôn-xép V. M. (1980). Một số vấn đề về lí thuyết nghĩa (hay ngữ nghĩa). Ngôn ngữ, (2).[1] Từ điển tiếng Việt (Viện ngôn ngữ học, Hoàng Phê chủ biên), Nxb Đà Nẵng - Trung tâm Từ điển học, Hà Nội - Đà Nẵng, 1998.

[2] Từ điển tiếng Việt (Vietlex), Nxb Đà Nẵng - Trung tâm Từ điển học, Hà Nội - Đà Nẵng, 2013.

 

 

Bài đăng trước:

  • Hướng tới việc xây dựng MẠNG TỪ tiếng Việt
  • Xây dựng kho ngữ liệu áp dụng cho phân tích, xử lí ngôn ngữ và biên soạn từ điển
  • Ứng dụng phương pháp Pointwise vào bài toán tách từ cho tiếng Việt
  • Xác định dãy từ đồng nghĩa khi xây dựng Wordnet tiếng Việt
  • Xác định ĐƠN VỊ TỪ VỰNG MỚI xuất hiện trong văn bản tiếng Việt