Các cách tiếp cận liên ngành với ngôn ngữ học đến quan hệ bao thuộc

PHẠM VĂN LAM*
TS; Viện Ngôn ngữ học; Email: phamvanlam1999@gmail.com

TÓM TẮT: Quan hệ bao thuộc là quan hệ ngữ nghĩa có tính hệ hình quan trọng nhất trong cấu trúc từ vựng của ngôn ngữ. Quan hệ bao thuộc vừa là biện pháp tổ chức của từ vựng, văn bản/ diễn ngôn, vừa là biện pháp tổ chức của tư duy, tâm lí, văn hoá. Vì thế mà quan hệ này là một trong những quan hệ nghĩa có lịch sử nghiên cứu lâu đời nhất, và cũng là quan hệ được nhiều ngành khoa học quan tâm nghiên cứu, được ứng dụng vào trong nhiều hoạt động thực tiễn. Có nhiều cách tiếp cận quan hệ này. Có thể chia các cách tiếp cận quan hệ này thành ba hướng: hướng tiếp cận ngoài ngôn ngữ học, hướng tiếp cận liên ngành với ngôn ngữ học, hướng tiếp cận ngôn ngữ học. Trong khuôn khổ của một bài báo, bài viết này đặt ra nhiệm vụ tìm hiểu lược sử nghiên cứu của quan hệ bao thuộc trong các cách tiếp cận liên ngành với ngôn ngữ học. Bài viết tập trung đề cập đến các cách tiếp cận quan hệ bao thuộc của ngôn ngữ học tâm lí, ngôn ngữ học nhân chủng và ngôn ngữ học tính toán. Đây là những hướng tiếp cận có ảnh hưởng nhiều đến việc nghiên cứu quan hệ bao thuộc trong ngôn ngữ học.

TỪ KHOÁ: quan hệ nghĩa; quan hệ bao thuộc; ngôn ngữ học tâm lí; ngôn ngữ học nhân chủng; ngôn ngữ học tính toán.

NHẬN BÀI: 23/8/2022.           BIÊN TẬP-CHỈNH SỬA-DUYỆT ĐĂNG: 6/9/2022
(Bài đăng trên Tạp chí số 9(330)-2022, tr.13-24)
* Bài viết thuộc sản phẩm của đề tài cấp Bộ Nghiên cứu quan hệ nhân quả trong tiếng Việt, số 291/ HĐKH-KHXH

1. Dẫn nhập  

Quan hệ bao thuộc (hyponymy) là quan hệ ngữ nghĩa tồn tại giữa những đơn vị từ vựng như hoa – hoa hồng, bút – bút bi, gà – gà ri, quyền – quyền tác giả (tác quyền), tác gia – Nguyễn Trãi,… Trong các cặp ví dụ đang dẫn này, những từ bên trái được gọi là những từ bao; những từ bên phải được gọi là những từ thuộc. Quan hệ bao thuộc là quan hệ về mặt ngữ nghĩa được xác lập giữa những từ bao và từ thuộc như vậy.

Hiện tượng bao thuộc là một hiện tượng có tính phổ quát, được xác lập trên cơ sở của sự liên hệ có tính cấp bậc, cụ thể là sự liên hệ phân loại và quy loại. Quan hệ bao thuộc vừa là biện pháp tổ chức của từ vựng, văn bản, vừa là biện pháp tổ chức của tư duy, tâm lí, văn hoá. Về mặt ngôn ngữ, quan hệ bao thuộc là loại quan hệ quan trọng nhất trong hệ thống từ vựng của ngôn ngữ nói chung và hệ thống danh từ nói riêng. Về mặt tư duy và tâm lí, quan hệ bao thuộc là quan hệ đi liền, gắn chặt với quá trình nhận thức, quá trình phân cắt và phạm trù hoá thế giới hiện thực; là quan hệ quan trọng nhất ở bậc khái niệm… Hơn nữa, đây là một loại quan hệ có giá trị phổ niệm, luôn hiện diện trong mọi hoạt động gắn với các cách tổ chức tri thức, lưu trữ, xử lí và truy xuất thông tin, nhận thức của con người (quản trị tri thức, phân loại khoa học, thư viện,…). Vì lẽ đó mà quan hệ bao thuộc là một trong những quan hệ có lịch sử nghiên cứu lâu đời (qua các nghiên cứu liên quan và gián tiếp trong khoa học như triết học và logic học), và cũng là quan hệ được nhiều ngành khoa học quan tâm nghiên cứu, được ứng dụng vào trong nhiều hoạt động thực tiễn.

Có thể chia việc tiếp cận nghiên cứu quan hệ bao thuộc ra thành ba hướng: hướng tiếp cận ngoài ngôn ngữ học, hướng tiếp cận liên ngành với ngôn ngữ học, hướng tiếp cận ngôn ngữ học.

Dù là đối tượng nghiên cứu chân chính của ngôn ngữ học, song việc nghiên cứu một cách chính danh và trực tiếp quan hệ bao thuộc ở trong ngôn ngữ học lại được bắt đầu khá muộn (vào sau những năm 1950). Còn các khoa học khác ngoài ngôn ngữ học và liên ngành với ngôn ngữ học lại nghiên cứu quan hệ bao thuộc, dù là gián tiếp, từ rất sớm; và có ảnh hưởng, tác động khá nhiều đến các nghiên cứu về quan hệ bao thuộc của ngôn ngữ học. Chính vì thế, với khuôn khổ của một bài báo, bài viết này đặt ra nhiệm vụ tìm hiểu lược sử nghiên cứu của quan hệ bao thuộc trong các tiếp cận liên ngành với ngôn ngữ học.

Công việc tiếp theo là xác định các tiêu chí ngữ nghĩa và những nét nghĩa phân theo mỗi tiêu chí của hệ thống từ chỉ HĐCRĐT. Dựa vào đặc trưng của hoạt động chuyển dời đối tượng, có thể tìm được có 5 tiêu chí: phương tiện chuyển dời; đối tượng được chuyển dời; vị trí, hướng di chuyển, tốc độ, thời gian và mục đích chuyển dời.

Cách tiếp cận liên ngành với ngôn ngữ học ở đây được giới hạn và được hiểu là cách tiếp cận liên ngành giữa ngôn ngữ học với tâm lí học, giữa ngôn ngữ học với nhân học (còn gọi là nhân chủng học hay nhân loại học), giữa ngôn ngữ học với khoa học máy tính. Đó là cách tiếp cận mà người ta sử dụng phương pháp hay dữ liệu của khoa học này để giải quyết các bài toán của khoa học kia, hoặc người ta phải sử dụng phương pháp hay dữ liệu của cả hai khoa học để giải quyết những bài toán giáp ranh giữa hai khoa học. Chẳng hạn, với ngôn ngữ học nhân chủng hay nhân học ngôn ngữ thì người ta, một mặt, sử dụng các phương pháp, dữ liệu nghiên cứu của ngôn ngữ học để giải quyết các bài toán của nhân học, và mặt khác, sử dụng các phương pháp, dữ liệu của nhân học để giải quyết các bài toán của ngôn ngữ học. Trong trường hợp này, bài toán cần giải quyết nghiên cứu chính là vấn đề mà cả hai ngành khoa học ngôn ngữ học và nhân học cùng quan tâm nghiên cứu. Việc sử dụng phương pháp liên ngành lúc này được xem là tối ưu hay hiệu quả hơn so với phương pháp đơn ngành, có thể bổ sung cho chúng ta những góc nhìn mới, sâu sắc và nhiều chiều kích hơn mà từ góc nhìn đơn ngành chúng ta khó hay không thể nào phát hiện được. Dĩ nhiên, trong cách tiếp cận liên ngành này, nghiêm ngặt mà nói thì chúng ta thấy rằng luôn có một sự phân biệt ngặt nghèo và “tế nhị” giữa các góc nhìn được ưu tiên của ngành khoa học này với ngành khoa học kia. Thí dụ, với ngôn ngữ học nhân chủng thì góc nhìn xuất phát và điểm ưu tiên chính là ngôn ngữ và ngôn ngữ học (Foley, 1997); ngược lại, với nhân học ngôn ngữ thì góc nhìn xuất phát và điểm ưu tiên chính là các vấn đề thuộc về bản thân nhân học (khía cạnh văn hoá sẽ được nhấn mạnh và ưu tiên giải quyết) (Duranti, 1997). 

Ở đây, để đảm bảo tính hệ thống trong cách gọi tên thuật ngữ, và thể hiện sự ưu tiên hay một chút “thiên kiến duy danh” dành cho ngôn ngữ học hay xuất phát điểm của ngôn ngữ học, chúng tôi sử dụng các thuật ngữ ngôn ngữ học tâm lí và ngôn ngữ học nhân chủng, ngôn ngữ học tính toán để chỉ cách tiếp cận liên ngành của ngôn ngữ học với các khoa học tâm lí học, nhân học và khoa học máy tính, một cách lần lượt. Tuy vậy, cũng cần lưu ý rằng cho dù các quan hệ nghĩa là đối tượng nghiên cứu chính danh của ngôn ngữ học, nhưng xét về mặt lịch sử cũng như đóng góp thì ngôn ngữ học, ở một khía cạnh nào đó, lại “chậm chân” và “khiêm tốn” hơn rất nhiều so với tâm lí học, nhân học và khoa học máy tính (và cả logic học) trong việc nghiên cứu các quan hệ nghĩa.

2. Ngôn ngữ học tâm lí

Tâm lí học là một ngành khoa học có liên quan sâu sắc với ngôn ngữ học. Dường như tâm lí và theo đó là tâm lí học là một cái gì đó liên tục “neo bám” vào ngôn ngữ và ngôn ngữ học, chi phối mạnh mẽ ngôn ngữ và ngôn ngữ học. Điều này thể hiện rõ nhất ở trong nghĩa và ngữ nghĩa học. Sự liên tục và mạnh mẽ này thể hiện ở chỗ, chẳng hạn: với ngôn ngữ học tiền cấu trúc, thực thể tâm lí không tách rời thực thể nghĩa; với ngôn ngữ học cấu trúc, vì thực thể nghĩa liên quan đến tâm lí học cho nên dường như người ta đã bỏ quên nghĩa trong các chương trình nghiên cứu ngôn ngữ; với ngôn ngữ học hậu cấu trúc, dưới sự chi phối của khoa học nhận thức, không nghi ngờ gì cả, nghĩa được xem là một thực thể tinh thần “bách khoa”, có mặt trong mọi diễn giải tinh thần về ngôn ngữ. Số phận của các quan hệ nghĩa nói chung và quan hệ bao thuộc nói riêng trong ngữ nghĩa học cũng vậy, gắn bó mật thiết với tâm lí và tâm lí học.

Hướng tiếp cận tâm lí học đến hiện tượng từ ngữ có quan hệ bao thuộc chịu ảnh hưởng sâu sắc của chủ nghĩa cấu trúc trong ngôn ngữ học. Đối với tâm lí học, những quan hệ ngôn ngữ ở bậc đại cương mà F. de Saussure đã đưa ra đều là những quan hệ có được do sự liên tưởng. Chính vì thế mà người ta thường gọi những nghiên cứu tâm lí học ngôn ngữ theo chủ nghĩa cấu trúc là “ngữ nghĩa học liên tưởng ”, là  “những nghiên cứu theo kiểu liên tưởng luận” (Murphy, 2003, tr.75).

Do ảnh hưởng của liên tưởng luận mà nhiều lí thuyết tâm lí học hiện đại sau này đã phát triển nhiều mô hình liên tưởng, suy luận về hệ thống từ vựng của ngôn ngữ, ví dụ như mô hình logic quy nạp (inductive logic model) của Jaspar, Hewstone, Fincham (1983), mô hình tiêu điểm điều kiện bất thường (abnormal conditions focus model) của Hilton, Slugoski (1986), mô hình kết hợp tuyến tính (linear combination model) của Downing, Sternberg, Ross (1985), mô hình tương phản xác suất (probabilistic contrast model) của Cheng, Novick (1992), mô hình hợp (joint model) của Van Overwalle (1997), v.v. Trong các mô hình này, quan hệ bao thuộc luôn là một loại quan hệ được đưa ra xem xét cùng hàng loạt quan hệ khác.

Tâm lí học, đặc biệt là tâm lí học nhận thức, quan tâm nhiều đến các quan hệ ngữ nghĩa, trong đó có quan hệ bao thuộc. Quan hệ bao thuộc trong tâm lí học luôn được xem là loại quan hệ cốt yếu bậc nhất trong tổ chức ngữ nghĩa của hệ thống danh từ nói riêng và của hệ thống từ vựng nói chung. Đầu tiên là những lí thuyết quan tâm đến các mô hình trí nhớ dài hạn, mà cụ thể là mô hình trí nhớ ngữ nghĩa (semantic memory), thứ đến là các lí thuyết liên quan đến cách tiếp cận đánh giá hay đo lường năng lực ngôn ngữ và trí tuệ.

Trí nhớ ngữ nghĩa là một kho lưu trữ tinh thần về tri thức thế giới của con người nói chung và là một trong hai loại trí nhớ dài hạn, đối lập với trí nhớ tình tiết hay trí nhớ tạm thời (episodic memory). A. Tulving (1972) khi tách trí nhớ ngữ nghĩa ra khỏi trí nhớ tình tiết đã cho rằng “trí nhớ ngữ nghĩa là cái cần thiết để sử dụng ngôn ngữ” và là loại “tri thức về khái niệm – từ nói chung” (Tulving 1972, tr.386). Các khái niệm được tổ chức lại với nhau theo các quan hệ ngữ nghĩa. Quan hệ bao thuộc cũng là một loại quan hệ trong trí nhớ ngữ nghĩa, góp phần tạo nên các cấu trúc tri thức của con người về thế giới. Quan hệ bao thuộc, cùng quan hệ tổng phân (meronymy), là hai quan hệ quan trọng nhất trong tổ chức ngữ nghĩa của hệ thống danh từ và là linh hồn của tổ chức ngữ nghĩa của hệ thống từ vựng – ngữ nghĩa của ngôn ngữ nói chung.

Quan điểm về trí nhớ ngữ nghĩa này của Tulving đã được chúng tôi xem là một trong những tiền đề, cơ sở khi xây dựng bộ sách gồm 16 tập Phát triển năng lực tư duy – ngôn ngữ (Phạm Văn Lam, 2015), cụ thể và trực tiếp nhất là ba tập Hoa, hoa hồng, hoa hồng bạch; Cây, cành, lá; Bảng đen, phấn trắng của mình.

Hình 1. Góc trí nhớ ngữ nghĩa của từ hạt giống thực vật qua quan hệ bao thuộc
 (Phạm Văn Lam, 2015)

Các lí thuyết về trí nhớ ngữ nghĩa, về bản chất, có nguồn gốc liên tưởng luận. Những liên tưởng tự do của con người kiểu như mèo – đuôi, mèo – có râu, mèo – động vật, mèo – gia súc, mèo – mèo mướp, mèo – mèo khoang, mèo – mèo mun, mèo – vật nuôi, mèo – thú cưng, mèo – chó, mèo – bắt chuột, mèo – lim dim, mèo – meo meo, mèo – ngoao, mèo – bắt chuột, mèo – chuột, mèo – vồ, mèo – nhảy, mèo – vờn, mèo – ăn vụng, mèo già – cáo, mèo – tiểu hổ,… chính là những liên tưởng góp phần vào việc định hình cấu trúc trí nhớ ngữ nghĩa. Trong các liên tưởng trên, mèo – động vật, mèo – gia súc, mèo – mèo mướp, mèo – mèo khoang, mèo – mèo mun, mèo – vật nuôi, mèo – thú cưng, mèo – chó,…chính là các liên tưởng của quan hệ bao thuộc.

Xét về mặt lịch sử, dưới ảnh hưởng của hành vi luận của tâm lí học, Charles E. Osgood, G. J. Suci, P. H. Tannenbaum (1957), có thể được xem là những người đi đầu trong việc mày mò về việc thực hiện đo lường ngữ nghĩa trong đó có việc xác định quan hệ nghĩa. Tuy nhiên, J. Deese (1962, 1964, 1965) mới lại là người có những thực nghiệm mạnh mẽ chính thức đầu tiên về các liên tưởng tự do để ủng hộ cho các mô hình trí nhớ ngữ nghĩa. Dù rằng những nghiên cứu của Deese ngay lúc đó không gây được sự chú ý do chỗ người ta vẫn còn dị ứng với những giả định hành vi luận của chúng, nhưng về sau đã được người ta quan tâm nhiều hơn (Phạm Văn Lam, 2020). Chính những nghiên cứu liên tưởng tự do này của Deese đã có tác dụng thúc đẩy hàng loạt các nghiên cứu liên tưởng khác, trong đó có các nghiên cứu quan trọng của Ervin (1963), Collins và Quillian (1969, 1970, 1972), Chaffin và Herrmann (1984), Miller (1978), Justeson và Katz (1991),… về các mô hình từ vựng tinh thần từ những năm 1970 trở về sau. Điều thú vị là chính những nghiên cứu này đã tạo ra cảm hứng để G. Miller và các đồng sự tiến hành mô hình hoá vốn từ vựng tinh thần tiếng Anh thành Mạng từ (WordNet), một sản phẩm công nghệ nguồn, lớn và có nhiều ảnh hưởng đến không chỉ các nghiên cứu ứng dụng liên ngành mà cả các nghiên cứu lí thuyết đơn ngành. Các mạng từ như Mạng từ tiếng Anh (1995), Mạng từ Châu Âu (1998), Mạng từ Châu Á (2009), Mạng từ tiếng Việt (2015),…là những mô hình từ vựng tinh thần khổng lồ trong đó có chứa quan hệ bao thuộc.

Lối tiếp cận liên tưởng tự do này có ảnh hưởng mạnh đến các thực nghiệm liên tưởng trong xử lí ngôn ngữ tự nhiên. Khi cần đo đạc độ tương tự ngữ nghĩa của từ, xác định mức độ liên quan về nghĩa của từ, người ta cũng thường sử dụng phép liên tưởng tự do. Trong loại bài toán này, quan hệ bao thuộc cũng là một loại quan hệ chính yếu thường được lấy ra xem xét. Các mẫu dữ liệu được sử dụng để huấn luyện cho máy học sẽ được xây dựng một cách thủ công, do người bản ngữ trực tiếp thực hiện. Các đơn vị từ vựng có quan hệ bao thuộc, cũng như những từ có hay không có quan hệ ngữ nghĩa khác, sẽ được người bản ngữ đánh giá và cho điểm, sau đó, máy sẽ dựa vào đó để học rồi tự động đoán định, phát hiện và gán nhãn các quan hệ ngữ nghĩa (Phạm Văn Lam, 2020). Bản thân chúng tôi, cùng với các đồng sự của mình, cũng đã tiến hành phát hiện tự động các quan hệ ngữ nghĩa nói chung và quan hệ bao thuộc nói riêng theo hướng này (Phạm Văn Lam, 2013, 2014,  2017, 2019). Cách tiếp cận theo lối liên tưởng luận này đối lập với lí thuyết cổ điển về quá trình phạm trù hoá. Cách tiếp cận cổ điển cho rằng các thành viên phạm trù luôn được xác định bằng một loạt các điều kiện cần và đủ, đối với tâm lí học về mặt thực chứng, bằng các nét nghĩa hay nội hàm quy loại và phân biệt, đối với triết học và ngôn ngữ học học về mặt lí thuyết (x. thêm trong Bruner, 1956; Katz và Fodor, 1963; Nida, 1974; Armstrong, 1983,…). Đến những năm 1970, cách tiếp cận cổ điển này đã không còn đứng vững được trước cách tiếp cận điển mẫu của Rosch (1973, 1975, 1978) và Rosch, Mervis (1975). Cách tiếp cận điển mẫu này đã được ngôn ngữ học vận dụng nhiều, thậm chí còn được xem là một phương pháp làm việc rất có hiệu lực trong các nghiên cứu ngôn ngữ học theo đường hướng tri nhận luận. Tuy nhiên, trong suốt những năm 1970-2000, cách tiếp cận điển mẫu hầu như không có ảnh hưởng trong các nghiên cứu về các từ ngữ có quan hệ bao thuộc. Gần đây, trong ngôn ngữ học, mới có người gợi ý việc vận dụng khái niệm điển mẫu vào nghiên cứu quan hệ bao thuộc (Cruse, 2002).

Bên cạnh hướng nghiên cứu mang tính chất lí thuyết, miêu tả thuần tuý như vậy, còn có một hướng nghiên cứu khác. Đó là hướng nghiên cứu ứng dụng. Ở hướng này, những nghiên cứu về quan hệ bao thuộc chủ yếu xuất hiện trong các bài kiểm tra đánh giá năng lực ngôn ngữ hay năng lực trí tuệ thuộc lĩnh vực ngôn ngữ học bệnh học hay giáo dục ngôn ngữ, hay các nghiên cứu về thụ đắc ngôn ngữ (thường là của/ dành cho trẻ tiền học đường). Trên đại thể, người ta thường sử dụng các cặp từ ngữ có quan hệ bao thuộc để đánh giá khả năng phân biệt và sự phát triển (thụ đắc), tính hoàn chỉnh trong vốn từ vựng của học sinh hay bệnh nhân. Đối với một người Việt bình thường, đã có từ gia cầm thì không thể nào không có ngan, ngỗng, gà, vịt, chim, cò,…;  mà đã có ngan, ngỗng, gà, vịt, chim, cò thì tất phải có ngan ngỗng, gà vịt, chim cò,…  Đã có gia súc nhỏ thì phải có gia súc, trâu bò, trâu, bò, chó mèo, chó, mèo, lợn gà, lợn, gà,… Các từ ngữ bao thuộc thường liên quan đến các quá trình hay hoạt động phạm trù hoá thế giới, khái quát hoá quá mức hay khái quát non… trong nhận thức của trẻ. Chẳng hạn, trẻ hoàn toàn có thể xếp chiếc máy kéo vào phạm trù ô tô, trẻ hoàn toàn có thể gọi chiếc máy ảnhcái chụp ảnh, cái búacái đập,...

Dễ dàng có thể nhận thấy rằng tất cả các bảng trắc nghiệm đánh giá ngôn ngữ của học sinh hay bệnh nhân đều có các cặp từ ngữ có quan hệ bao thuộc với mức độ khó dễ khác nhau xuất hiện trong đó. Trong quá trình xây dựng Bộ công cụ đánh giá sự tiến bộ của học sinh khuyết tật trí tuệ/ khuyết tật học tập, tập trung vào kĩ năng biểu đạt, đọc, viết & tính toán (Viện Khoa học Giáo dục Việt Nam, 2016) dành cho học sinh tiểu học, chúng tôi cũng đã sử dụng tới các từ thuộc một cách hệ thống và có chọn lọc.

Như vậy, đứng từ góc nhìn của ngôn ngữ học, qua sự trình bày sơ lược về cách tiếp cận của tâm lí học đến quan hệ bao thuộc, có thể nói rằng, với cách tiếp cận của tâm lí học, nhiều nhiệm vụ, nhiều thuộc tính quan trọng của quan hệ bao thuộc đã được làm rõ và đưa vào ứng dụng. Cách tiếp cận của tâm lí học đã có sự ảnh hưởng trở lại đối với nhiều nghiên cứu về quan hệ bao thuộc của ngôn ngữ học, đặc biệt là trong giáo dục, xử lí ngôn ngữ tự nhiên.

3. Ngôn ngữ học nhân chủng

Khi tiếp cận các tộc người, nhân học (đôi khi cũng được gọi là dân tộc học hoặc dân tộc kí, dành cho nhánh nhân học văn hoá) không chỉ xem ngôn ngữ như là một công cụ giao tiếp (gắn với việc chú trọng vào các thói quen và hành vi giao tiếp, các diễn ngôn, các cuộc hội thoại…) mà còn coi ngôn ngữ như là một công cụ đặc biệt để biểu đạt và tổ chức văn hoá, xã hội, tri thức, tâm lí và tư duy (gắn với việc tập trung vào cơ cấu của ngôn ngữ nói chung và cơ cấu của hệ thống từ vựng hay ngữ pháp nói riêng), như là một loại tài nguyên đặc hữu của một dân tộc, một loại tài nguyên phổ quát của thế giới loài người… Với nhân học, rộng hơn là cả các khoa học liên ngành với ngôn ngữ học, ngôn ngữ và ngôn ngữ học dường như được xem là một hệ thống công cụ và một hệ thống phương pháp nghiên cứu hơn là một đối tượng và một lĩnh vực nghiên cứu thuần tuý, riêng biệt. Giá trị của ngôn ngữ và của ngôn ngữ học về mặt phương pháp luận khoa học đối với nhân học, cụ thể là nhân học văn hoá, trên đại thể, có lẽ nằm ở chính chỗ này.

Chính vì thế mà thật khó để có thể vẽ ra được một đường ranh giới rạch ròi, dứt khoát cho các nghiên cứu ngôn ngữ học và nhân học về quan hệ ngữ nghĩa nói chung và quan hệ bao thuộc nói riêng. Bởi lẽ, hầu hết các công trình nhân học viết về ngôn ngữ đều được công bố trên các tạp chí nghiên cứu ngôn ngữ. Tuy nhiên, thực tiễn lịch sử khoa học cho thấy những nghiên cứu về ngôn ngữ trong nhân học lại có một giá trị phương pháp luận vô cùng lớn lao đối với các nghiên cứu về quan hệ ngữ nghĩa nói riêng và các nghiên cứu về ngôn ngữ (như trong âm vị học, ngữ pháp học và ngữ nghĩa học) nói chung (Phạm Văn Lam, 2020).

Trong ngôn ngữ học nhân chủng, vấn đề quan hệ nghĩa nói chung và quan hệ bao thuộc nói riêng chỉ là một trong những vấn đề nhỏ, nhưng quan trọng và tất yếu, được quan tâm, nghiên cứu. Quan trọng là vì quan hệ bao thuộc là quan hệ ngữ nghĩa lớn nhất, quan trọng nhất trong bất kì hệ thống từ vựng nào. Tất yếu vì quan hệ này là nơi thể hiện rõ nhất, dễ dàng nhận thấy nhất cái cấu trúc, tôn ti hay các lớp lang văn hoá, xã hội của một cộng đồng; những nghiên cứu về các từ ngữ chỉ quan hệ thân tộc (Lounsbury, 1964; Tyler, 1969; Goodenough, 1970), tên gọi tự nhiên của các loài động vật, thực vật hay các đồ tạo tác (Frake, 1962;  Sturtevant, 1964; Berlin, Breedlove và Raven, 1966, 1974; Conklin, 1962, 1972; Hunn, 1977), các từ ngữ chỉ màu sắc (Berlin và Kay, 1969; Kay và McDaniel 1978) là những minh chứng hùng hồn nhất cho nhận định này.

 Sự quan tâm đến quan hệ bao thuộc trong ngôn ngữ học nhân chủng được định vị trong các nghiên cứu về hệ thống từ vựng – ngữ nghĩa của ngôn ngữ. Và dĩ nhiên, việc nghiên cứu về hệ thống từ vựng – ngữ nghĩa của ngôn ngữ cũng chỉ là một trong số nhiều công việc được ngôn ngữ học nhân chủng thực hiện (như các hành động lời nói, cấu trúc hội thoại, xã hội hóa ngôn ngữ, tiến hoá ngôn ngữ, biến đổi ngôn ngữ,…). 

Nếu như nhà ngôn ngữ học nghiên cứu các quan hệ ngữ nghĩa thông qua phương pháp nội quan hoặc thông qua các nguồn ngữ liệu riêng biệt thì nhà nhân học lại nghiên cứu vấn đề này thông qua các cuộc điền dã phỏng vấn trực tiếp các nghiệm viên để lấy thông tin. Sau khi có thông tin, nhà nhân học tiếp tục sử dụng một phương pháp vốn được vay mượn từ trong âm vị học cấu trúc để nghiên cứu tiếp; phương pháp ấy chính là phương pháp phân tích thành tố mà chúng ta ngày nay thường hay nhắc đến. Chúng ta có thể thấy được điều này qua các công trình của Chao (1953), Frake (1964), Tyler (1969), Berlin và Kay (1969),… Hơn thế nữa, những công trình như của Goodenough (1956, 1965), Lounsbury (1964) chính là những công trình góp phần đặt nền móng cho nhánh phương pháp phân tích thành tố vốn được bắt nguồn từ nhân học Mỹ.

Một hướng nghiên cứu rất mạnh trong nhân học vào những năm 1970 là hướng nghiên cứu theo lối phân loại học dân gian (folk taxonomy) và chia phần học dân gian (folk meronomy) để đưa ra một hệ phương pháp phát hiện và miêu tả các quan hệ ngữ nghĩa sao cho thật hiệu quả, không những đảm bảo được tiêu chí thoả đáng miêu tả (cái mà ngôn ngữ học cấu trúc quan tâm) mà còn đảm bảo được tiêu chí thoả đáng tâm lí (cái mà tâm lí học chú trọng) (Frake, 1962; Sturtevant, 1964; Berlin, Breedlove và Raven, 1966, 1974; Conklin, 1962, 1972). Việc nghiên cứu quan hệ bao thuộc và quan hệ tổng phân trong ngôn ngữ học tương ứng với việc nghiên cứu cách phân loại và chia phần dân gian trong nhân học.

Phân loại học dân gian chính là quan hệ bao thuộc trong ngôn ngữ tự nhiên. Chẳng hạn, Casagrande và Hale (1967) đã lấy thông tin về các quan hệ ngữ nghĩa có trong ngôn ngữ và văn hóa của các tộc người bằng cách: (1) hỏi các nghiệm viên về các thực thể, cấu tạo của các thực thể, các tiểu loại thực thể,…; (2) yêu cầu các nghiệm viên định nghĩa/ giải thích tên gọi của các thực thể; (3) phân tích các lời định nghĩa đó bằng các câu trần thuật đơn giản; (4) rút ra các quan hệ ngữ nghĩa có thể có trong các câu trần thuật đơn giản đó. Dưới đây là một ví dụ của Casagrande và Hale đã được chúng tôi chuyển ngữ sang tiếng Việt. Trong ví dụ này, cột trái thể hiện tên quan hệ ngữ nghĩa, cột giữa thể hiện lời định nghĩa theo công thức khái quát X –>Y (đọc là “X được định nghĩa bằng Y”); cột phải là ví dụ (Casagrande và Hale, 1967, tr.168):

Bảng 1. Ví dụ của Casagrande và Hale (1967)

thuộc tính X được định nghĩa liên quan đến một đặc điểm Y cóc –> nhỏ
liền kề X thường hay tất yếu có Y đi kèm cười –> vui
chức năng X là phương tiện để thể hiện kết quả Y tai –> nghe
bao gộp loài A là một thành viên trong lớp tôn ti Y ong –> côn trùng
đồng nghĩa X tương đương với Y nghìn –> mười trăm
trái nghĩa A là sự phủ định của Y cao –> thấp
bậc X nằm trên một chuỗi thứ bậc có liên quan đến Y thứ Hai –> Chủ nhật

 Trong các ví dụ này, ví dụ cóc – nhỏ là quan hệ thuộc tính, tai – nghe là ví dụ về quan hệ chức năng (tức quan hệ vai), nghìn – mười trăm là quan hệ đồng nghĩa, cao – thấp là quan hệ trái nghĩa, ong – côn trùng là quan hệ bao thuộc; các thực thể từ cóc, tai, ong, côn trùng, nghìn, mười trăm, thứ Hai, Chủ nhật là những danh từ, có tồn tại quan hệ bao thuộc.

Hay như Frake (1964) đã miêu tả mạng lưới quan hệ ngữ nghĩa qua các cuộc phỏng vấn nhân học. Trong cách làm của Frake, một đơn vị từ vựng nào đó được xem là có quan hệ ngữ nghĩa khi nó đi vào một trong sáu câu hỏi sau đây; và đơn vị từ vựng được dùng để trả lời cho các câu hỏi ấy chính là đơn vị từ vựng có quan hệ ngữ nghĩa với đơn vị từ vựng xuất hiện trong câu hỏi.

Bảng 2. Ví dụ của Frake

?u X được được sử dụng vào mục đích gì? công cụ
?k X gồm những loại nào? từ bao
?w X là một loại nào? từ thuộc
?i X gồm những thành phần của gì? từ tổng
?p X được tách từ cái gì? từ phân
?s X được làm từ cái gì/ có nguồn gốc từ đâu Nguồn

Cách làm của nhân học này vô hình trung đã chứng minh một cách mạnh mẽ và dứt khoát rằng từ bao thuộc không chỉ là những đơn vị của ngôn ngữ mà còn là những đơn vị của tâm lí, của tư duy, của tổ chức văn hoá và biểu đạt tri thức, của cấu trúc và thiết chế xã hội… Ngôn ngữ học, tâm lí học, văn hoá học và xã hội học cùng với các khoa học nhận thức là những lĩnh vực được hưởng lợi nhiều nhất từ các nghiên cứu nhân học như thế này. Đi sâu vào ngôn ngữ học, từ điển học thực hành có lẽ là bộ phận học được nhiều thứ từ các nghiên cứu này của nhân học để biên soạn các từ điển đối dịch, nhất là đối với các ngôn ngữ thuộc các nhóm dân tộc ít người.

Một hướng nghiên cứu khác cũng phát triển mạnh trong nghiên cứu nhân học, dù rằng nó không được bắt rễ từ bản thân nhân học, là hướng vận dụng những kết quả nghiên cứu về trí nhớ ngữ nghĩa để nghiên cứu quan hệ ngữ nghĩa. Những người tiên phong vận dụng lí thuyết trí nhớ ngữ nghĩa (của Tulving, 1972) vào nghiên cứu nhân học là Quillian (1986), Werner (1974, 1978), Topper (1976). Trong cách tiếp cận này, trí nhớ ngữ nghĩa chính là “mạng lưới liên tưởng gồm các quan hệ ngữ nghĩa được sử dụng để biểu đạt các tri thức văn hóa ngầm ẩn” (Werner, 1978, tr.76), và quan hệ bao thuộc cũng là một loại quan hệ góp phần tạo nên các cấu trúc “biểu diễn một cách ngầm ẩn của tri thức con người” (Werner, 1978, tr.48).

Chẳng hạn, Werner (1978) cho rằng có những quan hệ cơ sở mang tính phổ niệm mà ông gọi là, chẳng hạn: T – taxonymy (phân loại, tức quan hệ bao thuộc), như chim sẻ là một thành viên/ loại của lớp chim; M – attribution (thuộc tính), như vàng là thuộc tính của chim hoàng yến; Q – queuing (chuỗi), như sau thứ Hai là thứ Ba;… Những quan hệ này có thể được biểu diễn trong các công thức như:

– chim sẻ T chim (đọc là chim sẻ là một thành viên/ loại của lớp chim)

– vàng M hoàng yến (đọc là vàng là thuộc tính của chim hoàng yến)

– thứ Hai Q thứ Ba (đọc là sau thứ Hai là thứ Ba)

Hai hướng nghiên cứu trên là những hướng chính của nhân học tập trung vào việc khám phá các quan hệ ngữ nghĩa. Chính vì thế mà người ta thường gán cho hai hướng nghiên cứu này tên gọi ngữ nghĩa học dân tộc (Parkin, 1982). Tuy nhiên, cùng với đà phát triển của ngôn ngữ học xã hội, khuynh hướng nghiên cứu ngữ nghĩa học dân tộc đến những năm 1980, về cơ bản, đã bị khuynh hướng nhân học miêu tả các hành vi lời nói (dân tộc học lời nói) thay thế. Với khuynh hướng nhân học miêu tả, đối tượng nghiên cứu là từ vựng – ngữ nghĩa trước đây đã bị diễn ngôn thay thế, phương pháp luận ngữ nghĩa học dân tộc trước đây đã bị phương pháp luận ngôn ngữ học xã hội thay thế (Phạm Văn Lam, 2020). Chính vì thế mà quan hệ bao thuộc, cũng giống như các quan hệ ngữ nghĩa khác, tạm thời không còn là mối quan tâm đáng kể của nhân học nữa. Tuy vậy, những gì mà nhân học đã đặt ra cho việc nghiên cứu các quan hệ nghĩa đã thực sự trở thành những viên đá tảng trong nghiên cứu ngôn ngữ học nói chung và ngữ nghĩa học từ vựng nói riêng, đặc biệt là ngữ nghĩa học quan hệ. Nhiều quan hệ ngữ nghĩa, trong đó có quan hệ bao thuộc, mà nhân học đã nghiên cứu, tiếp tục được tâm lí học gia cố và phát triển, và rồi được ngôn ngữ học chính thức thừa nhận và “cấp quốc tịch” nghiên cứu. Việc điểm qua cách tiếp cận liên ngành với nhân học này có thể cho chúng ta nhiều gợi ý quan trọng trong việc nghiên cứu ngôn ngữ – văn hoá của các dân tộc thiểu số ở Việt Nam, vì lâu nay việc nghiên cứu ngôn ngữ dân tộc thiểu số ở Việt Nam bị bó quá hẹp vào chiếc áo cấu trúc luận chật chội, còn các nghiên cứu dân tộc học thì lại quá tách biệt khỏi các vấn đề của cấu trúc ngôn ngữ (Phạm Văn Lam, 2020). Đơn cử như, cùng là cái “công trình xây dựng dùng để nhốt gia súc, gia cầm vào”, nhưng người Việt chỉ có duy nhất một khái niệm chuồng, trong khi ấy, các dân tộc cùng họ Nam Á của người Việt lại có nhiều khái niệm chuồng, chuồng cho trâu bò, chuồng cho gà vịt; cùng là hành vi “làm chín thực phẩm bằng sức nóng của lửa hay tro than”, người Việt chỉ có một từ nướng, nhưng nhiều dân tộc khác (như Thái, Mường, Bana, Khmer,…) lại có rất nhiều từ nướng khác nhau.

4. Ngôn ngữ học tính toán

Ngôn ngữ học tính toán (còn được gọi là ngôn ngữ học máy tính) là khoa học liên ngành giữa công nghệ thông tin (máy tính) với ngôn ngữ học. Nó là ngành khoa học có nhiệm vụ sử dụng các phương pháp tính toán của khoa học máy tính để xử lí ngôn ngữ tự nhiên trong các bài toán liên quan đến tính toán. Ngành ngôn ngữ học tính toán ra đời khá sớm (những năm 1950 ở Mỹ, Liên Xô), nhưng phải đến những năm 1970 – 1980 khi các nhà ngôn ngữ học tính toán quan tâm đến việc xây dựng các nguồn ngữ liệu từ vựng trực tuyến thì vấn đề quan hệ nghĩa nói chung và quan hệ bao thuộc nói riêng mới được quan tâm và xử lí một cách thoả đáng. Với ngôn ngữ học tính toán, bên cạnh ngữ pháp tạo sinh cải biến, ngữ liệu học (corpus linguistics), ngữ nghĩa học hình thức có thể được xem là một trong những ngành nghiên cứu có nhiều công trạng. Ngữ liệu học và ngữ nghĩa học hình thức là hai lĩnh vực nghiên cứu liên quan nhiều đến các quan hệ nghĩa nói chung và quan hệ bao thuộc nói riêng. “Hơn nữa, quan hệ từ vựng là thứ được người ta nghiên cứu nhiều nhất trong cộng đồng khoa học tính toán” (Pustejovsky, 1995, tr.24). Hay nói như R. Cann, một đại diện có tiếng của ngữ nghĩa hình thức hiện đại, “phong trào phân tích một cách hệ thống nghĩa từ [vốn được bắt đầu từ thời Aristole và được khởi động lại mạnh mẽ sau de Saussure] vẫn được tiếp tục được phát triển ở nửa cuối thế kỉ XX và vào những năm đầu của thế kỉ XXI dưới dạng các mô hình hình thức về quan hệ nghĩa, và đặc biệt là phát triển các mô hình tính toán dành cho những quan hệ này để tiến hành xử lí ngôn ngữ tự nhiên” (Cann, 2011, tr.457). Và quan hệ nghĩa quan trọng đầu tiên cần phải được ưu tiên để cập và xử lí là quan hệ bao thuộc.

Các Mạng từ tiếng Anh của Đại học Princeton, Mạng từ châu Âu là những mạng từ đầu tiên trên thế giới ghi nhận và xử lí các từ ngữ có quan hệ bao thuộc (Miller, 1989, 1990; Fellbaum, 1998; Vossen, 1998, 2002). Mạng từ Châu Á (Dhanon và cộng sự, 2009; Virach và cộng sự, 2009), Mạng từ tiếng Việt (Phạm Văn Lam, 2014; Phạm Văn Lam và Nguyễn Phương Thái, 2015) cũng có cấu trúc tương tự như trong Mạng từ tiếng Anh.

Trong mạng từ, quan hệ bao thuộc được xem là quan hệ cốt lõi nhất của toàn bộ hệ thống từ vựng. Nó là quan hệ xương sống để tổ chức hệ thống danh từ mà từ đó các quan hệ ngữ nghĩa khác có thể neo bám vào. Toàn bộ hệ thống danh từ của ngôn ngữ đều đã được các mạng từ tổ chức dưới một cái mũ chung, từ bao mẹ cao nhất là thực thể (entity); dưới thực thể toàn bộ các danh từ (các từ thuộc lớp), trong đó có cả các danh từ riêng (các từ thuộc trường hợp), đều được phân loại, quy loại theo quan hệ bao thuộc. Chẳng hạn, Chu Văn An sẽ là một trong các từ thuộc trường hợp được gắn với từ bao lớp cấp trên là nhà giáo/ thầy giáo/ giáo viên/ thầy,…; những từ bao lớp cấp trên này, đến lượt mình, lại được gắn với từ bao cấp trên khác là nghề/ nghề nghiệp; nghề/ nghề nghiệp, cứ tiếp tục được quy loại như thế và cuối cùng được gắn với từ bao mẹ thực thể.

Trong Mạng từ tiếng Việt (do chúng tôi tham gia phát triển) đã xử lí được 9 quan hệ ngữ nghĩa quan trọng: bao thuộc, tổng phân, cách, suy ra, nhân quả, thuộc tính, tương tự, trái nghĩa, đồng nghĩa. Toàn bộ Mạng từ tiếng Việt có 61.509 quan hệ, trong đó 34.161 quan hệ giữa các loạt đồng nghĩa danh từ, 18.465 quan hệ giữa các loạt đồng nghĩa động từ, và 8.883 quan hệ giữa các loạt đồng nghĩa tính từ. Chi tiết số lượng cho từng quan hệ ngữ nghĩa cụ thể được thể hiện trong bảng dưới đây. Dễ thấy rằng các quan hệ có số lượng lớn nhất là bao nghĩa, thuộc nghĩa, trái nghĩa, tương tự, và tất nhiên là cả quan hệ đồng nghĩa (không hiện trong bảng) (Phạm Văn Lam, Nguyễn Phương Thái, 2015, 2016):

Bảng 3. Phân bổ quan hệ nghĩa trong Mạng từ tiếng Việt

STT Danh từ Động từ Tính từ
Quan hệ SL Quan hệ SL Quan hệ SL
1 từ trái nghĩa/ antonym

572 (1,7%)

từ trái nghĩa/ antonym 667 (3,6%) từ trái nghĩa/ antonym 2.658 (29,92%)
2 từ bao/ hypernym 14.945 (43,74%) từ bao/ hypernym 8.661 (46,9%) tương tự/ similar_to 5.840 (65,74%)
3 từ bao trường hợp/ instance hypernym 295 (0,9%) từ thuộc/ hyponym 8.661 (46,9%) thuộc tính/ attribute 385 (4,3%)
4 từ thuộc/ hyponym 14.945 (43,74%) suy ra/ entailment 307 (1,7%)    
5 từ thuộc trường hợp/ instance hyponym 295 (0,9%) nhân quả/ cause 169 (0,9%)    
6 từ tổng thành viên/ member holonym 125 (0,4%)        
7 từ tổng chất liệu/ substance holonym 102 (0,3%)        
8 từ tổng bộ phận/ part holonym 1.135 (3,3%)        
9 từ phân thành viên/ member meronym 125 (0,4%)        
10 từ phân chất liệu/ substance meronym 102 (0,3%)        
11 từ phân bộ phận/ part meronym 1.135 (3,3%)        
12 thuộc (tính) ngữ/ attribute 385 (1,1%)        
Tổng 34.161 18.465 8.883
61.509    

Sau đây là một vài ví dụ bao thuộc được rút ra từ trong dữ liệu Mạng từ tiếng Việt. Ví dụ này được biểu diễn dưới cả dạng văn bản tuyến tính (cách biểu diễn này cũng đã được điều chỉnh so với trực tuyến) lẫn đồ hoạ (ví dụ đồ hoạ được chụp từ màn hình máy tính); ví dụ này đã được trình bày một cách đơn giản hoá, cụ thể là giảm bớt số lượng phần tử quan hệ, chỉ giữ lại một bậc quan hệ ngữ nghĩa trực tiếp duy nhất, không có quan hệ ngữ nghĩa dẫn xuất đến bậc thứ 2, 3,..:

Hình 2. Góc Mạng từ tiếng Việt qua quan hệ cách của từ bao bán
(Nguồn: Dữ liệu được đồ hình hoá của Phạm Văn Lam)

Đơn vị từ vựng nhà với nghĩa “công trình có mái, tường tại một địa điểm cố định” trong Mạng từ tiếng Việt có cấu trúc biểu diễn tuyến tính gồm bốn quan hệ bao nghĩa, thuộc nghĩa, tổng nghĩa, phân nghĩa như sau:

Từ bao:

<d.vật tạo tác> công trình, kiến trúc | thứ được tạo nên, một thực thể phức tạp được tạo từ nhiều phần | công trình với nhiều mái vòm

LĐN: <d.vật tạo tác> nhà, toà nhà | công trình có mái, tường tại một địa điểm cố định | toà nhà cao tầng”

Từ thuộc:

<d.vật tạo tác> hội trường | toà nhà lớn dùng để hội họp hoặc giải trí | Hội trường Ba Đình

<d.vật tạo tác> nhà chứa, lầu xanh, thanh lâu, ổ mại dâm, ổ điếm, nhà thổ | nhà nơi mà gái mại dâm có sẵn | triệt phá các nhà chứa

<d.vật tạo tác> nhà | toà nhà trong đó các thứ được lưu giữ hoặc để trong đó

<d.vật tạo tác> đài thiên văn, thiên văn đài | nhà dùng để quan sát các hiện tượng thiên văn học

<d.vật tạo tác> thư viện | toà nhà lưu giữ sách và tài liệu với số lượng lớn | thư viện công cộng

<d.vật tạo tác> điện, miếu, đền, thánh thất, thánh đường | nhà dành cho một mục đích đặc biệt hoặc cao quý | làm lễ tại thánh thất

<d.vật tạo tác> trung tâm | toà nhà dành riêng cho một hoạt động cụ thể | trung tâm hỗ trợ việc làm

<d.vật tạo tác> nhà hàng, quán, tiệm, quán ăn, tiệm ăn, hàng ăn | nhà nơi mọi người đến để ăn | quán ăn bình dân

<d.vật tạo tác> khách sạn, nhà nghỉ, nhà khách | toà nhà, nơi những người đi du lịch có thể trả tiền cho chỗ ngủ nghỉ, ăn uống và các dịch vụ khác | khách sạn Kim Liên

<d.vật tạo tác> chung cư, khu chung cư | nhà mà được chia thành các căn hộ riêng biệt | chung cư đang lên giá

<d.vật tạo tác> nhà chọc trời, toà nhà chọc trời | toà nhà hiện đại rất cao và có rất nhiều tầng | xây dựng nhà chọc trời

<d.vật tạo tác> nhà xác | nhà (hoặc phòng) nơi cất giữ tử thi trước khi mang đi chôn cất hay hoả táng | nhà xác bệnh viện

<d.vật tạo tác> trường, ngôi trường, trường học | toà nhà, nơi mà những người trẻ tuổi đến để học | trường cấp ba của tôi xây dựng năm 1945

<d.vật tạo tác> nhà thờ, nơi cầu nguyện | toà nhà nơi tụ tập để cầu nguyện

<d.vật tạo tác> kí túc xá, kí túc xá | nhà của các trường cao đẳng hay đại học có các phòng cho sinh viên ở | ở trong kí túc xá

<d.vật tạo tác> chòi | nhà nhỏ có mái tạo bóng râm để nghỉ ngơi

<d.vật tạo tác> nhà phụ | nhà mà là cấp dưới và riêng việt với nhà chính

<d.vật tạo tác> rạp, nhà hát, rạp hát | toà nhà nơi các buổi biểu diễn văn nghệ hoặc các chương trình chiếu phim ảnh được trình chiếu | nhà hát đã chật cứng

Từ phân bộ phận:

<d.vật tạo tác> cầu thang | bộ phận dùng để lên xuống giữa các tầng, có các bậc kế tiếp nhau

<d.vật tạo tác> nhà phụ, kiến trúc phụ | phần thêm vào của một toà nhà chính

<d.vật tạo tác> phòng, buồng, gian | khu vực bên trong của một toà nhà được tường, sàn và trần nhà bao quanh

<d.vật tạo tác> tầng | cấu trúc gồm một phòng hoặc một dãy phòng ở vị trí đơn nhất dọc theo đường thẳng ngang | tôi ở trên tầng hai

<d.vật tạo tác> thang máy | thiết bị nâng gồm mặt sàn hoặc lồng được nâng lên hạ xuống bằng máy móc theo trục thẳng đứng để chuyển người từ tầng này đến tầng khác trong tòa nhà

<d.vật tạo tác> mái, mái nhà | vật che phủ để bảo vệ hoặc tạo thành nóc của một toà nhà | mái nhà lợp ngói đỏ

<d.vật tạo tác> khung, bộ khung | cấu trúc đỡ bên trong tạo nên hình dáng của một sản phẩm nhân tạo

<d.vật tạo tác> cột, cột nhà | trụ đứng nằm bên trong ngôi nhà

<d.vật tạo tác> cửa sổ | khung gỗ hoặc khung kim loại có ô cửa kính, lắp vào tường hoặc mái nhà để thu nhận ánh sáng hoặc không khí

<d.vật tạo tác> cửa ra vào | cửa cho phép ra hoặc vào của một toà nhà

Từ bao làm (với nghĩa “làm cho điều gì đó xảy ra”) có quan hệ cách (dạng quan hệ bao thuộc trong động từ) với các từ cách như sau:

Hình 3. Quan hệ bao thuộc trong Mạng từ tiếng Việt qua từ bao làm (Nguồn: wordnet.vn)

Bên cạnh cách tiếp cận mạng từ như trên, hiện nay trong ngôn ngữ học tính toán, người ta còn phát triển một số cách tiếp cận khác nữa đối với quan hệ bao thuộc, ví dụ cách tiếp cận chức năng, cách tiếp cận đánh giá, cách tiếp cận phát hiện,…

Chẳng hạn, trong cách tiếp cận chức năng, người ta chú ý đến việc nhận diện, phân loại và miêu tả các từ ngữ có quan hệ bao thuộc một cách tự động thông qua các kết cấu từ vựng – ngữ pháp (chủ yếu là các kết cấu đồng hiện), các từ hạt giống hay các từ khoá xác định (Hearst, 1992; Fellbaum, 1998, Nayak, 2015,…). Cách tiếp cận này chú trọng đến vai trò về mặt diễn ngôn của các cặp từ ngữ có quan hệ bao thuộc trong văn bản. Nói cách khác, cách tiếp cận này chú trọng đến khả năng đồng hiện của các từ ngữ có quan hệ bao thuộc thông qua các mô hình từ vựng – ngữ pháp xác định, theo đó, là chú ý đến các chức năng diễn ngôn cụ thể của từ bao thuộc (từ bao với từ thuộc, giữa các từ cùng thuộc với nhau, giữa từ thuộc trường hợp và từ bao lớp). Các từ ngữ có quan hệ bao thuộc trong cách tiếp cận này được máy tính trích rút ra một cách tự động từ các văn bản sử dụng thực tế hay từ các kho ngữ liệu. Nhiều ngôn ngữ, như tiếng Đức, Nga, Nhật, Pháp, Trung,… hiện nay đã sử dụng cách phát hiện tự động này để tìm kiếm các từ ngữ có quan hệ bao thuộc.

Cách tiếp cận của ngôn ngữ học tính toán, cùng với các trào lưu tiếp cận theo lối quan hệ nghĩa ở trong logic học, nhân học và tâm lí học, đã có tác động mạnh mẽ, nếu không nói là có tính quyết định, đối với việc nghiên cứu các quan hệ nghĩa trong hệ thống từ vựng của ngôn ngữ. Chính vì vậy, trong ngôn ngữ học, chỉ đến cuối thập niên 1980 thì người ta mới thấy ngôn ngữ học đề cập một cách “danh chính ngôn thuận” và tương đối hệ thống với các quan hệ nghĩa nói chung và quan hệ bao thuộc nói riêng (Cruse, 1986).

5. Kết luận

Quan hệ bao thuộc là một loại quan hệ ngữ nghĩa quan trọng nhất trong hệ thống từ vựng của mỗi ngôn ngữ. Đây là loại quan hệ là quan hệ đi liền, gắn chặt với quá trình nhận thức, quá trình phân cắt và phạm trù hoá thế giới hiện thực. Đây là một loại quan hệ có giá trị phổ niệm, luôn hiện diện trong mọi hoạt động gắn với các cách tổ chức tri thức, lưu trữ, xử lí và truy xuất thông tin, nhận thức của con người (quản trị tri thức, phân loại khoa học, thư viện,…). Vì lẽ đó mà quan hệ bao thuộc là một trong những quan hệ có lịch sử nghiên cứu khá lâu đời và cũng là quan hệ được nhiều ngành quan tâm nghiên cứu, được ứng dụng vào trong nhiều hoạt động thực tiễn.

Lịch sử việc nghiên cứu quan hệ bao thuộc có thể được chia thành ba hướng tiếp cận: hướng tiếp cận ngoài ngôn ngữ học, hướng tiếp cận liên ngành với ngôn ngữ học, hướng tiếp cận ngôn ngữ học. Bài viết đã tập trung vào việc tìm hiểu trình bày các cách tiếp cận liên ngành với ngôn ngữ học.

Cách tiếp cận liên ngành với ngôn ngữ học trong bài viết được giới hạn và được hiểu là cách tiếp cận liên ngành giữa ngôn ngữ học với tâm lí học, giữa ngôn ngữ học với nhân học, giữa ngôn ngữ học với khoa học máy tính. Đó là cách tiếp cận mà người ta sử dụng phương pháp hay dữ liệu của khoa học này để giải quyết các bài toán của khoa học kia, hoặc người ta phải sử dụng phương pháp hay dữ liệu của cả hai khoa học để giải quyết những bài toán giáp ranh giữa hai khoa học.

Cách tiếp cận liên ngành với ngôn ngữ học đến quan hệ bao thuộc đã được thực hiện từ rất sớm, và đã có tác động mạnh mẽ đến việc nghiên cứu chính quan hệ bao thuộc ở trong ngôn ngữ học. Ngôn ngữ học khi nghiên cứu quan hệ bao thuộc đã được thừa hưởng nhiều thành tựu khoa học của những cách tiếp cận này. Ngôn ngữ học tâm lí nghiên cứu quan hệ bao thuộc theo quan điểm của liên tưởng luận; quan hệ bao thuộc là trung tâm của mọi kích thích liên tưởng, là bộ khung cho các tổ chức từ vựng tinh thần, cho tổ chức của trí nhớ ngữ nghĩa,… Quan hệ bao thuộc cũng được ngôn ngữ học nhân chủng quan tâm, nghiên cứu, vì quan hệ này là một quan hệ gắn chặt và thể hiện rõ bức tranh hiện thực, cách thức tư duy, biện pháp tổ chức văn hoá, xã hội, tâm lí của từng dân tộc,… Còn ngôn ngữ học tính toán chủ yếu nghiên cứu quan hệ bao thuộc như là một quan hệ cơ sở, cơ bản trong các tài nguyên từ vựng – ngữ nghĩa, như một biện pháp, phương tiện tổ chức văn bản, phát hiện tự động, đo lường độ tương tự về nghĩa,…

TÀI LIỆU THAM KHẢO

Tiếng Việt

  1. Phạm Văn Lam, Nguyễn Phương Thái (2015), “Phác thảo Mạng từ tiếng Việt”, Đỗ Hữu Châu: hành trình và tiếp nối, Nxb Đại học Quốc gia Hà Nội, Hà Nội, tr.418-438.
  2. Phạm Văn Lam (cb.) (2015), Phát triển năng lực tư duy – ngôn ngữ (16 cuốn), Nxb Giáo dục, Hà Nội.
  3. Phạm Văn Lam (2020), Từ trái nghĩa tiếng Việt, Nxb Giáo dục, Hà Nội.

    Tiếng Anh
  4. Berlin, B & P. Kay (1969), Basic Color Terms, Berkley: University of California Press.
  5. Casagrande, J. B., K. L. Hale (1967), “Semantic relations in Papago Folk-definitions”, Studies in Southwestern Ethnolinguissitcs, The Hague: Mouton, pp.165-196.
  6. Fellbaum, C. (ed.) (1995), WordNet: an Electronic Lexical Database, Cambridge, MA: MIT Press.
  7. Frake, C. O. (1964), “Notes on Querries in Ethnography”, American Anthropologist (66), pp. 132-145.
  8. Lounsbury, F. G. (1964), “The Structure; Analysis of Kinship Semantics”, Proceedings of the Ninth International Congress Linguistics, The Hague: Mouton, pp. 1073-1090.
  9. Miller, G. Philip N. Johnson-Laird (1976), Language and Perception,  Harvard University Press.
  10. Murphy, M. Lynne, (2003), Semantic relations and the lexicon: Antonymy, synonymy, and other paradigms, Cambridge University Press.
  11. Phạm Văn Lam (coauthor) (2016), “A Two-phrase Approach to Build Vietnamese Wordnet,” Processings of  The 8th GWC, Rumani, pp.259 on-line.
  12. Phạm Văn Lam (coauthor) (2019), “Hypernymy Detection for Vietnamese Using Dynamic Weighting Neural Network”, Processings of  The 19th International Conference on Computational Linguistics and Intelligent Text Processing, in lại trong Lecture Notes in Computer Science, Springer.
  13. Tulving, E. (1972), “Episodic and semantic memory”, Organization of Memory, Academic Press, pp.382-402.
  14. Vossen, P. (ed.) (2002), EuroWordNet: A Multilingual Database with Lexical Semantic Networks, Kluwer, Dordrecht, The Netherlands.
  15. Werner, O. (1978), “The Synthetic Informant Model on the Simulation of Large Lexical/ Semantic Fields”, Discourse and Inference in Cognitive Anthropology, The Hague: Mouton, pp.45-82.

Hyponymy in the interdisciplinary linguistic approaches

Abstract: Hyponymy is often considered to be the most important paradigmatic relation of sense in terms of which the vocabulary is structured. Hyponymy is seen as both an organizational method of vocabulary, texts/ discourses, and an organizational method of thinking, psychology, and culture. It is one of the semantic relations with the longest research history, drawn attention from many scientific fields, and widely applied in practice as well. There have been, so far, several approaches to hyponymy which have often fallen into three directions: non-linguistic approaches, interdisciplinary linguistic approaches, and linguistic approaches. This paper investigates the brief history of the interdisciplinary linguistic approaches to hyponymy. Specifically, approaches of psychological linguistics, anthropological linguistics, and computational linguistics will be dealt with. These approaches have a great influence on the study of hyponymy in linguistics.

Key words: semantic relations; hyponymy; psychological linguistics; anthropological linguistics; computational linguistics.