NGÔN NGỮ HỌC KHỐI LIỆU VÀ NHỮNG VẤN ĐỀ LIÊN QUAN
ĐÀO HỒNG THU
NXB KHOA HỌC XÃ HỘI
MỞ ĐẦU
Trong những năm nửa cuối thế kỷ XX và đầu thế kỷ XXI, cùng với sự phát triển của khoa học thông tin, khoa học ngôn ngữ liên tục phát triển và hình thành các xu hướng phát triển mới nhằm đáp ứng nhu cầu hoạt động của xã hội. Song song với sự phát triển không ngừng của thế hệ công nghê máy tính và dịch tự động, trong ngôn ngữ học ứng dụng hình thành xu hướng phát triển mới – Corpus Linguistics ( ngôn ngữ học khối liệu ).
Ngôn ngữ học khối liệu là ngành khoa học trè, là giao điểm giữa khoa học ngôn ngữ và khoa học máy tính, được hình thành vào cuối thế kỷ XX trên co sở kỹ thuật điện tử số, là khoa học nghiên cứu xây dựng các khối liệu ngôn ngữ, nghiên cứu các phương pháp xử lý dữ liệu và sử dụng khối liệu.
Có thể dẫn chứng một thí dụ đơn giản về vai trò và sức sống của ngành khoa học này. Bất kỳ nhà ngôn ngữ nào khi nghiên cứu cũng gặp phải vấn đề về việc lực chọn ngữ liệu cho đề tài mình, nghĩa là cẩn tham khảo rất nhiều loại văn bản để tìm ra các ví dụ cần thiết, và phải hài lòng với việc ngẫu nhiên lựa chọn được các ví dụ đó. May mắn là hiện nay, đã có nhiều văn bản bằng các ngôn ngữ khác nhau để tìm kiếm được ở dạng văn bản điện tử ( file của máy tính ). Khả năng sử dụng các nguồn dữ liệu trên, làm dễ dàng rất nhiều quá trình tìm kiếm thô sơ ,đồng thời đòi hỏi cao hơn chất liệu nghiên cứu, nghĩa là số lượng ví dụ tìm kiếm được cần đầy đủ hơn nhiều cho ngôn ngữ được nghiên cứu. tuy nhiên làm việc đó trên file máy tính cũng không kém nhọc nhằn. Để có thể khắc phục được sự mệt nhọc không cần thiết trong công việc của nhà nghiên cứu, khắp nơi trên thế giới đã thành lập các chương trình khối liệu. Các chương trình đặc thù này có thể đáp ứng rất nhiều yêu cầu của người sử dụng. Ví dụ, một chương trình về văn hóa dân tộc Việt Nam có thể đưa ra toàn bộ các câu, tập hợp câu hoặc văn bản có chứa tập hợp từ “Văn hóa dân tộc Việt Nam” được đăng trên các báo, tạp chí với đầy đủ dẫn nguồn v.v. Nghiên cứu và tạo lập các chương trình khối dữ liệu như trên là nhiệm vụ của ngôn ngữ học khối liệu.
Cuốn sách này có thể dùng làm tài liệu tham khảo dành cho sinh viên, học viên cao học, nghiên cứu sinh, nghiên cứu viên và độc giả quan tâm đến ngôn ngữ học ứng dụng , dịch thuật và các vấn đề liên quan.
Tác giả trân trọng cám tạ Gs, VS Belaeva LH, cùng tập thể giáo sư Bộ môn Ngôn ngữ học ứng dụng, Khoa Ngôn ngữ, Trường Đại học Sư phạm Hersen A.L, Saint Peterburg; PGS.TS. Zakharov B.P. , PGS.TS Mitrophanova O.A , cùng các đồng nghiệp Bộ môn Ngôn ngữ toán học, Khoa Ngôn ngữ học và Nghệ thuật trường Đại học Tổng Hợp Saint Peterburg, các giáo sư viện Ngôn ngữ Liên Bang Nga tại Saint Peterburg đã cố vấn, hướng dẫn cho tác giả trong quá trình hoạt động khoa học tại Saint Peterburg, Liên bang Nga.
Tác giả trân trọng cảm tạ DS.TS Lê Quang Liêm, Tổng biên tập Tạp chí Ngôn ngữ và Đời sống và Ban biên tập tạp chí; Ban lãnh đạo Viện Ngôn ngữ học và Hội Ngôn ngữ học Việt Nam; GS.TS Đinh Văn Đức và Ban Chủ nhiệm Khoa Ngôn ngữ, trường Đại học Khoa học Xã hội và Nhân Văn, Đại học Quốc gia Hà Nội đã nhiệt tình giúp đỡ tác giả thực hiện công trình nghiên cứu về ngôn ngữ học khối liệu và dịch tự động ( dịch máy ) tại Việt Nam.
Tác giả trân trọng cám ơn TS. Nguyễn Xuân Dũng, Giám đốc – Tổng Biên Tập và các phòng chức năng Nhà xuất bản Khoa học xã hội, PGS.TS Phạm Văn Tình đã tận tình giúp dỡ tác giả biên tập và cho ra mắt bạn đọc cuốn sách “Ngôn ngữ học khối liệu và những vấn đề liên quan” ( quyển 1 ).
Tác giả xin chân thành cám ơn bạn bè, đồng nghiệp và các con đã tạo điều kiện tốt nhất cho việc hoàn thành cuốn sách này.
Tác giả
TS. ĐÀO HỒNG THU
MỤC LỤC
Mở đầu
PHẦN I . NGÔN NGỮ HỌC KHỐI LIỆU
Ngôn ngữ học khối liệu ( phần 1)
Khối liệu – đặc trưng và phân loại ( phần 2 )
PHẦN II. DỊCH THUẬT VÀ DỊCH TỰ ĐỘNG
Xây dựng hệ thống dịch tự động tiếng Việt
Về vấn đề dịch văn bản khoa học kĩ thuật và công nghệ
Văn bản khoa học kĩ thuật – cách mở nghĩa và dịch sang tiếng Việt
PHẦN III. NGÔN NGỮ KHOA HỌC CHUYÊN NGÀNH
Ngôn ngữ chuyên ngành nhìn từ góc độ phương pháp giao tiếp trong khoa học và tiếp nhận văn bản khoa học
Phân tích đối chiếu ngôn ngữ trong việc dạy và học tiếng
Phát triển ngôn ngữ khoa học- công nghệ trong giai đoạn Việt Nam hội nhập toàn cầu – hiện trạng và giải pháp
Một số vấn đề của tiếng Việt trong khoa học
Phong cách ngôn ngữ khoa học và công nghệ tiếng Việt và các quy tắc hoạt động của nó trên bình diện văn hóa khoa học
Về vấn đề từ và thuật ngữ trong văn bản khoa học kĩ thuật- công nghệ
Về vấn đề phát triển ngoại ngữ chuyên ngành trong quá trình hội nhập quốc tế
Nghiên cứu lập chương trình môn học tiếng Việt kĩ thuật dành cho sinh viên khối khoa học kỹ thuật và công nghệ
Phân tích cấu trúc câu trong văn phong khoa học – kỹ thuật
PHẦN IV. CÔNG NGHỆ DẠY HỌC
Dạy và học ngoại ngữ chuyên ngành khoa học theo phương pháp giao tiếp
Dạy và học ngoại ngữ ở trường Đại Học Bách khoa Hà Nội
Dạy và học ngoại ngữ ở môi trường không chuyên ngữ
Về vấn đề ‘Dạy học lấy học sinh làm trung tâm”
PHẦN V . CÁC VẤN ĐỀ LIÊN QUAN
Developing languages in the specified filds like one of the methods for resolving the problem of cultural diversities in the processes of regionalization and globalization
Về vấn đề ngôn ngữ và văn hóa trong môi trường đào tạo các khối ngành công ngành công nghệ và kĩ thuật
Ngoại ngữ chuyên ngành kĩ thuật – công nghệ với việc đào tạo giáo viên phổ thông ngoại ngữ thập kĩ đầu thế kỷ XXI – Cơ sở lý luận và thực tiễn
Vấn đề tìm hiểu bản sắc văn hóa dân tộc qua môn học “Cơ sở văn hóa Việt Nam”
Chương trình tiếng Anh chuyên ngành công nghệ hóa học- thực phẩm sinh học – vật liệu – môi trường