« Home « Kết quả tìm kiếm

Ứng dụng của ngôn ngữ học khối liệu trong nghiên cứu và giảng dạy ngoại ngữ qua ví dụ đối với tiếng Đức


Tóm tắt Xem thử

- ỨNG DỤNG CỦA NGÔN NGỮ HỌC KHỐI LIỆU TRONG NGHIÊN CỨU VÀ GIẢNG DẠY NGOẠI NGỮ QUA VÍ DỤ ĐỐI VỚI TIẾNG ĐỨC.
- Chú giải lỗi, chú giải ngôn ngữ, ngôn ngữ học khối liệu, nghiên cứu thụ đắc ngôn ngữ, khối liệu, khối liệu người học Keywords:.
- Với việc xây dựng các ngân hàng ngữ liệu bao gồm các văn bản điện tử đại diện cho một ngôn ngữ nhất định (khối liệu), các nhà ngôn ngữ học có thể nhanh chóng tiếp cận và tìm kiếm ngữ liệu thực cho các đề tài nghiên cứu của mình trên nền tảng các khối liệu có dung lượng khổng lồ.
- Nhìn thấy được tiềm năng của khối liệu đối với việc giảng dạy và nghiên cứu về giảng dạy ngoại ngữ, nhiều nhóm nghiên cứu trên thế giới cũng đã xây dựng “khối liệu người học”.
- Bài viết dưới đây cung cấp một cái nhìn tổng quan về khối liệu, khối liệu người học và khả năng ứng dụng của nó trong nghiên cứu và giảng dạy ngoại ngữ thông qua ví dụ đối với tiếng Đức..
- Việc tìm kiếm, lựa chọn ngữ liệu đóng một vai trò rất quan trọng trong nghiên cứu ngành ngôn ngữ học.
- Khả năng kỳ diệu này là nhờ các khối liệu đã được xây dựng và không ngừng được mở rộng.
- Cùng với sự ra đời của các khối liệu là sự hình thành là phát triển của một xu hướng mới trong nghiên cứu ngôn ngữ: ngôn ngữ học khối liệu..
- Trong các nghiên cứu về thụ đắc ngôn ngữ nói chung và thụ đắc ngôn ngữ thứ hai nói riêng, ngôn ngữ học khối liệu cũng đóng một vai trò ngày càng lớn.
- Những khối liệu người học ra đời đã mở ra nhiều tiềm năng trong nghiên cứu và giảng dạy/học ngoại ngữ.
- Bài viết dưới đây đề cập đến các khái niệm cơ bản của ngôn ngữ học khối liệu, khối liệu người học, giới thiệu khối liệu ngôn ngữ Đức (COSMAS II), khối liệu người học tiếng Đức (FALKO, MERLIN) lớn nhất hiện nay và chỉ ra tiềm năng ứng dụng của chúng trong nghiên cứu và giảng dạy tiếng Đức..
- khối liệu ".
- “khối liệu”.
- Từ những đặc điểm của một corpus trình bày ở trên, có thể hiểu “khối liệu” chính là một ngân hàng ngữ liệu điện tử của ngôn ngữ nói và viết và có thể đại diện cho một ngôn ngữ (ví dụ ngôn ngữ tiếng Việt, ngôn ngữ tiếng Anh, ngôn ngữ Đức) hoặc một phong cách ngôn ngữ nhất định (ngôn ngữ thanh niên, ngôn ngữ báo chí, ngôn ngữ khoa học trong tiếng Việt)..
- Sự ra đời của Brown corpus có thể nói đã đánh dấu một bước phát triển mới của một xu thế nghiên cứu trong ngành ngôn ngữ học gắn với cái tên Ngôn ngữ học khối liệu (corpus linguistic).
- Xu hướng này đi ngược lại với phương pháp luận của Ngôn ngữ học tạo sinh (generative linguistic) do Noam Chomsky (1957) đặt nền móng và vào thời kỳ đó đang có ảnh hưởng mạnh mẽ tại khu vực Bắc Mỹ (Mukherjee, 2009).
- Đối tượng nghiên cứu của Ngôn ngữ học tạo sinh không phải là những hành vi, lời nói cụ thể (Performance) mà là ngữ năng (Competence) bao gồm những kiến thức trừu tượng của người bản ngữ về quy luật ngôn ngữ tiếng mẹ đẻ của mình.
- Điều này liên quan chặt chẽ đến mục đích của Ngôn ngữ học tạo sinh được Nguyễn Thiện Giáp (2012) tóm lược như sau:.
- Ngược lại, mục tiêu nghiên cứu của Ngôn ngữ học khối liệu là việc miêu tả ngôn ngữ được sử dụng thực tế trong một cộng đồng ngôn ngữ nhất định trong một điều kiện giao tiếp tự nhiên.
- Bởi vậy, ngữ liệu thực được tập hợp trong corpus đóng một vai trò đặc biệt quan trọng trong các nghiên cứu theo phương pháp Ngôn ngữ học khối liệu..
- Trước khi Brown corpus ra đời thì Ngôn ngữ học khối liệu cũng đã luôn là một phương pháp nghiên cứu thực nghiệm của ngành ngôn ngữ học từ nhiều thế kỷ nay.
- Bản chất của Ngôn ngữ học khối liệu là việc nghiên cứu dựa trên những ngữ liệu thực.
- Điểm khác biệt của Ngôn ngữ học khối liệu hiện đại mà sự khởi đầu của nó gắn liền với việc xây dựng Brown Corpus so với Ngôn ngữ học khối liệu truyền thống chính là khả năng tìm kiếm tự động những đơn vị ngôn ngữ nhất định trên máy tính nhờ vào những thành tựu vượt bậc của công nghệ thông tin và ngôn ngữ học máy tính (Mukhejee, 2009).
- Ngôn ngữ học khối liệu hiện đại vì thế còn có cái tên “ngôn ngữ học khối liệu máy tính” (computer corpus linguistics).
- Theo đó, Ngôn ngữ học khối liệu được.
- định nghĩa là khoa học nghiên cứu các phương pháp xây dựng và sử dụng khối liệu với sự trợ giúp của công nghệ máy tính (Đào Hồng Thu, 2007)..
- Tóm lại, khối liệu là thuật ngữ cơ bản của Ngôn ngữ học khối liệu.
- Theo Đào Hồng Thu (2008) và Mukhejee (2009), khối liệu mang những đặc trưng sau:.
- TÍNH XÁC THỰC: Ngữ liệu được thu thập không phải do nhà nghiên cứu tự nghĩ ra mà là những sản phẩm ngôn ngữ do người sử dụng ngôn ngữ sản sinh trong điều kiện giao tiếp tự nhiên..
- TÍNH SỐ HÓA: Khối liệu là một tập hợp các văn bản được số hóa..
- TÍNH CHÚ GIẢI: Chú giải là “phần giải thích các thông tin đặc thù làm rõ nghĩa cho các văn bản trong khối liệu” (Đào Hồng Thu, 2008), bao gồm chú giải ngoài ngôn ngữ/chú giải ngoại ngôn (Metadata) và chú giải ngôn ngữ (Annotation).
- Chú giải ngôn ngữ bản chất là kết quả phân tích văn bản về các bình diện ngôn ngữ, bao gồm chú giải cấu trúc văn bản (đoạn, chương.
- Những đặc trưng kể trên cũng được coi là những yếu tố cần phải cân nhắc đến khi xây dựng khối liệu..
- ỨNG DỤNG CỦA NGÔN NGỮ HỌC KHỐI LIỆU TRONG GIẢNG DẠY NGOẠI NGỮ.
- Với sự phát triển nhanh chóng của Ngôn ngữ học khối liệu trong những thập kỷ qua, nhiều Khối liệu đã được xây dựng và phục vụ một cách hiệu quả các nghiên cứu của ngành ngôn ngữ học.
- Vai trò của Ngôn ngữ học khối liệu đối với việc nghiên cứu và giảng dạy ngoại ngữ cũng đã được khẳng định.
- Phần trình bày dưới đây giới thiệu Khối liệu tiếng Đức lớn nhất và một số ứng dụng của khối liệu trong nghiên cứu và giảng dạy tiếng Đức..
- Khối liệu điện tử lớn nhất của tiếng Đức hiện nay là COSMAS II (Corpus Search, Management and Analysis System) do Viện Ngôn ngữ học Đức (IDS) bắt đầu xây dựng từ giữa thập kỷ 60 của thế kỷ XX và liên tục được mở rộng cho đến ngày nay..
- Với dung lượng lớn và với sự phong phú về thể loại văn bản thuộc nhiều lĩnh vực, COSMAS II được coi là Khối liệu đại diện cho Ngôn ngữ Đức và có thể ví nó như 1 lát cắt của tiếng Đức hiện đại..
- Ứng dụng của Khối liệu đối với việc dạy và học tiếng Đức.
- Xét từ góc độ người nước ngoài học tiếng Đức, Khối liệu như COSMAS II còn được gọi là Khối liệu người bản ngữ (L1-Corpus) để chỉ một tập hợp các sản phẩm ngôn ngữ của người sử dụng tiếng Đức là người bản ngữ.
- Với loại hình Khối liệu này, có thể tiến hành phân tích định lượng để xác định tần suất sử dụng của các đơn vị ngôn ngữ (từ, cụm từ, cấu trúc ngữ pháp) hoặc phân tích định tính.
- Nhờ những ứng dụng này, Khối liệu giúp cho việc miêu tả ngôn ngữ một cách chính xác và có thể được sử dụng một cách hữu hiệu đối với việc nghiên cứu ngôn ngữ và giảng dạy ngoại ngữ (Lüdeling &.
- Phân tích định lượng: Những Khối liệu được chú giải cho phép thực hiện việc tính toán tần suất của một đơn vị ngôn ngữ nhất định.
- Ví dụ trên nền tảng Khối liệu tiếng Đức học thuật (Akademisches Deutsch), Lüdeling &.
- Phân tích định tính: Với chức năng tìm kiếm tự động trên nền tảng Khối liệu, kết quả tìm kiếm hiển thị đơn vị ngôn ngữ cần tìm (từ, cụm từ, cấu trúc ngữ pháp) trong cả câu/đoạn văn bản.
- Tất cả các ngữ liệu của đơn vị ngôn ngữ này hiển thị lần lượt nối tiếp nhau.
- Đối với mỗi ngữ liệu có từ Interesse, Khối liệu có chức năng hiển thị toàn bộ đoạn văn liên quan:.
- năng này của Khối liệu để tìm kiếm nguồn ngữ liệu thực cho nội dung giảng dạy của mình.
- giáo viên dạy tiếng Đức không phải là người bản ngữ có thể coi ngữ liệu trong Khối liệu là một trong những chuẩn mực ngôn ngữ có thể tham khảo làm.
- Khi đó, giáo viên có thể kiểm tra sự phù hợp về văn cảnh qua việc nghiên cứu những ngữ liệu thực nhận được từ việc tìm kiếm trên nền tảng Khối liệu.
- Người học tiếng Đức có thể sử dụng ngữ liệu trong Khối liệu là tài liệu học tập, đặc biệt cho việc tự khám phá quy tắc dùng một hiện tượng ngữ pháp hoặc cách dùng một từ vựng chưa biết nghĩa.
- Để việc học dựa trên Khối liệu (data driven learning) được hiệu quả, cần phải có những khóa tập huấn cho học sinh về Khối liệu và kỹ năng tìm kiếm ngữ liệu trên nền tảng này..
- KHỐI LIỆU NGƯỜI HỌC VÀ ỨNG DỤNG TRONG GIẢNG DẠY.
- Khái niệm “Khối liệu người học”.
- Đối với các nghiên cứu trong ngành giảng dạy ngoại ngữ, bên cạnh những Khối liệu mà các văn bản là sản phẩm ngôn ngữ của người bản ngữ (L1- corpus), Khối liệu người học (learner corpus hay L2-corpus) cũng đóng một vai trò đặc biệt quan trọng.
- “Khối liệu người học” được hiểu là tập hợp một cách hệ thống các sản phẩm ngôn ngữ đã được số hóa của người học ngôn ngữ (Nesselhauf 2004, trích dẫn bởi Granger, 2008).
- Ví dụ đối với tiếng Đức, khối liệu người học tiếng Đức là tập hợp các văn bản (nói hoặc viết) bằng tiếng Đức của những người học tiếng Đức là ngoại ngữ hoặc là ngôn ngữ thứ hai.
- Như vậy, đối tượng thu thập của khối liệu người học tiếng Đức có thể là sản phẩm ngôn ngữ Đức của những người có quốc tịch nước ngoài nhưng sinh ra và lớn lên tại nước sử dụng ngôn ngữ đích là tiếng mẹ đẻ, ví dụ người Thổ Nhĩ Kỳ hay người Việt Nam sống tại Đức, hoặc là của những học viên tiếng Đức tại các cơ sở đào tạo ngoại ngữ ở Thổ Nhĩ Kỳ hoặc ở Việt Nam..
- Do việc học ngoại ngữ chịu ảnh hưởng của rất nhiều yếu tố nên để có thể được sử dụng cho mục đích nghiên cứu và đảm bảo tính chính xác (Reliability) của kết quả nghiên cứu thì việc thu thập văn bản cho khối liệu người học phải được lên kế hoạch kỹ lưỡng trên cơ sở cân nhắc các yếu tố liên quan.
- là những tiêu chí đặc biệt quan trọng cần lưu ý khi xây dựng kế hoạch thu thập Khối liệu người học (Granger, 2008)..
- Khối liệu người học là một loại hình đặc biệt của khối liệu.
- Việc xây dựng khối liệu người học mới được khởi xướng từ cuối thập niên 80 của thế kỷ 20 (Mukhejee, 2009).
- Các nghiên cứu với khối liệu người học có thể coi là một nhánh nghiên cứu còn non trẻ của Ngôn ngữ học khối liệu, tuy nhiên đã nhanh chóng khẳng định được vị thế của mình (Granger, 2008)..
- Khối liệu người học tiếng Đức.
- Trong khi có nhiều Khối liệu người học tiếng Anh với quy mô lớn đã được xây dựng và có thể sử dụng miễn phí phục vụ mục đích nghiên cứu khoa học thì việc xây dựng Khối liệu người học tiếng Đức một cách hệ thống để sử dụng rộng rãi có đi sau một bước..
- Khối liệu người học tiếng Đức tầm cỡ nhất hiện nay có tên viết tắt FALKO (Fehlerannotiertes Lernerkorpus), do Trường đại học Humbolt (HU) và Trường đại học Tự do Berlin (FU) phối hợp xây dựng.
- Tương ứng với mỗi Khối liệu thành phần trên của người học tiếng Đức là ngoại ngữ (L2) còn có một Khối liệu đối sánh (Vergleichkorpus) do học sinh/sinh viên nói tiếng Đức là tiếng mẹ đẻ (L1) được thu thập tại các trường đại học và trung học.
- Các văn bản thuộc Khối liệu đối sánh này có nội dung tương đương với các văn bản trong Khối liệu người học.
- Việc xây dựng Khối liệu đối sánh này nhằm phục vụ các nghiên cứu so sánh (xem mục 4.3)..
- Ngoài hai Khối liệu thành phần chính nêu trên, FALKO còn có một Khối liệu thành phần được thu thập tại Trường Đại học Georgtown, Washington (FALKO-GU) bao gồm 92 bài viết của 28 sinh viên Mỹ đang theo học ngành tiếng Đức tại trường..
- Đây là một Khối liệu cắt dọc (Longtudinalcorpus) và phục vụ việc nghiên cứu về sự phát triển năng lực tiếng Đức của cùng một sinh viên ở những giai đoạn/bậc học khác nhau trong quá trình học ngôn ngữ này..
- Do phân tích lỗi là một mảng nghiên cứu lớn của chuyên ngành Phương pháp giảng dạy tiếng Đức là ngoại ngữ và việc phân tích lỗi chỉ có thể thực hiện trên cơ sở phân tích sản phẩm ngôn ngữ của người học nên việc chú giải lỗi có thể coi là một loại chú giải đặc biệt quan trọng.
- là một đặc thù của Khối liệu người học.
- Chú giải lỗi được thực hiện bằng việc đưa ra một phương án đúng trong ngôn ngữ đích tại những đơn vị ngôn ngữ trong văn bản người học có xuất hiện “lỗi”.
- Khối liệu người học tiếng Đức lớn thứ 2 được biết đến tới nay là MERLIN với 1.023 bài thi kỹ năng Viết các trình độ từ A1 đến C1 theo chuẩn chung Châu Âu của thí sinh dự thi kỳ thi năng lực tiếng Đức TELC trên toàn thế giới.
- bên cạnh các chú giải ngôn ngữ (hình vị, cú pháp, từ vựng, chính tả) còn có các chú giải dụng học như tính mạch lạc, văn phong,....
- hàng ngữ liệu thực của người học phục vụ việc nghiên cứu đối sánh sự phù hợp của Khung tham chiếu chung Châu Âu về ngôn ngữ (GERS) các trình độ từ A1 đến C1.
- Ứng dụng của Khối liệu người học trong nghiên cứu thụ đắc ngôn ngữ.
- Để có thể nghiên cứu về quá trình thụ đắc ngôn ngữ, người nghiên cứu cần phân tích sản phẩm ngôn ngữ đích của người học.
- Sản phẩm ngôn ngữ này có thể là những sản phẩm người học phải hoàn thành trong quá trình học ngoại ngữ (ví dụ một email, một bình luận ngắn đối với kỹ năng Viết, một bài thuyết trình hoặc một cuộc trò chuyện đối với kỹ năng Nói).
- Những sản phẩm ngôn ngữ này được tập hợp một cách hệ thống với đầy đủ thông tin về cá nhân cũng như lịch sử học ngoại ngữ của người học trong Khối liệu người học.
- Bởi vậy, Khối liệu người học có thể coi là một nguồn ngữ liệu quan trọng đối với các nghiên cứu thụ đắc ngôn ngữ thứ hai (Fandrych.
- Phân tích lỗi: Việc chú giải lỗi của Khối liệu người học giúp việc tìm kiếm lỗi được thực hiện nhanh chóng, tránh việc nhà nghiên cứu phải phân tích lỗi một cách thủ công.Tùy thuộc bình diện ngôn ngữ được chú giải (chú giải từ vựng, từ loại, ngữ pháp, văn phong) mà khả năng tìm kiếm lỗi ở mỗi Khối liệu người học là khác nhau.
- Dưới đây là một số ứng dụng của Khối liệu FALKO trong phân tích lỗi..
- Là một Khối liệu người học được chú giải từ vựng, từ loại và ngữ pháp nên bên cạnh việc xác định được số lần xuất hiện của một hình thái từ/cụm từ nào đó, FALKO còn cho phép tính toán tự động tần suất của một lỗi về từ vựng hoặc lỗi ngữ pháp trong những bài luận của người học được thu thập trong Khối liệu này qua phần mềm ANNIS:.
- Nghiên cứu đối chiếu: Khối liệu người học là nguồn ngữ liệu quan trọng cho việc nghiên cứu so sánh.
- Để có thể được sử dụng cho mục đích này, cần có khối liệu người học thuộc các quốc tịch khác nhau và những khối liệu này cần phải được xây dựng dựa trên những tiêu chí tương đối giống nhau (corpus design).
- FALKO với các khối liệu thành phần được thiết kế giống nhau (xem mục 4.2) cho phép triển khai những nghiên cứu như vậy..
- “dabei” giữa người học tiếng Đức và người Đức, Schmidt (2010) đã tìm kiếm trên các Khối liệu thành phần của FALKO.
- Qua một khảo sát so sánh về tần suất sử dụng một số từ loại trong các khối liệu thành phần của Falko (Khối liệu bản ngữ và Khối liệu người học), Lüdeling &.
- Walter (2009) đã nhận thấy rằng đại từ phản thân sich xuất hiện rất ít trong Khối liệu người học với học sinh đến từ nhiều quốc gia khác nhau.
- Có thể nói, tiềm năng của khối liệu nói chung và khối liệu người học nói riêng đối với việc nghiên cứu ngôn ngữ và việc dạy/học ngoại ngữ là vô cùng lớn.
- Sự ra đời của các khối liệu như khối liệu đại ngôn ngữ Đức COSMAS II hoặc khối liệu người học tiếng Đức FALKO đã tạo ra một nền tảng ngữ liệu đáng tin cậy và có tính đại diện cao phục vụ nghiên cứu về ngôn ngữ Đức cũng như việc giảng dạy/học tập tiếng Đức..
- Đối với việc nghiên cứu giảng dạy tiếng Đức ở Việt Nam và nghiên cứu thụ đắc ngôn ngữ Đức của học.
- sinh Việt Nam, việc xây dựng một Khối liệu người học tiếng Đức của học viên Việt Nam là cần thiết..
- Ngôn ngữ học khối liệu (Corpus) (Phần 1).
- Ngôn ngữ &.
- Ngôn ngữ học khối liệu (Corpus) (Phần 2).
- Ngôn ngữ học tạo sinh của N