« Home « Kết quả tìm kiếm

Nghiên cứu phương pháp tự động hóa trong nhận dạng dòng nhạc


Tóm tắt Xem thử

- CÁC BỘ MÔ TẢ.
- 33 Bảng 5.1: Các kết quả cho các Bộ phân loại SVM và SIMCA đối với các bộ dữ liệu khác nhau và tập các bộ mô tả, được thể hiện như là độ chính xác trung bình cho 10 thử nghiệm với các kết quả phân tách ngẫu nhiên khác nhau cho bộ con huấn luyện và thử nghiệm.
- 76 Bảng 5.3: So sánh giữa Bộ phân loại SVM và Simca đối với các thử nghiệm về các bộ dữ liệu.
- 82 Bảng 5.5: Độ chính xác thu được cho bộ phân loại SVM và SIMCA sử dụng bộ dữ liệu âm điệu.
- 82 Bảng 5.6: Tổng quan về bộ dữ liệu được sử dụng cho việc phân loại nhạc phương Tây/không phải Phương Tây.
- 83 Bảng 5.7: So sánh độ chính xác thu được cho việc phân loại nhạc Phương Tây/không thuộc phương tây và nhạc đồng quê sử dụng SVM và SIMCA.
- 84 Bảng 6.1: Sự liên quan giữa lý thuyết phân loại với các kỹ thuật máy học quan trọng nhất.
- 89 Bảng 6.2: So sánh các bộ phân loại SVM và SIMCA với các thử nghiệm bộ dữ liệu hỗn hợp.
- 60 Hình 4.14: Ví dụ về sự phân loại láng giềng gần nhất.
- Các trường hợp mới được phân loại được phân loại thành hình tam giác với số láng giềng N = 3 nhưng loại hình vuông N = 5.
- 63 Hình 4.15: siêu mặt phẳng trong một phân loại SVM.
- 80 7 MỞ ĐẦU Luận án này sẽ trình bày, thảo luận, và làm sáng tỏ các vấn đề xuất hiện khi máy tính muốn tự động phân loại các dòng nhạc từ các tín hiệu âm thanh.
- Cụ thể, luận án sẽ đề xuất phương pháp phân loại dòng nhạc một cách tự động, sử dụng phương pháp tính toán nhận dạng âm nhạc dựa trên cơ sở âm nhạc học, cùng với các công nghệ Truy xuất thông tin âm nhạc (MIR).
- Chúng tôi đã thiết kế một loạt các thử nghiệm bằng cách kết hợp các yếu tố khác nhau có thể ảnh hưởng đến tính chính xác của việc phân loại như bộ miêu tả âm thanh, các thuật toán máy học… Chúng tôi đã đánh giá, so sánh và phân tích các kết quả tìm được để giải thích về bức tường vô hình trong việc phân loại các dòng nhạc, và đề xuất các chiến lược mới để vượt qua nó.
- Chúng tôi cũng so sánh các kỹ thuật máy học thường được dùng để phân loại và phân tích cách mà chúng giải quyết các vấn đề khi phân loại thể loại nhạc.
- Chúng tôi cũng thảo luận về khả năng đại diện cho các mô hình phân loại khác nhau của chúng trong khoa học nhận dạng.
- Thêm vào đó, kết quả phân loại khi sử dụng các kỹ thuật máy học được đối chiếu với các kết quả của một số thử nghiệm nghe được đề xuất.
- Phép so sánh này hướng chúng tôi nghĩ đến một mô hình cụ thể của các bộ phân loại mà sẽ được kiểm chứng và mô tả chi tiết.
- có nghĩa là sử dụng các bộ dữ liệu khác 8 nhau, trộn chúng vào với nhau và tái hiện một số tình huống thực có thể được sử dụng trong các bộ phân loại (như bộ dữ liệu khổng lồ).
- Ở phần kết luận, chúng tôi sẽ thảo luận về cách thức mà mô hình phân loại được đề xuất ở đây có thể phá vỡ được hiệu ứng bức tường vô hình đang tồn tại trong việc phân loại dòng nhạc tự động.
- Dưới đây là những đóng góp của luận án này vào lĩnh vực phân loại dòng nhạc tự động.
- Đưa ra các nhận xét đa phương diện về các dòng nhạc và cách phân loại chúng.
- Đánh giá cả về chất lượng lẫn số lượng các chủng loại khác nhau của bộ mô tả âm thanh được dùng để phân loại tự động.
- Đánh giá các kỹ thuật máy học khác nhau và các ưu, nhược điểm của chúng trong phân loại dòng nhạc.
- Đề xuất một mô hình mới của bộ phân loại sau khi phân tích việc phân loại dòng nhạc từ các lĩnh vực khác nhau.
- Các phương pháp mới để khám phá, giới thiệu và phân loại âm nhạc phải được đưa ra từ ngành công nghiệp âm nhạc máy tính và các nhóm nghiên cứu.
- Âm nhạc có thể được phân loại theo thể loại, đây có lẽ là cách mô tả âm nhạc hay được sử dụng nhất.
- Heittola (2003) đã tìm ra cách để quản lý được các cơ sở dữ liệu khổng lồ được lưu trữ trong máy tình cá nhân bằng cách phân loại nhạc theo thể loại.
- Phân loại nhạc theo thể loại cụ thể là một cách hữu dụng để miêu tả những đăc tính mà nó giống với những bản nhạc khác cùng thể loại và phân biệt nó với các dòng nhạc khác.
- 11 Chúng tôi sẽ thảo luận về cách sử dụng các kỹ thuật khác nhau để tách các đặc tính này từ âm thanh, và chúng tôi sẽ tìm ra mối quan hệ giữa các file được lưu trữ trong ổ cứng trên phương diện các thể loại âm nhạc được xác định bởi các nguyên tắc phân loại cụ thể.
- TÓM TẮT LUẬN ÁN Mục tiêu của nghiên cứu này là có được một đóng góp quan trọng vào sự phát triển của công nghệ phân loại nhạc tự động.
- Trong bối cảnh này, các công cụ phân loại chuyên dụng có hiệu quả cao có thể trở nên vô dụng hoàn toàn khi chúng ta thay đổi bộ dữ liệu hoặc khi chúng ta cần phải thêm vào một dòng nhạc mới.
- Chúng tôi nghiên cứu cách vận hành của công cụ phân loại trên các bộ dữ liệu khác nhau (và cả khi trộn chúng vào với nhau), và chúng tôi đã cho thấy sự khác biệt giữa các mức độ chính xác đạt được trong những bối cảnh khác nhau.
- Chúng tôi cũng nghiên cứu ảnh hưởng của các bộ mô tả khác nhau và đề xuất sử dụng các đặc tính mới (như là khả năng có thể khiến người ta nhảy nhót hay di chuyển) mà thường không được dùng để phân loại các dòng nhạc.
- Kết quả nghiên cứu được minh họa thêm bằng một loạt các thử nghiệm nghe được thực hiện trên một nhóm sinh viên âm nhạc để phân biệt giữa tầm quan trọng của hai khía cạnh âm nhạc trong quá trình phân loại tổng thể.
- Chúng tôi cũng nghiên cứu ưu và nhược điểm của các bộ phân loại khác nhau 12 và đưa ra đề xuất về việc sử dụng các bộ phân loại khác chưa từng được dùng trong việc này.
- Kết quả chỉ ra cách đồng diễn các bộ phân loại chuyên dụng dành riêng cho mỗi loại (thay vì các bộ phân loại truyền thống mà chúng ta thấy trong công nghệ hiện đại) có thể giúp chúng tôi vượt qua được bức tường vô hình trong việc phân loại tự động các dòng nhạc (Aucouturier & Pachet, 2004).
- Các bộ phân loại được đề xuất có độ chính xác lên tới trên 95% của việc phân loại chính xác trong các bộ dữ liệu thực, nhưng như được chứng minh trong phân tích đối với việc trộn các bộ dữ liệu, mức độ chính xác này có thể giảm 20% hoặc nhiều hơn thế.
- Ở đây chúng ta lại thấy được sự cân bằng giữa hiệu quả của bộ phân loại theo thể loại và tính khái quát, như chúng ta vẫn dự đoán.
- Mặt khác, chúng tôi cũng chỉ ra các bộ mô tả truyền thống liên quan đến họa âm và âm sắc có thể cho ra kết quả tổng thể tốt nhất, trừ một số thử nghiệm rất cụ thể mà ở đó việc sử dụng các bộ phân loại khác (di chuyển, sắc điệu.
- Song song với tất cả các nghiên cứu chi tiết này, chúng tôi cũng trình bày các kết quả của các thử nghiệm nghe, những thử nghiệm này đã cố gắng bổ sung cho kết quả của các bộ phân loại được phân tích ở đây.
- TỔ CHỨC CỦA BÀI LUẬN Chúng tôi bắt đầu với phần giới thiệu các lý thuyết về phân loại dòng nhạc trong chương 2.
- Ở chương 3, chúng tôi nghiên cứu tổng quan các vấn đề của việc phân loại theo dòng nhạc.
- Trong chương 4, chúng tôi sẽ trình bày về nền tảng kỹ thuật cần thiết để xây dựng bộ phân loại như thế này.
- Chúng tôi nghiên cứu ưu và nhược điểm của các bộ phân loại khác 13 nhau và đưa ra đề xuất về việc sử dụng các bộ phân loại khác chưa từng được dùng trong việc này, đó là bộ phân loại SIMCA.
- 14 Chương 2 NHỮNG TIẾP CẬN VỀ LÝ THUYẾT PHÂN LOẠI ÂM NHẠC Phân loại dòng nhạc thực tế là cách chủ đề hóa bản nhạc với các đặc tả của nó.
- Chúng ta sẽ xem ở chương 4, tất cả những phương thức phân loại tự động đều mô phỏng những thuộc tính chính của công nghệ chủ đề hóa.
- Trong chương 6, chúng tôi sẽ thảo luận xem khái niệm chủ đề hóa nào thực hiện tốt nhất những nghiên cứu của chúng tôi trong việc phân loại dòng nhạc và chúng tôi cũng sẽ so sánh với những thuật toán thường được sử dụng khác.
- Khi một khái niệm mới cần được phân loại theo lý thuyết cổ điển, quá trình xử lý sẽ thực hiện bằng cách kiểm tra xem trường hợp này có đủ tất cả những thuộc tính cần thiết để được nhóm vào một trong các danh mục nào đó hay không.
- Lý thuyết cổ điển được sử dụng cho tới thế kỷ 20 bởi vì nó có thể giải thích hầu hết các vấn đề khoa học phân loại.
- Việc phân loại động vật theo phương pháp truyền thống là một ví dụ cho việc sử dụng trên.
- Mô hình phân loại này được nghiên cứu kỹ càng bởi Lakoff (1987) và có các tính chất như sau: 1.
- Nhóm có tính độc lập thông qua các tính chất riêng của những tiêu chí phân loại.
- LÝ THUYẾT NGUYÊN MẪU Rosch (1975) là người đầu tiên đưa ra một ý tưởng chung cho vấn đề phân loại.
- Trong nghiên cứu bà dã chứng minh những điểm yếu của việc phân loại theo lý thuyết cổ điển trong một số môi trường.
- Tất cả các phương pháp phân loại sẽ được quyết định bởi tính giống nhau của một trường hợp cho trước của nguyên mẫu.
- Trong trường hợp có nhiều lựa chọn phân loại, thì khoảng cách gần nhất tới các nguyên mẫu sẽ quyết định việc phân loại.
- Các thành viên ở gần nguyên mẫu sẽ được xét sớm hơn và được phân loại nhanh hơn (Murphy & Brownell, 1985).
- Điều này khá giống với cách con người phân loại trong một môi trường phân loại dễ dàng (mà không quá hiển nhiên).
- Đầu tiên, quá trình phân loại của con người dựa trên lý thuyết này đã sử dụng một số loại của thông tin bổ sung để tạo ra cụm, chứ không phải chỉ thông qua việc đo đạc khoảng cách cụ thể.
- Thứ ba, con người cũng có thể phân biệt giữa các thuộc tính mà định nghĩa một nhóm cụ thể, trong khi lý thuyết phân loại thì không thể làm được điều đó.
- Mô hình phân loại này sẽ giải quyết một số vấn đề trong nhận dạng dòng nhạc, nhưng không đủ để bao hàm hết được độ phức tạp của nó.
- Nói một cách ước chừng rằng, việc phân loại các trường hợp mới sẽ được xác định bằng cách tương tự như các mẫu đã được lưu trữ.
- Độ tương đồng của trường hợp mới được tính toán so với tất cả các trường hợp hiện có trong tất cả các nhóm và sau đó phân loại vào nhóm mà có độ tương đồng cao nhất.
- Ai định nghĩa nổi đâu là thể loại đâu không phải? Ai xác định được cái nào là những thuộc tính mà định nghĩa nên một nhóm? Những người phê bình lý thuyết phân loại này chỉ ra rằng thông tin của những nhóm này không được sử dụng trong phân loại.
- CONCLUSION Trong phần này, chúng tôi đã giới thiệu ba lý thuyết phân loại.
- Việc phân loại dòng nhạc bởi con người được thực hiện theo nhiều tiêu chí cùng một lúc, do đó, việc phân loại cho một bài hát cụ thể có thể sử dụng nhiều hơn một lý thuyết tại cùng một thời điểm.
- Ví dụ, việc phân loại các bài hát cụ thể của chúng tôi có thể được thiết lập bởi một nguyên mẫu nhịp điệu và nhiều những ví dụ về nhạc cụ.
- Tất cả các kỹ thuật phân loại trong Chương 4 đều liên quan đến những khái niệm này.
- 22 Chương 3 KHÁI NIỆM, ĐỊNH NGHĨA, PHƯƠNG PHÁP LUẬN Phân loại dòng nhạc có thể được nghiên cứu từ nhiều ngành kiến thức khác nhau.
- Chúng tôi sẽ bắt đầu với một miêu tả ngắn gọn về phân loại dòng nhạc được thực hiện bởi con người để lấy ý tưởng đưa ra framework của chúng tôi.
- Phân loại dòng nhạc bởi con người có lẽ đã bao gồm hết các khía cạnh này, mặc dù quá trình này vẫn chưa được hiểu một cách thấu đáo (Ahrendt, 2006).
- Nền tảng văn hóa của người nghe sẽ chi phối quá trình phân loại này.
- Perrot & Gjerdigen (1999) đã chứng minh được khả năng phân loại dòng nhạc của con người tốt như thế nào.
- (2007), nghiên cứu này hiện vẫn chưa được xuất bản tuy nhiên độc giả có thể phân tích kết quả nghiên cứu của chúng tôi về khả năng phân loại dòng nhạc của con người ở Phần 5.3).
- Điều này cho thấy không cần thiết phải xây dựng một mô tả lý thuyết ở mức độ trìu tượng hóa cao hơn – tương ứng đòi hỏi các phân tích lâu hơn – đối với phân loại thể loại, theo mô tả của Martin cùng cộng sự.
- 23 Dalla (2005) nghiên cứu khả năng của con người trong việc phân loại các dòng nhạc con của nhạc cổ điển.
- Nguồn: Những sưu tập của một cá nhân, các cơ sở dữ liệu trên Internet, những bản ghi đặc biệt … 24 Một vài bộ dữ liệu dưới đây vừa mới được sưu tập để áp dụng cho những vấn đề riêng biệt, nhưng tất cả trong số chúng đều có thể được sử dụng để phân loại dòng nhạc.
- Trong chương này, chúng tôi sẽ giải thích bản thân các kỹ thuật đồng thời nghiên cứu ứng dụng của chúng đối với việc phân loại dòng nhạc ở các chương sau.
- Chúng tôi bắt đầu bằng việc khái quát các mô hình thống kê được sử dụng để tạo ra các bộ mô tả và để tính toán độ chính xác của các bộ phân loại.
- CÁC BỘ MÔ TẢ Theo quan điểm của chúng tôi, các bộ mô tả chính là điểm mấu chốt trong việc phân loại âm thanh.
- Chúng chịu trách nhiệm trích rút thông tin yêu cầu từ dữ liệu thô sau đó quyết định lĩnh vực âm nhạc nào sẽ tham gia vào việc phân loại.
- Biểu đồ tần số nhịp đập Khái niệm này được được ra bởi Tzanetakis và các tác giả khác (200la) là một phần của hệ thống phân loại dòng nhạc.
- Phân tích thành phần chính năng động: Việc sử dụng phương pháp này để phân loại dòng nhạc được Ahrendt và cộng sự (2004) đề xuất.
- Láng giềng gần nhất Láng giềng gần nhất là thuật toán phân loại đơn giản nhất.
- Ý tưởng cơ bản của nó là một đối tượng được phân loại bởi đa số phiếu của các láng giềng của nó.
- Nó được phân loại theo cấp phổ biến nhất trong số các láng giềng gần nhất k của nó, với k là một số nguyên dương, thường là có giá trị nhỏ.
- Hình 4.14: Ví dụ về sự phân loại láng giềng gần nhất.
- Các láng giềng được lấy từ một bộ các đối tượng được biết đến với sự phân loại chính xác.
- Phân loại: Đưa ra một ẩn số xq để phân loại, xk hiển thị các trường hợp k từ các ví dụ thử nghiệm gần với xq nhất và ngược lại: (4.7) với (a, b.
- Các máy vector hỗ trợ SVM Các máy vector hỗ trợ (SVMs) đã được chứng minh là một kỹ thuật hữu ích đối với việc phân loại dữ liệu.
- Hình 4.15: siêu mặt phẳng trong một phân loại SVM.
- Có bốn chức năng hạt nhân cơ bản: tuyến tính, đa thức, chức năng xuyên tâm cơ bản và xích ma, nhưng đối với các vấn đề phân loại âm nhạc, chức năng đa thức (Poly) và chức năng xuyên tâm cơ bản (RBF) được sử dụng phổ biến nhất.
- Các cây quyết định phân loại các trường hợp bằng cách phân chúng từ gốc tới vài điểm nút cung cấp sự phân loại trường hợp mới, và mỗi nhánh giảm dần từ điểm nút đó tương ứng với một trong những giá trị có thể xảy ra đối với thuộc tính này.
- AdaBoost là một thuật toán để xây dựng một phân loại mạnh mẽ như là một sự kết hợp tuyến tính của các phân loại yếu.
- Ban đầu, tất cả các trọng lượng được thiết lập cân bằng, nhưng trên mỗi vòng, trọng lượng của các ví dụ được phân loại không chính xác được tăng lên đến mức giá trị thử nghiệm yếu bị buộc phải tập trung vào các ví dụ khó khăn trong tập hợp thử nghiệm.
- Phương pháp này đặc biệt hữu dụng đối với các vấn đề phân loại kích thước.
- SIMCA có thể được tăng cường trước sự hiện diện của các nhân tố bên ngoài bằng cách kết hợp phương pháp PCA mạnh mẽ với nguyên tắc phân loại mạnh dựa trên các ma trận đồng biến tăng cường (Hubert & Driessen, 2004), định nghĩa RSIMCA.
- Như đã đề cập ở trên, mục tiêu của SIMCA là đạt được nguyên tắc phân loại đối với một tập hợp các nhóm đã biết m.
- Mục tiêu của SIMCA không chỉ phân loại cho riêng mình mà còn nâng cao các đặc tính cá nhân của mỗi nhóm

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt