« Home « Kết quả tìm kiếm

Đánh giá khả năng trả nợ vay của khách hàng bằng các phương pháp phân loại


Tóm tắt Xem thử

- ĐÁNH GIÁ KHẢ NĂNG TRẢ NỢ VAY CỦA KHÁCH HÀNG BẰNG CÁC PHƯƠNG PHÁP PHÂN LOẠI.
- Ngân hàng, phương pháp Bayes, phân loại, sai lầm, xác suất tiên nghiệm Keywords:.
- Bài báo trình bày các phương pháp phân loại và những vấn đề tính toán trong áp dụng thực tế của chúng.
- Bài báo cũng đề nghị một thuật toán xác định xác suất tiên nghiệm trong phân loại bằng phương pháp Bayes tốt hơn các phương pháp khác.
- Ứng dụng từ số liệu thực tế trong đánh giá khả năng trả nợ vay của khách hàng được thực hiện bằng tất cả các phương pháp để minh họa cho lý thuyết và kiểm tra sự hợp lý của thuật toán được thiết lập.
- Ứng dụng này cũng cho thấy phương pháp đề nghị có ưu điểm hơn các phương pháp khác và có thể được áp dụng cho nhiều lĩnh vực khác nhau..
- Đánh giá khả năng trả nợ vay của khách hàng bằng các phương pháp phân loại.
- Phân loại là xếp một phần tử thích hợp vào các tổng thể đã biết dựa trên các biến quan sát của nó..
- Hiện nay, các phương pháp chính được sử dụng là Fisher, hồi qui logistic, SVM (Support Vector Machines) và Bayes (Webb, 2000.
- Phương pháp Fisher ra đời sớm nhất, có thể phân loại cho hai hay nhiều hơn hai tổng thể, phương pháp này bị ràng buộc bởi giả thiết ma trận hiệp phương sai của chúng bằng nhau.
- Phương pháp SVM chỉ phân loại cho hai tổng thể dựa trên số liệu rời rạc.
- Hiện nay, phương pháp này được áp dụng khá phổ biến trong khai khoáng dữ liệu.
- Mặc dù được đề xuất muộn nhất và chỉ phân loại cho hai.
- tổng thể, nhưng phương pháp hồi qui logistic đang được sử dụng rất phổ biến hiện nay.
- Phương pháp Bayes có nhiều ưu điểm, có thể phân loại được cho hai hay nhiều hơn hai tổng thể.
- Hai vấn đề chính được quan tâm của phương pháp này là tìm hàm mật độ xác suất từ dữ liệu rời rạc và xác định xác suất tiên nghiệm.
- Vấn đề ước lượng hàm mật độ xác suất đã được thảo luận rất nhiều trong các tổng kết và nghiên cứu, nhiều kết quả đã được áp dụng vào thực tế rất hiệu.
- Việc xác định xác suất tiên nghiệm thường dựa vào các tổng kết thống kê, kinh nghiệm và tập dữ liệu thực hiện..
- Các xác suất tiên nghiệm thông thường được đề xuất theo phân phối đều, phương pháp Laplace hoặc tỉ lệ mẫu.
- Trong bài viết này, dựa vào phân tích chùm mờ, chúng tôi đề xuất thuật toán xác định xác suất tiên nghiệm mà nó được xem là hiệu quả hơn các phương pháp khác khi áp dụng vào thực tế (xác suất sai lầm nhỏ hơn)..
- Bài toán phân loại đã và đang được áp dụng cho nhiều lĩnh vực khác nhau, đặc biệt trong ngân hàng.
- Với n biến này, cán bộ tín dụng cần phân loại khách hàng thuộc nhóm nào, từ đó quyết định cho khách hàng vay hay không với mức sai lầm thấp nhất.
- Cấu trúc tiếp theo của bài viết như sau: Phần 2 trình bày các phương pháp phân loại và vấn đề xác định xác suất tiên nghiệm bằng phương pháp Bayes.
- Phần 4 thực hiện đánh giá khả năng trả nợ vay của khách hàng dựa vào các số liệu thực tế của các doanh nghiệp trên địa bàn thành phố Cần Thơ.
- 2 CÁC PHƯƠNG PHÁP PHÂN LOẠI 2.1 Phương pháp hồi qui logistic.
- Phương trình dạng tuyến tính biểu diễn xác suất p qua một tổ hợp tuyến tính của các biến độc lập thường được nghĩ đến trước tiên.
- Sử dụng phương pháp hợp lý cực đại, các hệ số.
- Khi tìm được các hệ số của phương trình hồi qui, ta có xác suất thành công của phần tử có biến quan sát x = (x 1 , x 2.
- 2.2 Phương pháp Fisher.
- 2.3 Phương pháp Bayes.
- Cho k tổng thể w 1 , w 2 ...w k có biến quan sát với hàm mật độ xác suất được xác định là f 1 (x), f 2 (x.
- f k (x) và xác suất tiên nghiệm cho các tổng thể lần lượt là q 1 , q 2.
- Ta có nguyên tắc phân loại một phần tử mới với biến quan sát x 0 bằng phương pháp Bayes như sau:.
- q i f i (x 0 ) thì xếp phần tử mới vào.
- w (4) trong đó.
- q i là xác suất tiên nghiệm của tổng thể thứ i, g i (x.
- Xác suất sai lầm trong phân loại Bayes được gọi là sai số Bayes và được xác định bởi công thức:.
- 2.4 Xác định xác suất tiên nghiệm trong phân loại bằng phương pháp Bayes.
- Vấn đề xác định xác suất tiên nghiệm Kết quả phân loại một phần tử mới bởi nguyên tắc (4) và sai số Bayes được tính bởi công thức (6) đều phụ thuộc vào xác suất tiên nghiệm.
- thường có những phương pháp sau để xác định các xác suất tiên nghiệm:.
- Bora and Gupta, 2014) nhưng việc tìm một xác suất tiên nghiệm thích hợp cho từng trường hợp cụ thể cho đến nay vẫn là một bài toán chưa có lời giải cuối cùng..
- Trong phần này, chúng tôi đề xuất thuật toán tìm xác suất tiên nghiệm mà thực tế kiểm chứng cho ta sai số Bayes nhỏ hơn khi ta sử dụng các xác suất tiên nghiệm vừa đề cập ở trên.
- trong đó  ik là xác suất khi chúng ta xếp phần tử thứ k vào chùm thứ i.
- khi phần tử thứ k thuộc vào chùm thứ i.
- khi phần tử thứ k không thuộc chùm thứ i.
- Khi phân tích chùm mờ, phần tử đại diện chùm thứ i được xác định bởi.
- trong đó m là tham số xác định độ mờ..
- Thuật toán xác định xác suất tiên nghiệm khi phân loại phần tử x 0 vào c tổng thể được đề nghị gồm các bước như sau:.
- Tìm phần tử đại diện của các chùm v i.
- c) và  ij  0 trong trường hợp ngược la ̣i..
- Cột cuối cùng N + 1 là xác suất ban đầu để x 0 xếp vào các chùm w 1 , w 2.
- Ban đầu chúng ta có thể chọn xác suất này bằng nhau..
- ik  trong các trường hợp ngược lại..
- Cột cuối cùng của ma trận phân vùng là xác suất tiên nghiệm khi xếp x 0 vào các tổng thể tương ứng..
- Hiện tại, chúng ta chưa có phương pháp tối ưu trong xác định m (Yu et al., 2004.
- Trong bài viết này, phương pháp Bayes khi sử dụng các xác suất tiên nghiệm (i), (ii), (iii) và thuật toán đề nghị lần lượt được gọi là BayesU, BayesP, BayesL và BayesC..
- 2.5 Phương pháp SVM.
- 3.1 Trong phương pháp Fisher, hồi qui logistic và SVM.
- i) Đối với phương pháp Fisher, do thực tế không có véc tơ trung bình và ma trận hiệp phương sai của tổng thể, nên ta thay thế chúng bằng các ước lượng không chệch từ mẫu.
- Chúng ta có thể sử dụng các phần mềm thống kê R hoặc SPSS để thực hiện bài toán phân loại bằng phương pháp Fisher..
- để thực hiện.
- Đối với phương pháp SVM chúng tôi sử dụng phần mềm Weka để thực hiện..
- 3.2 Trong phương pháp Bayes.
- i) Trong thực tế, dữ liệu là rời rạc, vì vậy để đảm bảo tính ứng dụng thực tế của phương pháp, đầu tiên chúng ta cần phải ước lượng hàm mật độ xác suất từ dữ liệu rời rạc này.
- Có nhiều phương pháp ước lượng tham số cũng như phi tham số để thực hiện.
- Trong bài viết này, chúng tôi sử dụng phương pháp hàm hạt nhân, một phương pháp cho đến hiện tại được đánh giá có nhiều ưu điểm hơn các phương pháp khác.
- Hàm mật độ n chiều ước lượng bằng phương pháp này có dạng:.
- đã hỗ trợ việc ước lượng hàm mật độ xác suất 1 chiều, tuy nhiên trong trường hợp nhiều chiều chưa có sự hỗ trợ.
- ii) Dựa vào nguyên tắc (4), chúng tôi cũng đã viết chương trình để phân loại một phần tử mới, chương trình xác định xác suất tiên nghiệm và chương trình tính sai số Bayes, trong đó tích phân được ước lượng theo phương pháp Monte Carlo..
- X13 Thuongmai Thương mại và dịch vụ 4.2 Phương pháp thực hiện.
- ii) Sử dụng các biến có ý nghĩa đã xác định từ i), kiểm tra sự khác biệt giữa hai nhóm TN và KTN bằng phương pháp Hotelling..
- iv) Với tập huấn luyện, chúng tôi sử dụng tất cả các phương pháp phân loại Fisher, logistic, SVM, BayesU, BayesP, BayesL và BayesC để phân loại hai nhóm doanh nghiệp TN và KTN..
- Trong mỗi phương pháp, xác suất phân loại đúng sẽ được tính để làm tiêu chuẩn lựa chọn mô hình tối ưu..
- v) Sử dụng mô hình tối ưu từ mỗi phương pháp đã rút ra từ iv), thực hiện phân loại cho tập kiểm tra, tính tỉ lệ sai lầm khi thực hiện của mỗi phương pháp để so sánh..
- Từ dữ liệu rời rạc, phân loại bằng phương pháp Fisher và logistic sẽ được thực hiện bằng phần mềm SPSS.
- Đối với phương pháp SVM, việc thực hiện được dựa vào phần mềm Weka (http://download.phanmem.com/weka-3.7.8- NM3P98.html).
- Trong phương pháp Bayes, ước.
- hàm mật độ xác suất ước lượng cho nhóm không trả nợ được và nhóm trả nợ được.
- Các xác suất tiên nghiệm khác nhau trong phương pháp Bayes sẽ được thực hiện để tìm trường hợp phù hợp nhất (sai số Bayes nhỏ nhất)..
- i lần lượt là xác suất tiên nghiệm khi sử dụng phân phối đều, phương pháp Laplace, phương pháp tỉ lệ mẫu và phương pháp được đề nghị.
- Kết quả tối ưu trong thực hiện bằng phương pháp Bayes sẽ được so sánh với các kết quả khi áp dụng các phương pháp logistic, Fisher và SVM..
- 4.3 Kết quả thực hiện.
- Kiểm định sự khác biệt của 2 nhóm TN và KTN với 3 biến trên bằng phương pháp Hotelling, ta thấy có sự khác biệt của hai nhóm này..
- Sử dụng các phương pháp phân loại, với tất cả các trường hợp khác nhau của 1 biến, 2 biến và 3 biến với tất cả các trường hợp của xác suất tiên nghiệm, chúng ta có bảng tổng hợp sau:.
- Bảng 3: Bảng tổng hợp xác suất phân loại đúng của các phương pháp.
- Bảng 3 cho thấy việc sử dụng 2 biến X1 và X7 cho kết quả phân loại đúng cao nhất đối với phương pháp Fisher và logistic.
- Trong khi đó, phương pháp Bayes cho kết quả tốt nhất khi sử dụng 3 biến.
- Phương pháp Bayes trong các trường hợp luôn cho kết quả tốt và ổn định hơn các phương pháp khác.
- Đặc biệt BayesC, khi sử dụng 3 biến cho ta kết quả phân loại đúng rất cao (95.17%)..
- Sử dụng các mô hình tối ưu cho mỗi phương pháp có được từ tập huấn luyện, tiến hành phân loại cho 64 các doanh nghiệp của tập kiểm tra, ta có Bảng 4 tổng kết tỉ lệ phân loại đúng của mỗi phương pháp như sau:.
- Bảng 4: Tỉ lệ phân loại đúng của các phương pháp với tập kiểm tra.
- Số phần tử phân loại sai.
- Số phần tử phân.
- loại đúng Tỉ lệ phân loại đúng.
- Một lần nữa BayesC cho kết quả phân loại đúng cao nhất.
- Theo đánh giá của những người làm trong lĩnh vực tín dụng ngân hàng, kết quả phân loại cho tập huấn luyện và kiểm tra trong trường hợp này là một kết quả tốt.
- Bài báo đã trình bày các phương pháp phân loại và vấn đề tính toán của chúng, trong đó đã đề nghị thuật toán xác định xác suất tiên nghiệm trong phân loại bằng phương pháp Bayes.
- Thuật toán này đã chứng minh ưu điểm, khi làm giảm được xác suất sai lầm phân loại trong tất cả các trường hợp với bộ số liệu thực tế được khảo sát.
- vấn đề tính toán trong áp dụng thực tế của các phương pháp, trong đó đã thiết lập các chương trình để giải quyết vấn đề tính toán của phương pháp Bayes với thuật toán tìm xác suất tiên nghiệm đề nghị.
- Trong việc cho vay, cán bộ tín dụng phải áp dụng nhiều biện pháp nghiệp vụ định lượng và định tính khác nhau, trong đó theo chúng tôi, việc sử dụng bài toán phân loại là một kênh tham khảo định lượng cần thiết, rất đáng quan tâm.
- Trong thời gian tới, chúng tôi sẽ tiếp tục áp dụng cách làm này để phân loại bệnh trong y học.