Ước tính thời gian sống sót của khoản vay cá nhân bằng mô hình tham số trong phân tích sống sót

ThS. ĐOÀN TRỌNG TUYẾN - ThS. BÙI QUỐC HOÀN (Khoa Toán Kinh tế, Đại học Kinh tế quốc dân)

TÓM TẮT:

Một trong những nhiệm vụ quan trọng nhất của các ngân hàng thương mại tại Việt Nam là vừa đảm bảo an toàn vốn, vừa nâng cao lợi nhuận bằng cách mở rộng quy mô tín dụng cá nhân. Trong bối cảnh đó, việc dự đoán chính xác thời gian tồn tại của một khoản vay là lời giải tốt nhất. Kết quả nghiên cứu cho thấy, khả năng dự đoán thời gian sống sót của khoản vay với ngưỡng xác suất cụ thể, cùng với đó là tác động bất thường của tuổi khách hàng tới thời gian sống sót của khoản vay.

Từ khóa: phân tích sống sót, mô hình AFT, thời gian tồn tại của khoản vay.

1. Đặt vấn đề

Đánh giá rủi ro tín dụng của khách hàng là một khâu quan trọng trong hoạt động của các ngân hàng thương mại cũng như các tổ chức tín dụng khác. Việc đánh giá được mức độ rủi ro của khách hàng sẽ cho phép các ngân hàng đưa ra các tính toán hợp lý trong việc quyết định cho vay hay không cho vay, và nếu cho vay thì với mức lãi suất nào là phù hợp để nhằm tối đa hóa lợi nhuận của ngân hàng và đồng thời đảm bảo an toàn vốn của chủ sở hữu.

Để đánh giá rủi ro tín dụng tại các ngân hàng, người ta thường dựa vào xác suất vỡ nợ của khách hàng. Đã có khá nhiều phương pháp được sử dụng để ước lượng xác suất vỡ nợ, chẳng hạn sử dụng các mô hình logit - probit hoặc phương pháp phân tích tách biệt. Các phương pháp này cho phép ước lượng xác suất để một khoản vay bị quá hạn trong một khoảng thời gian nhất định, và thường là một năm. Từ kết quả của xác suất vỡ nợ này ngân hàng sẽ ra quyết định cấp vốn cho khách hàng hay không. Nếu từ chối quá nhiều khách hàng thì ngân hàng không tối ưu được lợi nhuận vì đối với các nước đang phát triển, các ngân hàng thượng mại thiếu đa dạng trong kinh doanh các dịch vụ tài chính, vì vậy tín dụng được coi là dịch vụ sinh lời chủ yếu và thậm chí gần như duy nhất, đặc biệt đối với các ngân hàng nhỏ.

Một cách để giải quyết những trường hợp trên đây là ngân hàng cần xác định khoảng thời gian mà khoản vay đề xuất của khách hàng có thể tồn tại bao lâu trước khi vỡ nợ, để từ đó đưa ra kỳ hạn của khoản vay một cách hợp lý thỏa mãn tất cả các bên: Khách hàng được thỏa mãn về vốn, ngân hàng có thể nâng cao lợi nhuận trong khi vẫn đảm bảo các yêu cầu về phòng tránh rủi ro theo các tiêu chuẩn Basel II đang được áp dụng chung ở hệ thống các ngân hàng tại Việt Nam. Tuy nhiên, các mô hình như logistic hay phân tích tách biệt… đều không cho phép xác định được khoảng thời gian an toàn của khoản vay. Để phục vụ cho mục đích dự đoán thời gian an toàn cho các khoản vay, gần đây người ta sử dụng phương pháp phân tích sống sót. Do vậy, bài viết này nhằm mục tiêu ước tính thời gian an toàn cho mỗi khoản vay cá nhân bằng mô hình tham số trong phân tích sống sót.

2. Cơ sở lý thuyết và tổng quan nghiên cứu

Gọi T là biến ngẫu nhiên thể hiện thời gian sống sót của đối tượng trước khi xảy ra sự kiện (tùy từng trường hợp mà sự kiện có thể là tử vong (trong y học), hỏng hóc của máy móc hay một khoản vay bị vỡ nợ (trong lĩnh vực ngân hàng tài chính)) và S(t) = P(T>t) là hàm sống sót của đối tượng, trong đó giá trị  là xác suất để đối tượng không bị xảy ra sự kiện tới thời điểm t.

Để mô tả phân phối của biến ngẫu nhiên T, người ta sử dụng hàm nguy cơ, đây là tỷ lệ xảy ra sự kiện tức thời tại thời điểm đối tượng sống sót tới t. Từ công thức hàm nguy cơ

CT1

đây là tỷ lệ xảy ra sự kiện tức thời tại thời điểm đối tượng sống sót tới t. Từ công thức hàm nguy cơ h(t), ta có

CT2

Với

CT3 

là hàm mật độ của T, từ đó suy ra

CT4

Trong trường hợp thời gian sống sót T của đối tượng tuân theo một phân phối nào đó thì ta có thể dựa theo phân phối này để biểu diễn các đại lượng đặc trưng của thời gian sống sót T như hàm sống sót S(t) hay hàm nguy cơ h(t). Các mô hình tăng tốc thời gian xảy ra sự kiện AFT (Accelerated Failure Time Model) là các mô hình sống sót tham số, trong đó các biến giải thích X = (X1, X2,…, Xp)  đóng vai trò là nhân tố làm tăng hay giảm thời gian sống sót của đối tượng so với hàm sống sót cơ sở. Thông thường, hàm sống sót có điều kiện được viết dưới dạng S(t|X) = S0(t.exp(-β’X)), S0(t), là hàm sống sót cơ sở - là hàm sống sót khi vectơ biến giải thích đều triệt tiêu, thời gian sống sót giảm khi 0 < (t.exp(-β’X) < 1 và tăng khi exp(-β’X) > 1.

Các phân phối thường được sử dụng trong phân tích sống sót là phân phối mũ, phân phối Weibull và phân phối Log-logistic. Nếu thời gian sống sót tuân theo phân phối Weibull thì ta có mô hình AFT Weibull, khi đó hàm sống sót và hàm nguy cơ với tham số tỷ lệ và tham số hình dáng p có dạng S(t) = exp(-λtp), h(t) = ptp-1, từ đó ta tính được:

CT5

sau đó đặt: 

CT6

và giả sử ngưỡng xác suất sống sót được đặt là S(t) = q thì ta được:

CT8

Phương trình (1) biểu diễn trực tiếp thời gian sống sót của đối tượng theo các biến giải thích X với ngưỡng xác suất sống sót q cho trước.

Trong ngữ cảnh quản trị rủi ro, thời gian T của một khoản vay được tính từ khi khoản vay được giải ngân cho tới khi khoản vay bị vỡ nợ, ở đây vỡ nợ thường được định nghĩa là quá 90 ngày mà khách hàng không thể trả được một phần hay toàn bộ lãi và gốc của khoản vay, hoặc được tính cho tới khi khoản vay kết thúc hay kết thúc thời gian nghiên cứu mà khoản vay vẫn chưa còn đang tiếp tục.

Đã có nhiều nghiên cứu về các yếu tố có ảnh hưởng đến xác suất vỡ nợ của khoản vay, trong đó phải kể đến nghiên cứu của Chapman (1940), Begum Çýgsar & Deniz Unal (2019), Sumit Agarwal và cộng sự (2008) hay của Li Shuai và cộng sự (2013). Các nghiên cứu này đều khẳng định các yếu tố ảnh hưởng đến khả năng trả nợ của khách hàng bao gồm: 1) Các biến nhân khẩu học (Giới tính, Tuổi, Tình trạng gia đình, Số người phụ thuộc), 2) Các biến thể hiện tình trạng kinh tế, xã hội của khách hàng (Nghề nghiệp, Thời gian làm việc ở nghề nghiệp hiện tại, Tình trạng sở hữu nhà ở, Thời gian ở tại địa chỉ hiện tại, thu nhập) và 3) Các biến liên quan tới khoản vay (Giá trị của khoản vay, Thời hạn của khoản vay, Hình thức trả lương qua chính ngân hàng đang vay…). Nghiên cứu của Silva và cộng sự (2020) cũng cho thấy rủi ro vỡ nợ tăng theo mức thời hạn cho vay và độ tuổi của khách hàng, nhưng sẽ giảm nếu khách hàng sở hữu nhiều thẻ tín dụng hơn. Khách hàng nhận lương trong cùng một tổ chức ngân hàng của khoản vay có ít khả năng bị vỡ nợ hơn so với khách hàng nhận lương ở một tổ chức khác.

Việc sử dụng phân tích sống sót trong quản trị rủi ro được bắt đầu chú ý đến từ khá lâu, Narain (1992) là một trong những người đầu tiên sử dụng mô hình AFT để nghiên cứu bài toán phân tích sống sót cho khách hàng cá nhân với thời gian sống sót có dạng phân phối mũ. Các mô hình AFT phức tạp hơn cũng được Banasik & cộng sự (1999) sử dụng để đánh giá xác suất vỡ nợ trong các quãng thời gian khác nhau. Kết quả cho thấy các biến mục đích của khoản vay để tái cấp vốn, thời gian làm việc trên 17 năm, số tiền vay trên 8.000 bảng, cư trú tại địa chỉ hiện tại trên 16 năm là các yếu tố có tác động lớn đến thời gian sống sót của khoản vay.

Các mô hình AFT ở trên đây đều được sử dụng cho mục tiêu chính là xác định xác suất vỡ nợ của khách hàng, các nghiên cứu trên đều khẳng định rằng các mô hình AFT đều cạnh tranh được và đôi khi vượt trội so với mô hình logistic. Trong bài viết này, chúng tôi sẽ không cố gắng khẳng định lại các kết luận trên mà sẽ sử dụng mô hình AFT để ước tính thời gian sống sót của các khoản vay với các ngưỡng xác suất cụ thể.

3. Số liệu và các biến số

Dữ liệu thứ cấp từ một ngân hàng thương mại cổ phần, với 37.787 quan sát là các khách hàng cá nhân có nguồn thu nhập chính từ lương, dữ liệu được lấy một lần duy nhất khi khách hàng làm thủ tục xin cấp vốn và đã được chấp thuận cho vay. Dữ liệu bao gồm các thông tin về nhân khẩu học, tình hình tài chính và lịch sử trả nợ hàng tháng từ khi khoản vay được giải ngân, khoảng thời gian lấy dữ liệu bắt đầu từ ngày 01/01/2014 đến ngày 01/06/2018, khoảng thời gian nghiên cứu là 54 tháng. Số khoản vay bị vỡ nợ là 4.173, tỷ lệ số khoản vay bị vỡ nợ trong thời gian nghiên cứu là 11,04%. Việc phân biến thành các nhóm được thực hiện dựa trên sự tương đồng về thời gian sống sót của khoản vay tương ứng, các biến nhóm dưới đây đều được phân chia theo thuật toán được đề xuất bởi Stepanova & Thomas (2002).

Dưới đây là các biến số được sử dụng trong mô hình:

- Age là tuổi của khách hàng, đơn vị tính là năm. Tuổi được phân thành các nhóm (1) [18, 23), (2) [23, 28), (3) [28, 33), (4) [33, 48) và (5) [48,69). Tuổi của khách hàng thường có tương quan với năng lực quản lý tài chính cũng như sở thích rủi ro, nên được cho là có mối liên hệ với khả năng vỡ nợ. Dự kiến về giá trị của hệ số biến tuổi là: Ở mức tuổi càng cao thì giá trị càng lớn vì khi tuổi càng cao người ta thường có nhiều kinh nghiệm trong công việc, có sự chín chắn trong các quyết định kinh doanh và không mạo hiểm trong các quyết định, đặc biệt là liên quan tới tài chính.

- Working_time là thời gian làm việc tại lĩnh vực chuyên môn hiện tại, đơn vị tính là năm. Biến này được chia thành các nhóm (1) [0,3), (2) [3, 6), (3) [6, 9), (4) [9, 15) và (5) [15, 43). Thông thường, thời gian làm việc càng nhiều thì kinh nghiệm càng được tích lũy nhiều, điều này thường dẫn đến lương được trả cho công việc càng cao, do đó chúng tôi kỳ vọng thời gian làm việc càng lâu thì thời gian sống sót của khoản vay càng dài.

- Có 3 nhóm là: (1) Lao động được đào tạo nghề hoặc công nhân, (2) Chuyên viên, nhân viên thất nghiệp hoặc đã nghỉ hưu và (3) Quản lý, chuyên viên. Vì lương, thưởng của người lao động là khác nhau tùy thuộc vào vị trí công việc cũng như trách nhiệm của cá nhân đối với công việc, nên kỳ vọng về giá trị hệ số của nhóm lao động được đào tạo nghề hoặc công nhân là thấp nhất, nhóm có vị trí quản lý, chuyên viên có hệ số cao nhất.

- Educ là học vấn của khách hàng. Biến này được chia thành các nhóm: (1) học vấn dưới trung cấp, (2) trung cấp, (3) cao đẳng và (4) đại học và trên đại học. Học vấn là thước đo trình độ của người lao động, nên chúng tôi kỳ vọng hệ số của các nhóm này tăng dần từ nhóm có trình độ học vấn thấp đến nhóm có trình độ học vấn cao.

- Land là tình trạng sở hữu bất động sản, nhà ở. Biến nhà được chia thành các nhóm (1) ở nhà thuê, (2) ở nhờ, (3) có 1 nhà và (4) có từ 2 nhà trở lên. Thông thường, việc sở hữu nhà thứ hai trở lên sẽ cho một nguồn thu nhập ổn định hàng tháng và cũng thể hiện khách hàng có tiềm lực tài chính vững mạnh, do đó hệ số của nhóm này được kỳ vọng có giá trị lớn nhất.

- Wage là hình thức trả lương. Biến này được chia thành nhóm: (1) trả lương qua ngân hàng khác, (2) trả bằng tiền mặt và (3) trả qua chính ngân hàng đang vay. Do sự tiện lợi cũng như sàng lọc trước đó về khả năng trả nợ mà nhóm khách hàng được trả lương qua chính ngân hàng cho vay được kỳ vọng sẽ có hệ số lớn nhất.

- Loan_per_Income là tỷ lệ giữa tổng số tiền phải trả (gốc + lãi) tại tất cả các tổ chức tín dụng trên tổng thu nhập sau thuế, bao gồm cả khoản vay đang xem xét, dữ liệu của biến này nằm trong khoảng (0; 1], đây là biến liên tục. Giá trị biến số này càng lớn thì khoản vay càng lớn (so với tổng thu nhập sau thuế), nên hệ số của biến này được kỳ vọng là số âm.

Mô hình AFT Weibull khi đó có dạng:

t = [-lnq]1/p x exp(β0 + β1Age + β2Working_time + β3Position + β4Educ + β5Land + β6Wage + β7Loan_per_Icome) (2)

Trong đó q là ngưỡng xác suất sống sót của đối tượng với điều kiện X.

4. Kết quả và thảo luận

Bảng 1 là kết quả ước lượng của mô hình (2).

Bảng 1. Kết quả mô hình AFT Weibull

Kết quả mô hình AFT Weibull

Nguồn: Tính toán của tác giả

Từ kết quả ở Bảng 1, ta thấy tất cả các hệ số ước lượng ở mô hình (2) đều có ý nghĩa thống kê với mức ý nghĩa 1%, trừ hệ số của biến Loan_per_Income là số âm, tất cả hệ số của các biến giải thích còn lại đều dương, điều này có nghĩa là khi tỷ lệ số tiền phải trả trên tổng thu nhập càng lớn thì càng làm cho thời gian sống sót của khoản vay ngắn lại.  

Ngoài hệ số của biến tuổi của khách hàng, hệ số của tất cả các biến giải thích rời rạc còn lại đều có xu hướng chung là tăng dần theo các cấp độ tương ứng, cụ thể là:

Hệ số của biến Working_time tăng dần theo thời gian làm việc ở lĩnh vực chuyên môn của khách hàng, điều này có nghĩa là thời gian làm việc càng lâu thì thời gian sống sót của khoản vay càng lớn. Tương tự như vậy, biến vị trí công việc là quản lý có hệ số cao nhất, sau đó mới đến nhân viên, chuyên viên và cuối cùng là người lao động được đào tạo nghề hoặc công nhân, điều này có nghĩa là thời gian sống sót khoản vay của người lao động là thấp nhất, của người quản lý là cao nhất. Hệ số của biến Land cho thấy khả năng tài chính (thể hiện bằng tình trạng nhà ở) càng lớn thì thời gian sống sót của khoản vay càng tăng, điều này là đúng như với kỳ vọng ban đầu. Điều tương tự cũng xảy ra với biến Educ, học vấn càng cao thì khả năng vỡ nợ càng ít, tương ứng với thời gian sống sót của khoản vay càng dài hơn.

Trong các biến giải thích, độ chênh lệch lớn nhất giữa các hệ số là ở hình thức trả lương, những người được trả lương qua chính ngân hàng đang vay có thời gian sống sót của khoản vay cao gấp k = [-1nq]0,5911 x exp (0,6593) lần so với khách hàng được trả lương qua các ngân hàng khác. Kết quả này là tương đồng với kết quả của Silva và cộng sự (2020).

Cũng từ Bảng 1, ta thấy ảnh hưởng của biến tuổi của khách hàng vay không theo xu hướng như kỳ vọng ban đầu là thời gian sống sót của khoản vay tăng dần theo nhóm tuổi, hai nhóm tuổi có thời gian sống sót của khoản vay lớn nhất là nhóm tuổi [23, 28) và nhóm tuổi [48, 69), kết quả này là ngược so với kết quả của Silva và cộng sự (2020). Điều này có thể là do khẩu vị rủi ro khác nhau tùy theo lứa tuổi của khách hàng và đặc tính quốc gia của khách hàng trong dữ liệu, các ngân hàng cho vay cần chú ý tới đặc điểm này để có những hỗ trợ kịp thời.

Để xác định thời gian sống sót của khoản vay cụ thể, chẳng hạn chúng ta chọn xác suất sống sót là q = 0,8, với nhóm khách hàng có biến giải thích tương ứng là: Nhóm tuổi [48, 69), học vấn đại học, có 1 nhà ở, thời gian làm việc 7 năm, làm vị trí chuyên viên, được trả lương qua các ngân hàng khác và giá trị Loan_per_Income = 0,34, khi đó xác suất thời gian sống sót của khoản vay là 55,1745 tháng là 80%. Những giá trị này có thể giúp ngân hàng điều chỉnh thời gian của khoản vay để đạt mục đích nâng cao lợi nhuận của ngân hàng nhưng vẫn đảm bảo rủi ro trong phạm vi cho phép, ví dụ với ngưỡng xác suất khoản vay không bị vỡ nợ là 80%, nếu khách hàng đề xuất kỳ hạn vay là 64 tháng thì chắc chắn khoản vay không được chấp thuận, khi đó ngân hàng có thể gợi ý cho khách hàng giảm kỳ hạn vay xuống dưới 55 tháng (khoản vay 54 hay 48 tháng chẳng hạn).

5. Kết luận và khuyến nghị

Từ các kết quả ở trên đây, chúng ta có một số kết luận và khuyến nghị như sau:

Thứ nhất, nhóm khách hàng được trả lương qua chính ngân hàng đang vay có thời gian sống sót của khoản vay lớn hơn nhiều so với các khách hàng khác. Điều này gợi ý ngân hàng nên tăng cường mở rộng mạng lưới khách hàng thân thiết, vì đây là nhóm khách hàng mang lại lợi nhuận nhiều nhất.

Thứ hai, nhóm khách hàng có học vấn cao, có khả năng tài chính tốt (thể hiện bằng nhà ở và vị trí công việc) là nhóm khách hàng có thời gian sống sót của khoản vay khá lớn so với các nhóm còn lại, đây cũng là nhóm khách hàng cần ưu tiên của ngân hàng.

Thứ ba, về độ tuổi của khách hàng, mức độ rủi ro của khách hàng không giảm khi tuổi của khách hàng tăng, trong đó nhóm trẻ tuổi [18, 23) và nhóm [33, 48) có độ rủi ro cao nhất, ngân hàng cần nắm được các đặc điểm này của nhóm tuổi để có những hỗ trợ cần thiết, để đảm bảo an toàn vốn của ngân hàng khi khoản vay đã được giải ngân.

Dựa vào kết quả này, một hướng nghiên cứu tiếp theo là chúng ta có thể ước tính tổn thất dự kiến (EL - Expected Loss) theo thời gian, ước lượng được các giá trị này sẽ giúp ngân hàng tối ưu hóa khoản tiền dành cho dự phòng rủi ro của các khoản vay, tuy nhiên dữ liệu trong bài viết không đủ để nhóm tác giả thực hiện việc này.

TÀI LIỆU THAM KHẢO:

  1. Banasik, J., Crook, J., Thomas, L. (1999). Not if but when will borrowers default. The Journal of the Operational Research Society, 50(12), 1185-1190.
  2. Begum Çýgsar, Deniz Unal. (2019). Comparison of Data Mining Classification Algorithms Determining the Default Risk. Scientific Programming Volume 2019, Article ID 8706505, https://doi.org/10.1155/2019/8706505
  3. John M. Chapman. (1940). Factors Affecting Credit Risk in Personal Lending, in book Commercial Banks and Consumer Instalment Credit. NXB NBER, ISBN: 0-870-14462-6, Chương 5, 109-139.
  4. Li Shuai, Hui Lai, Chao Xu, Zongfang Zhou. (2013). The Discrimination Method and Empirical Research of Individual Credit Risk Based on Bilateral Clustering. Modern Economy, 4, 461-465.
  5. Narain, B. (1992). Survival analysis and the credit granting decision, in book: Credit Scoring and Credit Control, Thomas, L. C., Crook, J. N., Edelman, D. B. Clarendon Press: Oxford, 109-121.
  6. Silva, E. C., Lopes, I. C, Correia, A., Faria, S. (2020). A logistic regression model for consumer default risk. Journal of Applied Statistics, 47, 2879-2894.
  7. Stepanova, M., Thomas, L. (2002). Survival analysis methods for personal loan data. Operations Research Quarterly, 50(2), 277-289.
  8. Sumit Agarwal, Brent W. Ambrose and Souphala Chomsisengphet (2008), Determinants of automobile loan default and prepayment, Eleventh International Banking Conference, Economic Perspectives, Vol. 32, 3rd, 2008 (17-28). Federal Reserve Bank of Chicago.

PREDICTING THE LIFETIME OF A LOAN BY USING THE AFT

WEIBULL MODEL IN THE SURVIVAL ANALYSIS

• Master. DOAN TRONG TUYEN

• Mastter. BUI QUOC HOAN

Faculty of Economic Mathematics, National Economics University

ABSTRACT:

The most important goals of commercial banks in Vietnam are to ensure their capital resources and improve their profits via the growth of personal credit. As a result, it is necessary for banks to predict the lifetime of their loans. This paper used the AFT Weibull model in the survival analysis to estimate the survival time of a loan. The papers results show that the model is able to predict the survival of a loan with a specific threshold of probability. The paper also finds out the unusual effect of the customer's age on the lifetime of a loan.

Keywords: survival analysis, AFT model, lifetime of loan.

[Tạp chí Công Thương - Các kết quả nghiên cứu khoa học và ứng dụng công nghệ, Số 8, tháng 4 năm 2021]