Tổng quan về Phân tích dữ liệu trong hoạt động tín dụng
Tổng quan về Phân tích dữ liệu trong hoạt động tín dụng
Hệ sinh thái cho vay tiền không chỉ có mỗi ngân hàng, nó là một dải phổ rủi ro, nơi các tổ chức khác nhau nhắm đến các phân khúc khách hàng và sử dụng dữ liệu theo những cách hoàn toàn khác nhau. Mảng phân tích và tối ưu hoạt động cho vay nó gần như là mảng core trong bank, tổ chức tài chính, fintech,... Có cái nhìn tổng quan về việc cho vay thế nào sẽ giúp định hình công việc trong mảng này đang làm cái gì, các công ty có đặc điểm gì và lựa chọn tìm hiểu xử lý bài toán gì.
Tôi sẽ chỉ viết tổng quan trong phạm vi vòng đời của 1 khoản tín dụng, các bài toán phục vụ trực tiếp việc cấp tín dụng do các bộ phận quản lý tín dụng sử dụng, có rất nhiều các vấn đề liên quan khác sẽ do các bộ phận khác xử lý.
1. Vũ trụ cho vay
Trên thị trường mọi người sẽ thấy có rất nhiều bên cho vay "chính thống": bank, công ty tài chính, các app fintech, các bên cầm đồ. Có 1 chút sự khác biệt.
Nếu nói về mặt luật, các công ty Fintech thuần túy (như Momo, ZaloPay, VNPay...) không phải là Tổ chức tín dụng (TCTD). Các tổ chức tín dụng của NHNN, chỉ có Ngân hàng, Công ty tài chính, Quỹ tín dụng... mới được phép thực hiện hoạt động "Cấp tín dụng" (cho vay) như một mảng kinh doanh (Hiện tại có nhiều thông tin nói về cơ chế sandbox cho hoạt động Fintech nhưng cũng chưa thấy gì rõ ràng).
Mọi người có thể bắt gặp các công ty quảng cáo cho vay nhưng không hẳn là như vậy:
Ngân hàng: Đứng đầu chuỗi thức ăn, được phép huy động tiền gửi từ người dân (tiết kiệm, và đặc biệt là nguồn tiền CASA rẻ). Giá vốn đầu vào (FTP cơ sở) của Bank rất thấp, chỉ khoảng 3% - 6%/năm. Nên bank được đặc quyền đánh tới các khách hàng chuẩn chỉnh, hồ sơ đẹp. Được phép cho vay cả thế chấp và tín chấp. Nếu cho vay thế chấp bất động sản, phải ra Phòng công chứng và đăng ký Giao dịch đảm bảo tại Văn phòng đăng ký đất đai. Cơ quan nhà nước chỉ chấp nhận bên nhận thế chấp là Tổ chức tín dụng (Bank). Bên cạnh việc tăng trưởng tín dụng thì còn các chức năng khác liên quan tới nhiệm vụ chính trị nên không phải lúc nào cũng cần tối đa lợi nhuận :v
Công ty tài chính - Finco (Mcredit, FE credit, ...): Các công ty này không được phép huy động vốn tiền gửi như bank, nên phải vay từ ngân hàng mẹ. Giá vốn (FTP cơ sở) của đội Finco này đã cao hơn bank rất nhiều (thường từ 9% - 12%/năm trở lên). Nhập buôn đã đắt, thì không có chuyện bán lẻ giá rẻ. Vì vốn đắt, Finco không thể cạnh tranh lãi suất với bank được. Buộc lòng, Finco phải vét khách hàng không đủ điều kiện vay bank hoặc các phân khúc mà bank không làm. VD: công nhân, lao động tự do, bán hàng online,... không chứng minh được thu nhập hoặc không có tài sản thế chấp rất khó vay bank. Hoặc nhắm tới các dịch vụ rủi ro rất cao: vay nhanh trả góp tại chỗ, khách hàng không có đủ thông tin phải dùng chấm điểm telco, hoặc yêu cầu các thông tin rất cơ bản đã phê duyệt vay nhanh,... rủi ro cao nhưng lãi suất cũng rất cao. Bài toán lớn nhất mấy công ty dạng này quan tâm là chấm điểm tín dụng phê duyệt nhanh và thu hồi nợ.
Các công ty dạng cầm đồ (F88, Tima,...): Các công ty này không quản lý bởi NHNN. Điểm khác biệt lớn nhất nếu vay ở các công ty dạng cầm đồ này là nợ xấu không nhảy CIC :v mà sẽ đánh vào tài sản cầm cố. Như đã nói ở trên với bất động sản thì chỉ bank mới có đặc quyền công chứng làm khoản vay, các công ty dạng cầm đồ này sẽ chỉ cầm cố các tài sản khác : xe, điện thoại, cà vẹt xe, icloud,... Lãi cũng tương tự với các công ty Finco thôi vì có quy định lãi suất trần rồi, nhưng sẽ đẻ ra nhiều các loại phí, phạt khác. Bài toán lớn nhất công ty dạng này quan tâm là định giá tài sản.
Các công ty dạng Fintech rất nổi tiếng Momo, Viettel Pay, VNPay, ShopeePay... còn không thuộc các nhóm trên, không thể cho vay trực tiếp mà sẽ phải "nhúng" dịch vụ vay của 1 thứ 3, thường là nhóm công ty tài chính - Finco. Các app fintech này là nền tảng ăn hoa hồng tìm kiếm khách hàng, phí trung gian và là nơi thu hộ chứ không được trực tiếp cho vay. VD: Momo thì liên kết Mcredit, ViettelPay có nhúng của Cake, Vietcredit,... bản chất vẫn là nhóm cho vay ở Công ty tài chính.
2. Quy trình tín dụng
Vòng đời của 1 khoản vay dù có là vay ở dạng nào nó cũng được kiểm soát thông qua 1 quy trình chung xuyên suốt, chỉ có khác là với các công ty cho vay khác nhau sẽ đánh mạnh vào bước nào hơn thôi. Kinh nghiệm của tôi chủ yếu ở bank nên sẽ tập trung vào các bài toán trong bank. Trên thực tế thì làm trong mảng này không có quá nhiều bài toán lạ, hầu hết là các bài toán truyền thống áp dụng từ rất lâu rồi, càng ngày càng tối ưu hơn thôi. Việc phân tích dữ liệu nó còn liên quan nhiều tới hệ thống và sản phẩm nên lý thuyết thì giống nhau nhưng mỗi bên đang ứng dụng được tới đâu thì khác nhau.
Quy trình chung:
B1 Khởi tạo khoản vay: tạo hồ sơ vay của khách hàng vay lên hệ thống (VD: hệ thống LOS), bước này chủ yếu là verify các thông tin khách hàng, ứng dụng các ứng dụng AI : ekYC, xác thực khuôn mặt, OCR hồ sơ, xác thực định danh, check CIC,...
B2 Thẩm định: Bước này là bước rất nặng và nhiều bài toán được ứng dụng. Mục đích để giá năng lực tài chính, xác minh thu nhập, định giá tài sản đảm bảo, phân tích rủi ro,... Các bài toán phân tích dữ liệu rất nổi tiếng : xếp hạng tín dụng (A-Score), ước lượng thu nhập, phân tích tối ưu các rule sàng lọc, ngưỡng cutoff, định giá tài sản tự động (lý thuyết chứ không khả thi lắm), check Fraud, xác định nhóm khách hàng nghi ngờ chuyển tiền lòng vòng... Các bài toán phân tích chuyển đổi sang vay nhanh, phê duyệt tự động,... Đối với các khoản vay tái ký thì sẽ là phân tích khả năng tái cấp, auto tái cấp, tăng giảm hạn mức khi tái cấp,...
B3 Phê duyệt: Bước này ra quyết định cho vay, xác định hạn mức, lãi suất và các điều khoản hợp đồng, chủ yếu xử lý trên hệ thống. Bước này không nặng về mặt phân tích dữ liệu như bước thẩm định. Với các sản phẩm vay truyền thống hoặc ngoại lệ thì phải người có thẩm quyền phê duyệt, chủ yếu dựa vào kinh nghiệm chuyên gia. Hiện tại có nhiều bên xây dựng các dự án chuyển đổi, cố gắng lượng hóa để chuyển sang các sản phẩm phê duyệt tự động nhưng cũng mới chỉ ở các sản phẩm cầm cố, số tiền nhỏ.
B4 Giải ngân: Bước này thiên về vận hành, kế toán và tích hợp hệ thống (đẩy lệnh từ LOS sang Core Banking để ghi nhận khoản vay và chuyển tiền), cũng không nặng phân tích dữ liệu. Dữ liệu giải ngân này lại rất quan trọng trong việc kiểm soát vốn giải ngân, lãi suất, cân đối gói vay...
B5 Quản trị danh mục - Theo dõi sau vay: Phần này cũng rất nhiều bài toán, ngang phần Thẩm định. Khi khoản vay đã on-book, mục tiêu là theo dõi sức khỏe tín dụng và tối ưu hóa vòng đời khách hàng. Các bài toán như xếp hạng hành vi (B-Score), cảnh báo sớm (EWS), phân tích chất lượng danh mục Vintage, Rollrate, Bán thêm bán chéo, Churn,... Các bài toán ở bước này không nặng tính tuân thủ như bước thẩm định, có thể áp dụng nhiều kỹ thuật mới. Dữ liệu theo dõi lịch sử và hành vi cho vay cũng rất quan trọng để xây model, đánh giá hành vi để nghiên cứu sản phẩm,...
B6 Thu hồi nợ: Phần thu nợ này tốn khá nhiều nguồn lực vận hành. Ở bank bộ phận thu hồi, mua bán nợ là 1 bộ phận xử lý rủi ro còn ở các bên Finco, cầm đồ thì đây là 1 mảng rất quan trọng, lời lãi ra sao phụ thuộc rất lớn ở phần này. Đơn giản vì các khoản vay ở các bên này vốn đã rất rủi ro, nợ xấu cao hơn bank nhiều nên việc thu nợ được làm rất quyết liệt (chợ búa luôn). Việc bán vốn đắt cho tệp khách rủi ro cao, lấy biên lợi nhuận dày bù đắp cho lượng nợ xấu khổng lồ hiển nhiên phải có. Các bài toán xếp hạng thu hồi nợ C-Score, ước tính tổn thất LGD, tối ưu các kênh tiếp cận, voicebot nhắc nợ, người nhắc nợ, đến tận nhà nhắc nợ,...
3. Các bộ phận tham gia trong quy trình tín dụng
Quy trình hiện tại áp dụng nguyên tắc "Maker - Checker" (Người làm - Người duyệt phải độc lập với nhau).
Hệ sinh thái Công nghệ bao trọn gói tất cả các nền tảng nghiệp vụ bên trên, kết nối các chương trình thành 1 quy trình xuyên suốt. Vấn đề khó khăn nhất khi làm phân tích dữ liệu đó là nó bị rải rác ở nhiều hệ thống, có các hệ thống cũ rất khó map được thông tin chính xác sang các hệ thống mới.
Việc chuẩn hóa nền tảng dữ liệu về 1 chỗ để sử dụng thường do Trung tâm dữ liệu thuộc khối CNTT xử lý.
4. Phân tích dữ liệu tại bộ phận nghiệp vụ và bộ phận dữ liệu
Phần này tôi có viết 1 ít trên FB rồi, note lại chút:
Khối Nghiệp vụ: Phát triển Sản phẩm, Quản trị Rủi ro, Vận hành,...
Khối Dữ liệu chuyên trách: Data Engineer, IT Data, Data Science, AI,...
Khác nhau lớn nhất đó là công việc hàng ngày. Với các bộ phận nghiệp vụ thường xuyên cần các số liệu ngay lập tức để theo dõi, tối ưu thay đổi dựa trên tình hình. Bộ phận data thường làm theo dạng Project, cần thời gian lên yêu cầu và triển khai Production.
Nhóm “Phân tích dữ liệu” trong các Ban nghiệp vụ
Ưu tiên Background kte, tài chính, toán,… sẽ là yêu cầu tuyển dụng ở các Ban : Rủi ro, bán lẻ, tài chính, nguồn vốn, sản phẩm,… Các khối này đều có các bài toán riêng và cần sử dụng dữ liệu để cải thiện hiệu quả, chuyển đổi số hoặc phải làm các bài toán nhằm tuân thủ thông lệ. Nhóm các vị trí này thường ko có title là DA/DS/DE mà đơn giản là chuyên viên mảng đó.
Skill yêu cầu về báo cáo, toán, model (thường ko quá chuộng ML). Vấn đề thì sẽ ko quá đa dạng mà sẽ làm đi làm lại tối ưu 1 số bài toán quan trọng nhất định. Càng nhiều kinh nghiệm trong mảng lĩnh vực đó sẽ càng biết cách tối ưu 1 cách chính xác. Tất nhiên là phần tool và technic ko cần update thời thượng mà chỉ cần đủ dùng phục vụ là được và thường là sử dụng dữ liệu đã được chuẩn hóa. Ko phát sinh các vấn đề về hệ thống, quy hoạch mà phần sử dụng công cụ chủ yếu phục vụ trong tạo flow báo cáo, code tạo features, code tạo model...
Nhóm “Phân tích dữ liệu” trong các Ban công nghệ
Ưu tiên Background CNTT, CS, KHDL, MIS,… sẽ là yêu cầu tuyển dụng ở các Ban : Công nghệ, Ngân hàng số, dữ liệu,… Các khối này nắm hạ tầng và dữ liệu, chuẩn hóa dữ liệu cho các Ban nghiệp vụ bên trên trc khi sử dụng. Nhóm các vị trí này thường có title là DA/DS/DE. Công việc sẽ va chạm với dữ liệu nhiều hơn và xử lý các vấn đề từ chuẩn hóa, kiến trúc, hạ tầng, triển khai, phân tích cũng có. Tất nhiên các bài toán nó sẽ ko var với các bài toán core của các ban nghiệp vụ bên trên mà chủ yếu mang chức năng hỗ trợ, hoặc nếu nghiệp vụ ko đủ khả năng xử lý bài toán thì sẽ order để các bộ phận chuyên này xử lý. Khá thoải mái và có thể thử nghiệm sử dụng các công nghệ mới, thuật toán hiện đại.
5. Chốt lại lựa chọn trong mảng Phân tích tín dụng
Nếu chọn đường Business (Quản trị Rủi ro, Phân tích Bán lẻ, CS Tín dụng, Thu nợ,...)
Bạn là "Người cầm trịch" cuộc chơi tín dụng. Bạn quyết định luật chơi. Các vấn đề Phân tích ra sẽ trực tiếp được cân nhắc sử dụng, tác động trực tiếp tới quy trình, tính năng, chính sách,... sẽ gần với khách hàng và các bộ phận xử lý nghiệp vụ hơn.
Hạn chế đó là thường không được tự do về mặt công cụ, dữ liệu. Thuật toán của thường loanh quanh ở Logistic Regression, Scorecard truyền thống hoặc Decision Tree cơ bản vì mọi quyết định từ chối cho vay, chính sách lãi suất đều phải giải trình được với thanh tra. Quanh năm làm đi làm lại và theo dõi các chỉ số, bài toán truyền thống. Kỹ năng coding có thể sẽ kém dần, đủ dùng thôi. Có thể phát sinh nhiều các công việc khác ngoài làm việc với dữ liệu.
Áp lực chỉ tiêu doanh số, nợ xấu, sẽ bị réo tên đầu tiên.
Nếu chọn đường Tech (Data Engineer, IT Data, Quản trị Hệ thống Dữ liệu)
Làm việc với các công cụ hiện đại nhất, các thuật toán mới nhưng sẽ đóng vai trò Support để hoạt động tổng thể trở nên mượt mà. Bạn sẽ đứng ngoài các quyết định cốt lõi của tín dụng (Nới room, thắt chặt cho vay bất động sản,...). Bạn sẽ có thời gian research các bài toán mới, công nghệ mới để áp dụng.
Áp lực chạy theo công nghệ, AI,... cần update liên tục.