Bons livros / artigos sobre pontuação de crédito

11

Estou procurando recomendações de livros sobre pontuação de crédito. Estou interessado em todos os aspectos desse problema, mas principalmente em: 1) Bons recursos. Como construí-los? Quais provaram ser bons? 2) Redes neurais. Sua aplicação ao problema de pontuação de crédito. 3) Escolhi redes neurais, mas também estou interessado em outros métodos.

Nya
fonte
3
Para sua informação, existe todo um site de troca de pilhas dedicado a quant finance .
eykanal

Respostas:

6

Se você é novo no mundo da pontuação, seu primeiro livro deve ser naeem siddiqi sobre pontuação de crédito usando SAS. Se você não participou da aula, vá em frente. O foco principal da classe é o entendimento geral de pontuação e venda de minerador empresarial SAS por milhões de dólares.

Se você precisar de teoria, precisará de uma análise de dados categórica e de uma classe de mineração de dados de uma universidade próxima. Mesmo depois de assistir a essas aulas, você ainda precisará de ajuda.

Atualmente, as técnicas mais populares usadas são

  1. regressão logística
  2. redes neurais
  3. máquinas de vetores de suporte e
  4. florestas aleatórias

agrupamento, análise discriminante, análise fatorial, componentes principais também são obrigatórios.

A pontuação de crédito por Elizabeth Mays também fornecerá uma boa visão geral.

Também participei de uma aula de modelagem de risco de crédito do instituto SAS, o que me ajudou um pouco. É um processo de aprendizado constante e nunca realizado.

As pessoas bayesianas também gostam de seus métodos.

Editar

Eu também esqueci de mencionar. Regressão logística na técnica mais popular por aí e sempre será a que os bancos continuarão usando. É muito difícil vender outros métodos para o pessoal da alta gerência, a menos que seu banco esteja disposto a se importar menos com a compreensão desses métodos e o foco deles permaneça assumindo riscos e gerando dinheiro.

user16789
fonte
Obrigado! Vou esclarecer: estou participando de uma competição on-line, onde o objetivo é prever a probabilidade de inadimplência de um credor. Então 1) Estou livre para escolher qualquer método que eu queira. A competição termina em duas semanas. 2) Não tenho muito tempo para fazer um aprendizado abrangente. e 3) Os dados fornecidos são respostas brutas de agências de crédito em créditos anteriores, por isso estou realmente interessado em extrair recursos não óbvios desses dados.
N14
Além disso, obrigado pela sua resposta, eu definitivamente vou dar uma olhada nas suas referências.
N14
11
O que é essa competição? Posso saber?
Xiaodai
6

Eu trabalho no campo de pontuação de crédito. Embora eu goste de explorar abordagens diferentes, acho que a regressão logística geralmente é boa o suficiente, se não a melhor abordagem. Não examinei os artigos mais recentes sobre o assunto, mas, na maioria dos artigos, você verá que outras abordagens, como o modelo de redes neurais, geralmente não oferecem elevação significativa em termos de poder preditivo (conforme medido por GINI e AR). Além disso, esses modelos tendem a ser muito mais difíceis de entender para um leigo (geralmente os executivos mais seniores não têm formação em estatística), e a abordagem do scorecard usando regressão logística parece oferecer os modelos mais fáceis de explicar. É verdade que a maioria dos scorecards não leva em consideração as interações,

Dito isto, houve recentemente alguns interesses na construção de scorecards usando técnicas de análise de sobrevivência, uma vez que possui algumas vantagens sobre a regressão logística. Ou seja, podemos incorporar mais facilmente fatores macroeconômicos no modelo, podemos usar dados mais recentes na construção do modelo em vez de ter que confiar nos dados há pelo menos 12 meses atrás (como o indicador binário em logística é geralmente definido como padrão dentro do modelo). próximos 12 meses). A esse respeito, minha tese poderia oferecer outra perspectiva, na medida em que explora a criação de scorecards de crédito usando análise de sobrevivência. Eu mostrei como os scorecards de análise de sobrevivência "parecem e se sentem" da mesma forma que os scorecards de regressão logística; portanto, eles podem ser introduzidos sem causar muitos problemas.

Na minha tese, também descrevi o algoritmo ABBA, que é uma nova abordagem para variáveis ​​binning.

https://www.google.com.sg/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDAQFjAA&url=http%3A%2F%2Fftpmirror.your.org%2Fpub%2Fwikimedia%2Fimages 2Fwikipedia% 2Fcommons% 2F2% 2f2f% 2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf & ei = 8D8MUorrJs2Trgf56YCwCQ & USG = AFQjCNGxWRH1naJS4UqH_ckwzTx3GsaP8g & SIG2 = kcEvjUUcn_wT93igxpYYDA & bvm = bv.50768961, d.bmk

Atualização: Não afirmo se minha tese é boa. É apenas outra perspectiva de um profissional em campo.

xiaodai
fonte
11
Isso não parece focado na questão. Sua sugestão concreta é "leia minha tese". Não li e não estou qualificado para avaliá-lo, mas não se qualifica como livro, nem como artigo publicado.
Nick Cox
4
@ Nick A pergunta pede "outros métodos", aos quais esta resposta se refere. Muitas pessoas acham um link para um texto para download útil, talvez até mais do que apenas uma referência. Para um sinalizador anônimo: fornecer um link para o próprio trabalho não é spam. Congratulamo-nos com pesquisadores e outros inovadores aqui e não gostariam de limitar suas habilidades para nos ajudar, exigindo que eles nunca citassem suas próprias contribuições!
whuber
3
Eu entendo o ponto do @ whuber. Também concordo firmemente que citar o próprio trabalho está em ordem. xiaodai: Eu removeria a atualização. O ponto principal do seu post é que vale a pena ler sua tese. Se você não achou, não publicaria. Não é necessário adicionar uma nota de desconfiança ou modéstia.
Nick Cox
3
  • Mencionei o Guide to Credit Scoring in R de D. Sharma no passado e é uma boa referência introdutória sobre abordagens, incluindo regressão logística e métodos baseados em árvore.
  • O guia acima usa os dados de crédito alemães, que possuem um rico conjunto de recursos. Se você procurar o conjunto de dados, encontrará outras abordagens, análises e comparações alternativas que podem ajudar a informar a seleção de recursos e a escolha do modelo para o seu conjunto de dados.
  • As redes neurais são uma escolha justa para um problema de classificação binária como este. No mundo real, também é esperado que um modelo de pontuação de crédito forneça razões pelas quais um pedido de empréstimo (por exemplo) foi rejeitado. Portanto, ajuda a ter um modelo no qual você possa identificar quais recursos no histórico de crédito de uma pessoa resultam em uma baixa pontuação de crédito e fazem com que um aplicativo seja negado. Recursos em abordagens de regressão e baseadas em árvore são mais fáceis de interpretar em comparação com redes neurais. Se você está avaliando apenas o ajuste, NN vale a pena tentar
raninjan
fonte