Estou entrevistando pessoas para uma posição de desenvolvedor / pesquisador de algoritmos em um contexto de estatística / aprendizado de máquina / mineração de dados.
Estou procurando perguntas para determinar, especificamente, a familiaridade, compreensão e fluidez de um candidato com a teoria subjacente, por exemplo, propriedades básicas de expectativa e variação, algumas distribuições comuns etc.
Minha pergunta atual é: "Existe uma quantidade desconhecida que gostaríamos de estimar. Para esse fim, temos os estimadores que, dados , são todos imparciais e independentes, e cada um tem uma variação conhecida , diferente para cada uma. Encontre o estimador ideal que é imparcial e tem variação mínima ".
Eu esperaria que qualquer candidato sério lidasse com isso com facilidade (dado algum tempo para elaborar os cálculos), e, no entanto, estou surpreso com o número de candidatos que supostamente pertencem a campos relevantes que não conseguem fazer o menor progresso possível. Considero, portanto, uma boa pergunta discriminatória. O único problema com esta pergunta é que ela é apenas uma.
Que outras perguntas podem ser usadas para isso? Como alternativa, onde posso encontrar uma coleção dessas perguntas?
fonte
Respostas:
O que você deseja que seu desenvolvedor de estatística faça?
O Exército dos EUA diz "treine você lutará, porque lutará como se tivesse sido treinado". Teste-os sobre o que você deseja que eles façam o dia inteiro. Realmente, você quer que eles "criem valor" ou "ganhem dinheiro" para a empresa.
Boss 101
Pense "mostre-me o dinheiro".
Nota: Se a sua pergunta de manipulação simbólica não se conectar adequadamente ao "dinheiro", você poderá estar fazendo a pergunta errada.
Há três coisas que todo funcionário precisa fazer para ser um funcionário:
Se você não obtiver essas informações sólidas, nenhuma outra resposta será útil.
Se você puder substituí-los por um bom software ou por um adolescente bem treinado, acabará tendo que fazê-lo, e isso lhe custará.
Data 101
O que eles devem ser capazes de fazer:
(regressão / ajuste incluindo modelos lineares, glm, base radial,
equações de diferença), é verdade que "x "(teste de hipóteses), quantas amostras eu preciso (amostra de aceitação), como obtenho o máximo de
dados de algumas experiências baratas / eficientes (desenho estatístico da
experiência) - isenção de responsabilidade, sou engenheiro, não estatístico Você pode perguntar a elas a pergunta "quais são as diferentes tarefas fundamentais e como você testa se o estatístico pode executá-las de maneira eficiente e correta?
Eles devem poder ler de csv, xlsx (excel), SQL e
imagens. (HDF5, Rdata) Se você possui um formato personalizado, eles devem
poder lê-lo e trabalhar com as ferramentas de maneira rápida e
eficiente. Eles devem conhecer a força / fraqueza do formato. O CSV é de uso rápido, sempre presente, protótipo rápido, mas inchado, ineficiente e lento para executar.
pessoas dizem "existem mentiras, malditas mentiras e estatísticas", mas não na minha
empresa. A mesma boa entrada fornece a mesma boa saída. A saída não é um número, é sempre uma decisão de negócios que informa uma
ação técnica e resulta em um resultado de negócios. Testes diferentes podem definir o dial em 5.5 ou 6.5, mas a capacidade está sempre acima de 1,33.
tomadores de decisão e / ou desenvolvedores de minions e / ou eles mesmos em um ano possam
entender com o mínimo de erros. Uma coisa bonita é poder explicar para que sua avó entenda. Esta ( ligação ) é a minha resposta, mas eu gosto.
Zingers analíticos:
Eu acho que perguntas impossíveis são ótimas. Eles são impossíveis por uma razão. Ser capaz de saber se algo é impossível sair do portão é uma coisa boa. Saber por que, ter algumas maneiras de envolvê-lo ou ser capaz de fazer uma pergunta diferente pode ser melhor.
Outras questões de currículo. ( link ) No reddit. ( link ) outros ( link )
BTW: esta foi uma boa pergunta. Talvez eu precise atualizar esta resposta com o tempo.
fonte