Eu tenho um conjunto de dados contendo dados sobre temperatura, precipitação e produtividade de soja de uma fazenda por 10 anos (2005 - 2014). Gostaria de prever os rendimentos para 2015 com base nesses dados.
Observe que o conjunto de dados possui valores DIARIOS para temperatura e precipitação, mas apenas 1 valor por ano para o rendimento, uma vez que a colheita da colheita ocorre no final da estação de cultivo.
Quero construir uma regressão ou outro modelo baseado em aprendizado de máquina para prever os rendimentos de 2015, com base em um modelo de regressão / algum outro derivado do estudo da relação entre rendimentos e temperatura e precipitação nos anos anteriores.
Estou familiarizado com a realização de aprendizado de máquina usando o scikit-learn. No entanto, não sei como representar esse problema. A parte complicada aqui é que a temperatura e a precipitação são diárias, mas o rendimento é de apenas 1 valor por ano.
Como abordar isso?
fonte
Respostas:
Para iniciantes, você pode prever o rendimento do próximo ano com base nos dados diários do ano anterior. Você pode estimar os parâmetros do modelo considerando os dados de cada ano como um "ponto" e validar o modelo usando a validação cruzada. Você pode estender esse modelo considerando mais do que no ano passado, mas olhe para trás demais e terá problemas para validar seu modelo e super ajuste.
fonte
sklearn.cross_validation
métodos com "Label" no nome, como sklearn.cross_validation.LabelKFold .Você pode usar a Bayesian Belief Network para fazer previsões. Ela é um link para explicação básica. Rede Bayesiana
fonte
Você tem 10 pontos de dados com cada ponto de dados com dimensões 365 (temperatura para cada dia) + 365 (precipitação para cada dia). Idealmente, eu primeiro reduziria dimensões através de métodos de aprendizado de máquina, por exemplo, PCA. Em seguida, use métodos de aprendizado de máquina para criar um modelo de previsão. No entanto, devido ao pequeno conjunto de dados, não acho que as técnicas de aprendizado de máquina sejam apropriadas para o seu problema.
fonte