Tarifas de companhias aéreas - Que análise deve ser usada para detectar comportamento competitivo de estabelecimento de preços e correlações de preços?

12

Quero investigar o comportamento de estabelecimento de preços das companhias aéreas - especificamente como as empresas reagem aos preços dos concorrentes.

Como eu diria, meu conhecimento sobre análises mais complexas é bastante limitado. Eu fiz principalmente todos os métodos básicos para reunir uma visão geral dos dados. Isso inclui gráficos simples que já ajudam a identificar padrões semelhantes. Também estou usando o SAS Enterprise 9.4.

No entanto, estou procurando uma abordagem mais baseada em número.

Conjunto de dados

O conjunto de dados (auto) coletados que estou usando contém cerca de ~ 54.000 tarifas. Todas as tarifas eram coletadas em uma janela de 60 dias, diariamente (todas as noites às 00:00).Método de Coleta

n

O não formatado que se parece basicamente com isso: (dados falsos)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

Eu=s-c

  • I e intervalo (dias antes da partida)
  • s e data da tarifa (partida do voo)
  • c e data em que a tarifa foi cobrada

Aqui está um exemplo de conjunto de dados agrupados por I (DaysBeforeDep.) (Dados falsos!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

O que eu vim até agora

Olhando para os gráficos de linha, já posso estimar que várias linhas terão um alto fator de correlação. Por isso, tentei usar a análise de correlação primeiro nos dados agrupados. Mas essa é a maneira correta? Basicamente, eu tento agora fazer correlações nas médias e não nos preços individuais? Existe outra maneira?

Não tenho certeza de qual modelo de regressão se encaixa aqui, pois os preços não se movem de forma linear e parecem não lineares. Eu precisaria ajustar um modelo para cada evolução de preço de uma companhia aérea

PS: Esta é uma parede de texto longa. Se eu precisar esclarecer alguma coisa, me avise. Eu sou novo neste sub.

Alguém tem uma pista? :-)

s1x
fonte

Respostas:

9

Aviso de um ex-analista de Revenue Management da companhia aérea: você pode estar latindo na árvore errada com essa abordagem. Desculpas pela parede de texto a seguir, mas esses dados são muito mais complexos e barulhentos do que podem parecer à primeira vista, por isso, quis fornecer uma breve descrição de como eles são gerados; avisado é precedido.

As tarifas de companhias aéreas têm dois componentes: todas as tarifas reais (completas com as regras tarifárias e o que você tem) que uma companhia aérea tem disponível para uma determinada rota, a maioria das quais é publicada pela Airline Tariff Publishing Company (algumas de uso especial são não, mas essas são a exceção e não a regra) e o gerenciamento de inventário real realizado pela companhia aérea no dia a dia.

As tarifas podem ser enviadas à ATPCO quatro vezes por dia, em intervalos determinados, e quando as companhias aéreas o fizerem, geralmente consistirá em uma mistura de acréscimos, exclusões e modificações das tarifas existentes. Quando uma companhia aérea inicia uma ação de preço (supondo que seus concorrentes não estejam tentando fazer suas próprias manobras aqui), geralmente eles têm que esperar até a próxima atualização para ver se seus concorrentes seguem / respondem. O inverso ocorre quando um concorrente inicia uma ação de preço, pois a companhia aérea precisa esperar até a próxima atualização para poder responder.

Agora, tudo está bem em relação às tarifas, mas o problema é que, como tudo isso está sendo publicado na ATPCO, as tarifas são a melhor coisa para as informações públicas ... todos os seus concorrentes conseguem ver o que você entraram no seu arsenal, portanto, as tentativas de ofuscar não são inéditas, como a publicação de tarifas que nunca serão atribuídas a nenhum inventário, listando todas as tarifas como dia da partida etc.

De muitas maneiras, o molho secreto se resume à alocação real do estoque, ou seja, quantos assentos em cada voo você estará disposto a vender por uma determinada tarifa, e essas informações não estão disponíveis ao público. Você pode obter alguns vislumbres ao obter informações da Web, mas as combinações potenciais de horário / data de partida e regras de tarifa são bastante numerosas e podem rapidamente ultrapassar sua capacidade de acompanhar facilmente.

Normalmente, uma companhia aérea está disposta a vender apenas alguns assentos por uma tarifa muito baixa e as pessoas que se prendem a isso precisam reservar com bastante antecedência, para que as regras da tarifa não os bloqueiem, ou outros viajantes simplesmente batem neles. A companhia aérea estará disposta a vender mais alguns assentos por uma tarifa mais alta, e assim por diante. Eles ficarão felizes em vender todos os assentos pela tarifa mais alta publicada, mas isso geralmente não é viável.

O que você vê com as tarifas cada vez mais altas quanto mais perto do dia da partida é simplesmente o processo natural de reservar os assentos mais baratos, enquanto o estoque restante fica gradualmente mais caro. Claro, existem algumas advertências aqui. O processo de RM é gerenciado ativamente e a intervenção humana é bastante comum, pois a equipe de RM geralmente se esforça para atingir suas metas de receita e maximizar a receita em cada voo. Como tal, os vôos que se enchem rapidamente podem ser "reforçados", fechando as tarifas baixas. Os voos que estão agendando lentamente podem ser "relaxados", alocando mais assentos para tarifas mais baixas.

Há uma constante interação e competição entre as companhias aéreas nessa área, mas é pouco provável que você capture a dinâmica real apenas com a redução de tarifas. Não me interpretem mal, tínhamos essas ferramentas à nossa disposição e, apesar de suas limitações, elas eram bastante valiosas, mas eram apenas uma fonte de dados que alimentava o processo de tomada de decisão. Você precisaria acessar diariamente centenas, senão milhares de decisões operacionais tomadas pelas equipes de RM, além de informações de ponta como elas vêem na época. Se você não conseguir encontrar um parceiro de companhia aérea para trabalhar para obter esses dados, considere fontes de dados alternativas.

Eu recomendo que você obtenha acesso aos dados das tarifas de P&D no Guia oficial da companhia aérea (ou em um de seus concorrentes) e tente usá-lo para sua análise. É baseado em amostras (cerca de 10% de todos os bilhetes vendidos) e agregado em um nível mais alto do que seria ideal, por isso é essencial uma seleção cuidadosa de rotas (eu recomendaria algo com muitas companhias aéreas, voando sem parar várias vezes ao dia, com aeronaves de grande porte), mas é possível obter uma imagem melhor do que realmente foi vendido (tarifa média) e quanto foi vendido (fator de carga), em comparação com o que está disponível para venda em um determinado momento. Usando essas informações, você pode estar em melhor posição para explorar pelo menos os resultados da estratégia de preços das companhias aéreas e fazer suas inferências a partir daí.

habu
fonte
Obrigado pela sua explicação completa. Concordo com você que essa análise baseada apenas em preços é bastante limitada. Isso também inclui regras de tarifa notavelmente (passagens reembolsáveis, estadia mínima etc.) Algumas dessas limitações podem ser superadas através da coleta sempre das mesmas tarifas para tornar a comparação. No entanto, uma informação importante - como você mencionou, está faltando a quantidade de assentos disponíveis (pode haver! = Assentos em um avião) e a quantidade real de bilhetes vendidos.
s1x
O acesso a esses dados é muito limitado e desatualizado (por exemplo, banco de dados 1B do US DOT). Algumas pesquisas, como Clark R. e Vincent N. (2012), o link de preços [...] contingentes de capacidade incluem esses dados e oferecem insights muito melhores. Estou ciente das limitações (espero ;-)) e, como você mencionou, há muito mais informações influenciando os preços. Ainda assim, ao observar um mercado específico, você pode ter uma idéia do que acontece. Você pode ver se há algum comportamento competitivo e diferentes abordagens da estratégia de preços. No entanto, você nunca seria capaz de encontrar a causa.
s1x
1
@ s1x - Eu concordo e gostaria de ter uma alternativa sólida a oferecer, mas, como você aprendeu, os dados detalhados da receita são o segredo mais zelosamente guardado de qualquer companhia aérea. Só queria ter certeza de que você está ciente disso e do que ocorre no processo de geração de dados. Além disso, gosto do que você está tentando fazer e acho que a outra resposta é um passo na direção certa, em termos de técnica. Se eu sugerir, você também pode usar a correlação cruzada entre seus vários TS durante a exploração de dados, pois geralmente é valioso para discernir padrões entre TS vinculados.
habu 21/05
4

Além da análise exploratória de dados (EDA), descritiva e visual, tentaria usar a análise de séries temporais como uma análise mais abrangente e sofisticada . Especificamente, eu realizaria análise de regressão de séries temporais . A análise de séries temporais é um enorme domínio de pesquisa e prática; portanto, se você não estiver familiarizado com os fundamentos, sugiro começar pelo artigo da Wikipedia acima vinculado, procurando gradualmente por tópicos mais específicos e lendo artigos, papéis e livros correspondentes.

Desde análise de séries temporais é um muito popular abordagem, ele é apoiado pela maioria open source e comercial de código fechado ciência dados e estatísticas ambientes (software) , tais como R , Python , SAS , SPSS e muitos outros. Se você deseja usar R para isso, verifique minhas respostas na análise geral de séries temporais e na classificação e agrupamento de séries temporais . Espero que isso seja útil.

Aleksandr Blekh
fonte
Obrigado pela sua resposta @Aleksandr Blekh - realmente apreciado. Vou me aprofundar nisso. Talvez seja uma pergunta estúpida, mas por favor, corrija-me aqui se estiver errado aqui: uma análise de correlação, enquanto estiver usando uma companhia aérea como variável para correlacionar. Os resultados foram convincentes até agora, como algumas companhias aéreas espc. aqueles que tinham acordos de codeshare tinham preços semelhantes. Seriam tais correlações altas, por exemplo: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 Suponho que esses resultados indiquem padrões de preços semelhantes. Com uma análise de regressão, o que eu descobriria?
s1x ​​18/05/19
@ s1x: Você é muito bem-vindo (sinta-se à vontade para votar / aceitar, se você valorizar a resposta e quando tiver reputação suficiente para fazê-lo, é claro). Agora, vamos à sua pergunta. Como eu disse, a análise TS é mais sofisticada e abrangente. Em particular, a regressão de TS, é responsável pela chamada regressão automática e outras complexidades de TS. Portanto, minha sugestão de usar a análise de regressão TS em vez da tradicional mais simples. Além disso, você sempre deve começar com a EDA, independentemente da análise de dados que planeja executar (na verdade, a EDA geralmente altera seus planos).
Aleksandr Blekh