Eu tenho um repositório com código Ruby e PHP nele.
O Github diz que meu repo é 74,8% PHP e 25,2% Ruby
Eu não entendo como isso pode ser. Quando eu comparo os 2 idiomas no meu projeto:
# Count how many files:
# Ruby
ls | grep ".*\.rb" | wc -l
# returns 10
#PHP
ls | grep ".*\.php" | wc -l
# returns 1
# Count how many lines, words, chars:
# Ruby
cat *.rb | wc
# returns 229, 812, 5303
# PHP
cat *.php | wc
# returns 102, 473, 2760
Ruby sempre parece ter mais.
Estou esquecendo de algo?
Respostas:
O github usa o Linguist para detectar idiomas em um projeto.
Linguista é open source. procure nos arquivos de origem e você encontrará:
em
/bin/linguist
em
/lib/linguist/file_blob.rb
então ele realmente usa tamanhos de arquivo para determinar a porcentagem do idioma.
lembre-se também de que dados binários, arquivos vendidos, arquivos gerados e arquivos que não são de programas são excluídos.
fonte