Implementar um encurtador de URL

12

Os URLs estão ficando muito longos. Portanto, você deve implementar um algoritmo para encurtar uma URL.

Eu. A estrutura de uma URL

Um URL tem duas partes principais: um domínio e um caminho . Um domínio é a parte do URL antes da primeira barra. Você pode assumir que o URL não inclui um protocolo. O caminho é tudo o resto.

ii. O domínio

O domínio de uma URL será algo como: xkcd.com meta.codegolf.stackexcchhannnge.cooom. Cada parte é separada por períodos, por exemplo blag.xkcd.com, as partes são "blag", "xkcd" e "com". Isto é o que você fará com ele:

  • Se contiver mais de duas partes, coloque as duas últimas de lado e concatene a primeira letra do restante das partes.

  • Em seguida, concatenar isso para a primeira letra para a penúltima parte.

  • Adicione um ponto final e a segunda e terceira letra da penúltima parte.

  • Descarte a última parte.

iii. O caminho

O caminho vai ser como: /questions/2140/ /1407/. Como antes, "partes" são separadas por barras. Para cada parte do caminho, faça:

  • Adicione uma barra

  • Se for totalmente composto por dígitos da base dez, interprete-o como um número e converta para um número inteiro da base 36.

  • Caso contrário, adicione a primeira letra da peça.

No final, adicione uma barra.

iv. Misc.

  • Isso é , então o código mais curto vence.
  • O caminho pode estar vazio, mas o URL sempre terminará com uma barra.
  • Não haverá um protocolo (por exemplo http://, file:///)
  • Nunca haverá menos de duas partes no domínio.
  • Aplicam-se brechas padrão.

Exemplos

Em: xkcd.com/72/
Fora:x.kc/20/

Em: math.stackexchange.com/a/2231/
Fora:ms.ta/a/1pz/

Em: hello.org/somecoolcodeintrepreteriijjkk?code=3g3fzsdg32,g2/
Fora:h.el/s/

ev3commander
fonte
No seu último exemplo, o caminho não termina kke tudo o que começa com ?uma string de consulta não deve terminar com uma barra? Além disso, nem todos os URLs terminam com uma barra /, como www.something.com/path. Ou isso é irrelevante para o objetivo deste desafio?
usar o seguinte comando
Isso é irrelevante.
ev3commander

Respostas:

0

Pitão, 93 85 bytes

Lsm@+jkUTGdjb36J<zxz\/KP>zhxz\/=cJ\.pss[mhd<J_2hePJ\.<tePJ2\/;=cK\/sm+?-djkUThdysd\/K

Compilado manualmente para pseudocódigo pitônico:

                z = input()                     # raw, unevaluated
                G = "abcdefghijklmnopqrstuvwxyz"
                k = ""
                T = 10
L               def y(b):                       # define y as base10to36
 sm                 join(map(lambda d:
  @+jkUTGd            (join(range(T),interleave=k)+G)[d],
                                                # the join(..)+G makes "0...9a...z"
  jb36                 convert(b,36)            # returns a list of digit values in base10
J<zxz\/         J = z[:z.index("\/")]           # domain portion
KP>zhxz\/       K = z[1+z.index("\/"):][:-1]    # path portion
=cJ\.           J = J.split(".")                # splits domain into parts
pss[            no_newline_print(join(join[     # 1 join yields a list, the other a string
 mhd<J_2            map(lambda d:d[0],J[:-2]),
 hePJ               J[:-1][-1][1],
 \.                 ".",
 <tePJ2             J[:-1][-1][1:][:2],
 \/                 "\/"
;               ])
=cK\/           K = K.split("\/")
sm              print(join(map(lambda d:
 +?-djkUThdysd\/    "\/"+(d[0] if filterOut(d,join(range(T),interleave=k)) else y(int(d))),
                    # the filter will turn pure number into empty string, which is False
 K                  K)))

Finalmente, a excruciação termina ...

busukxuan
fonte
4

JavaScript (ES6), 149 bytes

u=>u.split`/`.map((p,i)=>i?/^\d+$/.test(p)?(+p).toString(36):p[0]:(d=p.split`.`).slice(0,-1).map((s,j)=>s[l=j,0]).join``+"."+d[l].slice(1,3)).join`/`

Explicação

Eu fiz isso independente da solução da @ Neil, mas acabou parecendo muito semelhante.

u=>
  u.split`/`.map((p,i)=>       // for each part p at index i
    i?                         // if this is not the first part
      /^\d+$/.test(p)?         // if p is only digits
        (+p).toString(36)      // return p as a base-36 number
      :p[0]                    // else return the first letter
    :
      (d=p.split`.`)           // d = domain parts
      .slice(0,-1).map((s,j)=> // for each domain part before the last
        s[l=j,0]               // return the first letter, l = index of last domain part
      ).join``
      +"."+d[l].slice(1,3)     // add the 2 letters as the final domain
  )
  .join`/`                     // output each new part separated by a slash

Teste

user81655
fonte
1

JavaScript ES6, 157 bytes

u=>u.split`/`.map((p,i)=>i?/^\d+$/.test(p)?(+p).toString(36):p[0]:p.split`.`.reverse().map((h,i)=>i--?i?h[0]:h[0]+'.'+h[1]+h[2]:'').reverse().join``).join`/`

Editar: salvou 4 bytes graças a Doᴡɴɢᴏᴀᴛ.

Neil
fonte
Você deve ser capaz de fazer .split('/')e .split('.')em modelos de cordas
Downgoat
@ Doᴡɴɢᴏᴀᴛ Bah, eu lembrei jointambém!
Neil
1

Python 2, 378 365 bytes

Atualizar

Golpeou um pouco. Os ~ 150 bytes para a função base36 são irritantes, mas não consigo me livrar dele até que o python tenha um builtin para isso ...

def b(n):
 a=abs(n);r=[];
 while a :
    r.append('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'[a%36]);a//=36
 if n<0:r.append('-')
 return''.join(reversed(r or'0'))
u=raw_input();P=u.split("/")[0].split(".")
print"".join([p[0] for p in P[0:-2]]+[P[-2][0]]+["."]+list(P[-2])[1:3]+["/"]+[b(int(p))+"/"if p.isdigit()else p[0]+"/" for p in u.split(".")[-1].split("/")[1:-1]])

Versão antiga

def b(n):
 a=abs(n)
 r=[]
 while a:
    r.append('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'[a%36])
    a//=36
 if n<0:r.append('-')
 return''.join(reversed(r or'0'))
u=raw_input()
P=u.split("/")[0].split(".")
s=""
if len(P)>2:
 for p in P[:-2]:s+=p[0]
s+=P[-2][0]+"."+P[0][1:3]
P=u.split(".")[-1].split("/")[1:-1]
for p in P:
 s+="/"+(b(int(p)) if p.isdigit() else p[0])
print s+"/"

Como o Python não possui uma maneira embutida de converter ints em uma base36-String, peguei a implementação do numpy e a joguei para baixo. O descanso é bem direto, vou jogar mais depois do trabalho. Entretanto, sugestões sempre apreciadas!

Denker
fonte
0

Pyhton 2, 336 329 bytes

atualizar

fixo e mais curto graças ao webwarrior

def b(a):
 r=''
 while a:
  r+=chr((range(48,58)+range(65,91))[a%36])
  a//=36
 return ''.join(reversed(r or '0'))
u=raw_input()
P=u.split('/')[0].split('.')
s=''
if len(P)>2:
 for p in P[:-2]: s+=p[0]
s+=P[-2][0]+'.'+P[0][1:3]
P=u.split('.')[-1].split('/')[1:]
for p in P: s+='/'+(b(int(p)) if p.isdigit() else p[0])
print s+'/'

original

A versão da DenkerAffe com alguns mods: manipula corretamente o esquema "foo / bar? Baz", além disso, não há necessidade de maiúsculas e minúsculas na função de conversão base36.

 def b(a):
 r=''
 while a:
  r+=('0123456789ABCDEFGHUKLMNOPQRSTUVWXYZ'[a%36])
  a//=36
 return ''.join(reversed(r or '0'))
u=raw_input()
P=u.split('/')[0].split('.')
s=''
if len(P)>2:
 for p in P[:-2]: s+=p[0]
s+=P[-2][0]+'.'+P[0][1:3]
P=u.split('.')[-1].split('/')[1:]
for p in P: s+='/'+(b(int(p)) if p.isdigit() else p[0])
print s+'/'
Setop
fonte
Não há erro na cadeia de pesquisa, e também toda a linha pode ser mais curto:r+=chr((range(48,58)+range(65,91))[a%36])
webwarrior