Como sacar el dominio de una cadena?

Mensajes
103
Puntuación de reacción
0
Hola amigos tengo algo que hacer y no tengo idea por donde empezar.
Lo que necesito es extraer solo la parte de un enlace que va desde https/http hasta .com/net/etc.. Ahora algunos repiten y solo necesito uno de cada uno.

Ejemplo, Si tengo:

Código:
https://forobeta.com/forums/sjdkfbvkja
https://forobeta.com/forums/skiubdfkjsdb
https://forobeta.com/forums/safbdgjkbg
https://forobeta.com/forums/skdjbfgkjasga
https://forobeta.com/forums/slakdjfnbgjd
https://www.google.com/kjasbfgjkbsfag
https://www.google.com/skfdbgvksjfbgasl
https://www.google.com/nkzjsfbdgkjfsdg
https://www.google.com/ljzsdbfgjkbasdfg
https://www.google.com/klzjbsdfgkabsgk
https://www.facebook.com/ksdjzbfgkjbasfg
https://www.facebook.com/sioudbgjasbfg
https://www.facebook.com/bzisudfbgkjsafhbg
https://www.facebook.com/kzshfdbgkjsgzdfgh

Quiero solo extraer uno de cada y solo la parte de http a .com por ejemplo:

Código:
https://forobeta.com
https://www.google.com
https://www.facebook.com

Si alguien puede ayudar a escribir el codigo sera de mucha ayuda.
 
Mensajes
9
Puntuación de reacción
2
No sé en qué lenguaje lo necesitas. Yo sé hacerlo con Python y es bastante fácil usando la librería urllib.parse. Ahí te dejo el código, para sacar solo el domain ("www.facebook.com") y para sacar el domain + el scheme ("https://www.facebook.com). También te he puesto una línea que imprime todos los elementos del enlace por si tienes curiosidad. Las líneas que llevan "#" son comentarios y puedes ignorarlas.

Perdón si está explicado con mucho detalle y comentario, pero no sé qué nivel tienes de programación así que prefiero pasarme de instrucciones y que quede muy claro a ser más parco.

Un saludo.

Python:
from urllib.parse import urlparse
# En la variable url pones el enlace del que quieras sacar el dominio
url = "https://www.facebook.com/ksdjzbfgkjbasfg"
# Esta línea utiliza la librería urlparse para dividir el enlace en sus distintos componentes:
# scheme, netloc, path, params, query y fragment. Te interesa el netloc, que es el dominio sin la parte de https
parsedurl = urlparse(url)
# Esta línea te muestra en la consola el enlace dividido en esas partes
print(parsedurl)
# Esta línea te muestra en la consola el netloc, que para este enlace sería "www.facebook.com"
print(parsedurl.netloc)
# En las dos últimas líneas juntamos el scheme y el netloc, y sacamos el resultado en la consola: "https://www.facebook.com"
domain = parsedurl.scheme + "://" + parsedurl.netloc
print(domain)
 
Arriba