Qué hay de nuevo

¡BIENVENIDO AL NUEVO FORO 2.0!

Foro sobre SEO, Compra de tráfico, Black Hat y un marketplace de compra venta y servicios web.

HAZ CLICK AQUÍ PARA VER TODAS LAS NOVEDADES

Regístrate ahora para hacer negocios, compartir aportes ¡y mucho más!

Como sacar el dominio de una cadena?

Registrado
12 Nov 2014
Mensajes
103
Hola amigos tengo algo que hacer y no tengo idea por donde empezar.
Lo que necesito es extraer solo la parte de un enlace que va desde https/http hasta .com/net/etc.. Ahora algunos repiten y solo necesito uno de cada uno.

Ejemplo, Si tengo:

Código:
https://forobeta.com/forums/sjdkfbvkja
https://forobeta.com/forums/skiubdfkjsdb
https://forobeta.com/forums/safbdgjkbg
https://forobeta.com/forums/skdjbfgkjasga
https://forobeta.com/forums/slakdjfnbgjd
https://www.google.com/kjasbfgjkbsfag
https://www.google.com/skfdbgvksjfbgasl
https://www.google.com/nkzjsfbdgkjfsdg
https://www.google.com/ljzsdbfgjkbasdfg
https://www.google.com/klzjbsdfgkabsgk
https://www.facebook.com/ksdjzbfgkjbasfg
https://www.facebook.com/sioudbgjasbfg
https://www.facebook.com/bzisudfbgkjsafhbg
https://www.facebook.com/kzshfdbgkjsgzdfgh
Quiero solo extraer uno de cada y solo la parte de http a .com por ejemplo:

Código:
https://forobeta.com
https://www.google.com
https://www.facebook.com
Si alguien puede ayudar a escribir el codigo sera de mucha ayuda.
 
Registrado
1 Jun 2022
Mensajes
11
No sé en qué lenguaje lo necesitas. Yo sé hacerlo con Python y es bastante fácil usando la librería urllib.parse. Ahí te dejo el código, para sacar solo el domain ("www.facebook.com") y para sacar el domain + el scheme ("https://www.facebook.com). También te he puesto una línea que imprime todos los elementos del enlace por si tienes curiosidad. Las líneas que llevan "#" son comentarios y puedes ignorarlas.

Perdón si está explicado con mucho detalle y comentario, pero no sé qué nivel tienes de programación así que prefiero pasarme de instrucciones y que quede muy claro a ser más parco.

Un saludo.

Python:
from urllib.parse import urlparse
# En la variable url pones el enlace del que quieras sacar el dominio
url = "https://www.facebook.com/ksdjzbfgkjbasfg"
# Esta línea utiliza la librería urlparse para dividir el enlace en sus distintos componentes:
# scheme, netloc, path, params, query y fragment. Te interesa el netloc, que es el dominio sin la parte de https
parsedurl = urlparse(url)
# Esta línea te muestra en la consola el enlace dividido en esas partes
print(parsedurl)
# Esta línea te muestra en la consola el netloc, que para este enlace sería "www.facebook.com"
print(parsedurl.netloc)
# En las dos últimas líneas juntamos el scheme y el netloc, y sacamos el resultado en la consola: "https://www.facebook.com"
domain = parsedurl.scheme + "://" + parsedurl.netloc
print(domain)
 
Arriba