我遇到了一个问题,我是mysql的初学者,我被分配去创建一个从url地址中提取值的查询。所以基本上我有成千上万的url地址,例如'‘,我需要从'://www’到第一个‘/’(本例中是'google.com')提取所有内容,基本上就是域名。这并不是那么简单,有时是http,有时是没有www的'‘等。我在这里,但我感到无助,有什么建议吗?
select distinct SUBSTRING_INDEX(col,'://',0) col from table where length(col) - length(replace(col,
我需要一个通用的脚本/模式来从URL中提取主域名。下面的尝试失败了。
假设我有这个link1,并且需要提取主域名(google.co.uk)而没有子域(邮件)。我制作了这个脚本,它对.co.uk很好,但是对于只有一个顶级域名的网站,比如:.com和.com,它会失败。
是否有更好的方法从任何URL中提取主域名?URL的构造如下:
https://(optional sub-domain)*(domain name with two or three top-level domain name)(optional forward slash followed by text)*
*指的是零次或多
我想按照特定的格式安排使用查询获取的数据。我使用这个查询来获取数据。
SELECT count(*) as number ,SUBSTRING_INDEX(REPLACE(REPLACE(Links, "http://", ""), "www.", ""), '/', 1) AS domain
FROM `encrypt`
WHERE `Folderid`='8'
group by domain
从这个查询中,我得到域字段中的域名,如google.com和rediff.com,我从整个url中提取它