python 提取域名_Python实现从url中提取域名的几种方法

日期：2024-12-16 作者：w6bhht caijiyuan 评论：0 移动：http://www78564.xrbh.cn/mobile/news/30343.html

核心提示：从url中找到域名,首先想到的是用正则，然后寻找相应的类库。用正则解析有很多不完备的地方，url中有域名，域

从url中找到域名,首先想到的是用正则，然后寻找相应的类库。用正则解析有很多不完备的地方，url中有域名，域名后缀一直在不断增加等。通过google查到几种方法，一种是用Python中自带的模块和正则相结合来解析域名，另一种是使第三方用写好的解析模块直接解析出域名。

python 提取域名_Python实现从url中提取域名的几种方法

要解析的url

复制代码代码如下:

urls = ["http://meiwen.me/src/index.html",

"http://1000chi.com/game/index.html",

"http://see.xidian.edu.cn/cpp/html/1429.html",

"https://docs.python.org/2/howto/regex.html",

"""https://www.google.com.hk/search?client=aff-cs-360chromium&hs;=TSj&q;=url%E8%A7%A3%E6%9E%90%E5%9F%9F%E5%90%8Dre&oq;=url%E8%A7%A3%E6%9E%90%E5%9F%9F%E5%90%8Dre&gs;_l=serp.3...74418.86867.0.87673.28.25.2.0.0.0.541.2454.2-6j0j1j1.8.0....0...1c.1j4.53.serp..26.2.547.IuHTj4uoyHg""",

"file:///D:/code/echarts-2.0.3/doc/example/tooltip.html",

"http://api.mongodb.org/python/current/faq.html#is-pymongo-thread-safe",

"https://pypi.python.org/pypi/publicsuffix/",

"http://127.0.0.1:8000"

]

使用urlparse+正则的方式

复制代码代码如下:

import re

from urlparse import urlparse

topHostPostfix = (

'.com','.la','.io','.co','.info','.net','.org','.me','.mobi',

'.us','.biz','.xxx','.ca','.co.jp','.com.cn','.net.cn',

'.org.cn','.mx','.tv','.ws','.ag','.com.ag','.net.ag',

'.org.ag','.am','.asia','.at','.be','.com.br','.net.br',

'.bz','.com.bz','.net.bz','.cc','.com.co','.net.co',

'.nom.co','.de','.es','.com.es','.nom.es','.org.es',

'.eu','.fm','.fr','.gs','.in','.co.in','.firm.in','.gen.in',

'.ind.in','.net.in','.org.in','.it','.jobs','.jp','.ms',

'.com.mx','.nl','.nu','.co.nz','.net.nz','.org.nz',

'.se','.tc','.tk','.tw','.com.tw','.idv.tw','.org.tw',

'.hk','.co.uk','.me.uk','.org.uk','.vg', ".com.hk")

regx = r'[^.]+('+'|'.join([h.replace('.',r'.') for h in topHostPostfix])+')$'

pattern = re.compile(regx,re.IGNORECASE)

print "--"*40

for url in urls:

parts = urlparse(url)

host = parts.netloc

m = pattern.search(host)

res = m.group() if m else host

本文地址：http://www78564.xrbh.cn/news/30343.html 迅博思语 http://www78564.xrbh.cn/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

标签： 解析域名正则

更多>同类最新资讯

0 条相关评论

文章列表

相关文章

最新动态

推荐图文

最新资讯

点击排行

• 惠民贷延期还款会影响分期吗？2025最新解析指南	• 喝普洱茶血脂没降？别再交智商税了！2025实测解
• 玉镯越养越好是真的吗？2025必看解析指南+保养	• 铁岭到大唐不夜城怎么去最省钱？2025最新攻略解
• 中原消费金融逾期不借会有什么后果_解析_攻略｜	• 翡翠镯子表皮纹是怎么回事？如何辨别真伪？2025
• 新奥好彩免费资料大全-精选解释解析落实酷派585	• 589元性价比之王：荣耀Play9C 5G智能手机全面解
• 在智能手机日益普及的今天，我们不难发现许多高	• 随着移动互联网的飞速发展，手机游戏（简称手游

刚出炉！上海崇明成功	枣庄去北京动物园哪里
凤翔区：以文明之笔	火箭队首发5虎，现已
阿卡：人们乐于炒作我	中国版山姆，全部关门
高层大换血，泉州银行	人潮涌入ChinaJoy：国
河源去三亚天涯海角网	缓解焦虑试试这些方
《艳贼》反思：为何希	解锁“苏超顶流”的生