推广 热搜: 公司  快速  上海  中国  企业    未来  政策  系统  公司2 

Python之Beautiful Soup 4使用实例

   日期:2024-12-25     作者:yx8vi2    caijiyuan   评论:0    移动:http://www78564.xrbh.cn/mobile/news/30541.html
核心提示:Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。
Beautiful Soup 4 官方文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/

Python之Beautiful Soup 4使用实例

一、安装Beautiful Soup

运行cmd,cd切换到python安装目录下的scripts目录,执行命令

二、安装解析器lxml

Beautiful Soup支持Python标准库中的HTML解析器,也支持一些第三方的解析器,推荐用lxml,速度快,文档容错能力强,需要安装。

三、使用实例

下面测试抓取博客园首页一些信息

1、简单信息的抓取

运行结果:

2、抓取首页的导航条信息

 运行结果:

3、抓取网站分类

运行结果:

4、抓取首页的所有随笔信息

运行结果:

本文地址:http://www78564.xrbh.cn/news/30541.html    迅博思语 http://www78564.xrbh.cn/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
标签: 运行 抓取
 
更多>同类最新资讯
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新资讯
点击排行
网站首页  |  二维码  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号