『 项目链接 』:https://github.com/AMTOPA/sitemap_row_show_urls
项目介绍
在向百度提交链接时,或有时想统计网页链接时,需要将sitemap.xml中的链接提取出来并逐行显示。
例如下面样式:
本项目即可实现此功能。
实现代码比较简单,本项目主要使用Python的beautifulsoup4和lxml库。
下载文件
首先访问项目链接
依次点击code-download zip
或者点击release-sitemap_row_show_urls-v1.0.0
然后点击zip文件下载
下载到本地后,解压缩。
使用方法
程序配置
打开文件夹:
先安装必要的库.bat,再双击运行整合链接.bat。
* 第一次使用时需要输入sitemap的链接
输入示例:https://math-enthusiast.top/sitemap.xml
或./sitemap.xml
输入完后会自动生成sitemap_config.txt文件,里面记录刚才输入的sitemap链接,如果输错了,直接在里面修改即可。
之后再次运行整合链接.bat即可。
输出示例
当链接较少时(20及以内)在控制台输出全部链接,同时在当前目录下输出urls.txt文件,里面也有链接数据。
当链接大于20个时,会在控制台输出前20个链接,同时在当前目录下输出urls.txt文件,里面有全部链接数据。
解析失败:
本地sitemap: