卢鹏博
发布于 2025-06-01 / 23 阅读
1
0

开源项目sitemap_row_show_urls

『 项目链接https://github.com/AMTOPA/sitemap_row_show_urls

项目介绍

在向百度提交链接时,或有时想统计网页链接时,需要将sitemap.xml中的链接提取出来并逐行显示。

例如下面样式:

本项目即可实现此功能。

实现代码比较简单,本项目主要使用Python的beautifulsoup4和lxml库。

下载文件

首先访问项目链接

https://github.com/AMTOPA/sitemap_row_show_urls

依次点击code-download zip

或者点击release-sitemap_row_show_urls-v1.0.0

然后点击zip文件下载

下载到本地后,解压缩。

使用方法

程序配置

打开文件夹:

先安装必要的库.bat,再双击运行整合链接.bat。

* 第一次使用时需要输入sitemap的链接

输入示例:https://math-enthusiast.top/sitemap.xml

或./sitemap.xml

输入完后会自动生成sitemap_config.txt文件,里面记录刚才输入的sitemap链接,如果输错了,直接在里面修改即可。

之后再次运行整合链接.bat即可。

输出示例

当链接较少时(20及以内)在控制台输出全部链接,同时在当前目录下输出urls.txt文件,里面也有链接数据。

当链接大于20个时,会在控制台输出前20个链接,同时在当前目录下输出urls.txt文件,里面有全部链接数据。

解析失败:

本地sitemap:



评论