如何用Replace Pioneer下载批量网页并合并成一个txt且只保留某行?zhiqiran大侠
大侠,replacepioneer批量下载一系列的网页文本,采用importlist的方式,获取批量的文本,有的300k,有的300多k,我想过滤掉300K及以下的,只批...
大侠,replace pioneer 批量下载一系列的网页文本,采用import list 的方式,获取批量 的文本,有的300k,有 的300多k,我想过滤掉300K及以下的,只批量下载300K以上的文本,并且直接把这些符合条件的文本合并成一个txt文本保存;如果可以,再进一步,只提取这个合并之后 的文本当中包含特定字符“A”和特定字符“:”的行,其余删除。请问该如何操作?@zhiqiran
展开
1个回答
展开全部
你好,按文件大小过滤下载不支持。
以下步骤可以用Replace Pioneer 直接把下载的内容中同时包含A和:的行过滤出来,并保存为一个文件。
1. 打开Tools->Batch Runner窗口
2. 点击import list把提前准备好的链接导入
3. 点击Fast Replace按钮
4. 点击add添加规则:
在search输入.*(A.*?:|:.*?A).*即可
在replace输入$match\n即可
完成后点击ok
5. 选中reg exp和extract选项,去掉cross line选项
6. 点击start,并选择output to single file即可
以下步骤可以用Replace Pioneer 直接把下载的内容中同时包含A和:的行过滤出来,并保存为一个文件。
1. 打开Tools->Batch Runner窗口
2. 点击import list把提前准备好的链接导入
3. 点击Fast Replace按钮
4. 点击add添加规则:
在search输入.*(A.*?:|:.*?A).*即可
在replace输入$match\n即可
完成后点击ok
5. 选中reg exp和extract选项,去掉cross line选项
6. 点击start,并选择output to single file即可
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询