如何用Replace Pioneer下载批量网页并合并成一个txt且只保留某行?zhiqiran大侠

大侠,replacepioneer批量下载一系列的网页文本,采用importlist的方式,获取批量的文本,有的300k,有的300多k,我想过滤掉300K及以下的,只批... 大侠,replace pioneer 批量下载一系列的网页文本,采用import list 的方式,获取批量 的文本,有的300k,有 的300多k,我想过滤掉300K及以下的,只批量下载300K以上的文本,并且直接把这些符合条件的文本合并成一个txt文本保存;如果可以,再进一步,只提取这个合并之后 的文本当中包含特定字符“A”和特定字符“:”的行,其余删除。请问该如何操作?@zhiqiran 展开
 我来答
yes___no
2014-12-11 · TA获得超过3153个赞
知道大有可为答主
回答量:1988
采纳率:100%
帮助的人:2070万
展开全部
你好,按文件大小过滤下载不支持。
以下步骤可以用Replace Pioneer 直接把下载的内容中同时包含A和:的行过滤出来,并保存为一个文件。
1. 打开Tools->Batch Runner窗口
2. 点击import list把提前准备好的链接导入
3. 点击Fast Replace按钮
4. 点击add添加规则:
在search输入.*(A.*?:|:.*?A).*即可
在replace输入$match\n即可
完成后点击ok
5. 选中reg exp和extract选项,去掉cross line选项
6. 点击start,并选择output to single file即可
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式