请问python爬取的数据如何将其格式化

以下是部分代码f=open('wechat.txt','r')html=f.read()f.close()user_names=re.finditer('<usernam... 以下是部分代码
f = open('wechat.txt','r')html = f.read()f.close()user_names = re.finditer('<username><!\[CDATA\[(.*?)]]><\\\/username>',html,re.S)user_contentDescs = re.finditer('<contentDesc><!\[CDATA\[(.*?)]><\\\/contentDesc>',html,re.S)titles = re.finditer('<title><!\[CDATA\[(.*?)]]><\\\/title>',html,re.S)
descriptions = re.finditer('<description><!\[CDATA\[(.*?)]]><\\\/description>',html,re.S)
上面四个变量中有每个变量都包含了好多个数据，那么下面我要怎么做才能将它结构化成下面这样：

还请指教展开

 我来答

1个回答

#热议# 发烧为什么不能用酒精擦身体来退烧？

匿名用户
2016-05-16

展开全部

给你贴一下我前一段时间回答的类似问题，用的soup，还有一个用的正则就不贴了，手机不太方便，如下。
import beautifulsoup
import urllib2

def main():

userMainUrl = "你要抓取的地址"
req = urllib2.Request(userMainUrl)
resp = urllib2.urlopen(req)
respHtml = resp.read()
foundLabel = respHtml.findAll("label")

finalL =foundLabel.string

print "biaoti=",finalL
if __name__=="__main__":

main();

PS：如果不会改的话追问一下，回头我用电脑给你写一份

追问

这个label是只要写要抓取内容前面的标签名就行了？

本回答由提问者推荐

已赞过 已踩过<

评论收起

区块城市（广州）科技发展

广告2024-12-26

虚拟与现实的结合，体验虚拟人生，一个去中心化的平行世界，立即拥有你的数字分身无需下载虚拟人生，快速开启元宇宙生涯

www.gzbluedata.com

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

资料下载专题资料下载，不用四处查资料，360文库海量精选资料下载全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com广告

pytho:n | 简体中文网站

pytho:n 下载全系列送编辑器。包含3.13/3.12/3.11/3.10/3.9/3.8/3.7等版本。一键安装，永久使用，安全无毒，无广告无捆绑，专业软件服务商，稳定保障。

python.asiagi.net.cn广告

请问python爬取的数据如何将其格式化

您可能关注的内容

其他类似问题

为你推荐：