怎么把python 用urllib2爬取的内容 存到数据库中

 我来答
百度网友f036095c5
2015-07-24 · TA获得超过1234个赞
知道小有建树答主
回答量:729
采纳率:83%
帮助的人:636万
展开全部

使用mongodb很简单。

首先安装pymongo:

pip install pymongo

代码实现:用urllib2读取数据,打包成JSON格式插入到mongodb中。

from pymongo import MongoClient
try:
    from urllib2 importurlopen, Request, HTTPError, URLError
except ImportError:
    from urllib.request import urlopen, Request, HTTPError, URLError
result = []
try:
    f = urlopen('http://www.dynamsoft.com', timeout=3)
    while 1:
        tmp = f.read(10240)
        if len(tmp) == 0:
            break
        else:
            result.append(tmp)
    f.close()
except HTTPError, URLError:
    print URLError.code
content = ''.join(result)
post = {"author": "yushulx",
"content": content
}
client = MongoClient()
db = client.test_database
posts = db.posts
posts.insert(post)
print posts.find_one({"author": "yushulx"})
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式