
python 通过文本中的关键字匹配title的问题
url=["http://www.baidu.coml","http://www.google.com"]f=open("1.txt").read()lst=f.spli...
url=["http://www.baidu.coml","http://www.google.com"]
f=open("1.txt").read()
lst=f.split()
for x in url:
page=urllib2.urlopen(x)
soup=BeautifulSoup(page,fromEncoding='gb2312')
titletag=soup.title.string
for y in lst:
if y in titletag:
print x
报错: if x in soup.titletag.string:
TypeError: 'in <string>' requires string as left operand
我想根据记事本中列出的关键字,来和l列表中url标题进行对比,如果发现记事本中的关键字在url的标题中,就将该url打印出来。假设我记事本中的关键字为“百度”,那么按照我的想法,应该打印www.baidu.com。报错肯定是我代码的问题,我想知道怎么写,错在哪? 展开
f=open("1.txt").read()
lst=f.split()
for x in url:
page=urllib2.urlopen(x)
soup=BeautifulSoup(page,fromEncoding='gb2312')
titletag=soup.title.string
for y in lst:
if y in titletag:
print x
报错: if x in soup.titletag.string:
TypeError: 'in <string>' requires string as left operand
我想根据记事本中列出的关键字,来和l列表中url标题进行对比,如果发现记事本中的关键字在url的标题中,就将该url打印出来。假设我记事本中的关键字为“百度”,那么按照我的想法,应该打印www.baidu.com。报错肯定是我代码的问题,我想知道怎么写,错在哪? 展开
1个回答
展开全部
BeautifulSoup是用unicode保存网页内容的。你看看记事本保存的文件的编码,然后做个转码。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询