如何使用python 连接kafka 并获取数据

 我来答

1个回答

#热议# 在购买新能源车时，要注意哪些？

育知同创教育
2017-11-13 · 百度知道合伙人官方认证企业

育知同创教育

1【专注：Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址：北京市昌平区三旗百汇物美大卖场2层，微信公众号：yuzhitc】

向TA提问

关注

展开全部

连接 kafka 的库有两种类型，一种是直接连接 kafka 的，存储 offset 的事情要自己在客户端完成。还有一种是先连接 zookeeper 然后再通过 zookeeper 获取 kafka 的 brokers 信息， offset 存放在 zookeeper 上面，由 zookeeper 来协调。
我现在使用 samsa 这个 highlevel 库
Producer示例
from kazoo.client import KazooClientfrom samsa.cluster import Clusterzookeeper = KazooClient()zookeeper.start()cluster = Cluster(zookeeper)topic = cluster.topics['topicname']topic.publish('msg')

** Consumer示例 **
from kazoo.client import KazooClientfrom samsa.cluster import Clusterzookeeper = KazooClient()zookeeper.start()cluster = Cluster(zookeeper)topic = cluster.topics['topicname']consumer = topic.subscribe('groupname')for msg in consumer:
print msg

Tip
consumer 必需在 producer 向 kafka 的 topic 里面提交数据后才能连接，否则会出错。
在 Kafka 中一个 consumer 需要指定 groupname ， groue 中保存着 offset 等信息，新开启一个 group 会从 offset 0 的位置重新开始获取日志。
kafka 的配置参数中有个 partition ，默认是 1 ，这个会对数据进行分区，如果多个 consumer 想连接同个 group 就必需要增加 partition , partition 只能大于 consumer 的数量，否则多出来的 consumer 将无法获取到数据。

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

慕课网

广告2024-12-14

AI算法工程师快速提升进阶课CV领域，熟练掌握人脸业务开发以及实际工程中模型的设计，训练和调优。掌握业内主流深度学习模型，并实现与小程序的结合。

coding.imooc.com

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

人力背调数智化【羽山数据】

人民数据确权的员工测评数据产品，客观数据对接权威数据库，多维度交叉验证履历信息

www.yushanshuju.com广告

魔搭社区_人脸识别-中文AI开源社区

文本表示是自然语言处理NLP领域的核心问题，其在很多NLP，信息检索的下游任务中发挥着非常重要的作用。

如何使用python 连接kafka 并获取数据

您可能关注的内容

其他类似问题

为你推荐：