pyspark kafka createDirectStream和createStream 区别
2024-08-31 13:08:04
from pyspark.streaming.kafka import KafkaUtils
kafkaStream = KafkaUtils.createStream(streamingContext, \
[ZK quorum], [consumer group id], [per-topic number of Kafka partitions to consume])
from pyspark.streaming.kafka import KafkaUtils
就是参数不一样。其中
directKafkaStream = KafkaUtils.createDirectStream(ssc, [topic], {"metadata.broker.list": brokers})createStream用的
ZK quorum是zk的2181端口。而
createDirectStream用的是kafka进程9092端口。
Kafka的进程ID为9300,占用端口为9092
QuorumPeerMain为对应的zookeeper实例,进程ID为6379,在2181端口监听
所以在运行官方例子时候
一个是
./bin/spark-submit --jars ~/spark-streaming-kafka-0-8-assembly_2.11-2.2.0.jar examples/src/main/python/streaming/direct_kafka_wordcount.py localhost:9092 test
另外一个是:
./bin/spark-submit --jars ~/spark-streaming-kafka-0-8-assembly_2.11-2.2.0.jar examples/src/main/python/streaming/direct_kafka_wordcount.py localhost:2181 test
参考:
https://spark.apache.org/docs/1.6.1/streaming-kafka-integration.html
http://zhangfengzhe.blog.51cto.com/8855103/1556650
最新文章
- 【番外篇】ASP.NET MVC快速入门之免费jQuery控件库(MVC5+EF6)
- merge,join,concat
- 收藏Javascript中常用的55个经典技巧
- va_list使用
- location.href跳转不正确
- salt-master 的配置文件详解
- 用FileInputStream读文件,字节数组接收,不知道文件的大小时怎么办
- notepad++ erlang开发环境设置
- ListView Web 服务器控件概述(MSDN)
- IOS项目集成ShareSDK实现第三方登录、分享、关注等功能(备用)
- Linux回收站[改写rm防止误删文件无法恢复]
- Soy文件生成JS文件 - 一个使用Google soy模板的例子
- 自己主动生成材质Material(Unity3D开发之十九)
- hdu 1698 Just a Hook(线段树基础)
- JQuery选择所有标题的元素
- Spring Security研究(2)-高级web特性
- [JLOI2016] 成绩比较
- day17--模块之time、calendar、datetime、sys、os、os.path、json、pickle、random
- Spring 通过Java代码装配bean
- ffplay源码分析3-代码框架
热门文章
- c:forTokens标签delims截取字符
- c++面向对象程序设计 谭浩强 第三章答案
- Docker容器查看ip地址
- MVC 全局异常处理(适用多人操作)
- C++逐行读取文本文件的正确做法
- MyBatis数据持久化(十一)Mybatis3、Spring4、Struts2整合开发
- Boost Asio(一)初探
- CF992E Nastya and King-Shamans_线段树
- BZOJ 2820 luogu 2257 yy的gcd (莫比乌斯反演)
- [读书笔记] Python数据分析 (五) pandas入门