from pyspark.streaming.kafka import KafkaUtils

 kafkaStream = KafkaUtils.createStream(streamingContext, \
[ZK quorum], [consumer group id], [per-topic number of Kafka partitions to consume])
 from pyspark.streaming.kafka import KafkaUtils
directKafkaStream = KafkaUtils.createDirectStream(ssc, [topic], {"metadata.broker.list": brokers})
就是参数不一样。其中createStream用的ZK quorum是zk的2181端口。而createDirectStream用的是kafka进程9092端口。

Kafka的进程ID为9300,占用端口为9092

QuorumPeerMain为对应的zookeeper实例,进程ID为6379,在2181端口监听

所以在运行官方例子时候

一个是

./bin/spark-submit --jars ~/spark-streaming-kafka-0-8-assembly_2.11-2.2.0.jar examples/src/main/python/streaming/direct_kafka_wordcount.py localhost:9092 test

另外一个是:

./bin/spark-submit --jars ~/spark-streaming-kafka-0-8-assembly_2.11-2.2.0.jar examples/src/main/python/streaming/direct_kafka_wordcount.py localhost:2181 test

参考:

https://spark.apache.org/docs/1.6.1/streaming-kafka-integration.html

http://zhangfengzhe.blog.51cto.com/8855103/1556650

最新文章

  1. 【番外篇】ASP.NET MVC快速入门之免费jQuery控件库(MVC5+EF6)
  2. merge,join,concat
  3. 收藏Javascript中常用的55个经典技巧
  4. va_list使用
  5. location.href跳转不正确
  6. salt-master 的配置文件详解
  7. 用FileInputStream读文件,字节数组接收,不知道文件的大小时怎么办
  8. notepad++ erlang开发环境设置
  9. ListView Web 服务器控件概述(MSDN)
  10. IOS项目集成ShareSDK实现第三方登录、分享、关注等功能(备用)
  11. Linux回收站[改写rm防止误删文件无法恢复]
  12. Soy文件生成JS文件 - 一个使用Google soy模板的例子
  13. 自己主动生成材质Material(Unity3D开发之十九)
  14. hdu 1698 Just a Hook(线段树基础)
  15. JQuery选择所有标题的元素
  16. Spring Security研究(2)-高级web特性
  17. [JLOI2016] 成绩比较
  18. day17--模块之time、calendar、datetime、sys、os、os.path、json、pickle、random
  19. Spring 通过Java代码装配bean
  20. ffplay源码分析3-代码框架

热门文章

  1. c:forTokens标签delims截取字符
  2. c++面向对象程序设计 谭浩强 第三章答案
  3. Docker容器查看ip地址
  4. MVC 全局异常处理(适用多人操作)
  5. C++逐行读取文本文件的正确做法
  6. MyBatis数据持久化(十一)Mybatis3、Spring4、Struts2整合开发
  7. Boost Asio(一)初探
  8. CF992E Nastya and King-Shamans_线段树
  9. BZOJ 2820 luogu 2257 yy的gcd (莫比乌斯反演)
  10. [读书笔记] Python数据分析 (五) pandas入门