1. 新建Maven项目







初始Maven项目完成后,初始的配置(pom.xml)如下:

2. 配置Maven

向项目里新建Spark Core库

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion> <groupId>net.libaoquan</groupId>
<artifactId>TestSpark</artifactId>
<version>1.0-SNAPSHOT</version> <dependencies>
<dependency> <!-- Spark dependency -->
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.11</artifactId>
<version>2.2.1</version>
</dependency>
</dependencies>
</project>

3.新建Java类

新建Java类,写入Spark(Java API)代码:

import org.apache.spark.api.java.*;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.Function; public class TestSparkJava {
public static void main(String[] args) {
String logFile = "D:\\ab.txt";
SparkConf conf = new SparkConf().setMaster("local").setAppName("TestSpark");
JavaSparkContext sc = new JavaSparkContext(conf); JavaRDD<String> logData = sc.textFile(logFile).cache(); long numAs = logData.filter(new Function<String, Boolean>() {
public Boolean call(String s) { return s.contains("0"); }
}).count(); long numBs = logData.filter(new Function<String, Boolean>() {
public Boolean call(String s) { return s.contains("1"); }
}).count(); System.out.println("Lines with 0: " + numAs + ", lines with 1: " + numBs); sc.stop();
}
}

运行项目,结果如下:

最新文章

  1. plain framework 商业版 开发总结2 项目管理器
  2. context理解
  3. 万恶的VS2010 快捷键
  4. mysql memory
  5. JS 经典代码段总结 start from 2016-08-22
  6. Opengl4.5 中文手册—A
  7. java面向对象知识整理(一)
  8. Solr(六)Solr索引数据存放到HDFS下
  9. 学以致用三十六-----弄懂python装饰器
  10. java web 开发手册
  11. 学习CSS布局 - margin: auto;
  12. 【Flex】自定义组件学习
  13. iOS UIFileSharingEnabled
  14. 一个可以代替冗长switch-case的消息分发小框架
  15. redis PUB/SUB(发布/订阅)
  16. react中手动重置redux
  17. luogu1117 [NOI2016]优秀的拆分
  18. centos6.9 安装完xampp 7.2.0后,执行/opt/lampp/lampp报错
  19. vue项目 dev正常 build发生错误
  20. react+node制作在线笔记本(一)

热门文章

  1. 更改Apache默认起始(索引)页面:DirectoryIndex
  2. 离线安装Cloudera Manager 5和CDH5(最新版5.9.3) 完全教程(一)环境说明
  3. CentOS7创建本地YUM源的三种方法
  4. MetaMask/provider-engine-2-代码
  5. CentOS7服务器上部署深度/机器学习环境推荐首选anaconda3
  6. [浅谈CSS核心概念] CSS布局模型:float和position
  7. rpm yum apt-get redhat centos ubuntu
  8. UWP ListView 绑定 单击 选中项 颜色
  9. 网络对抗技术 2017-2018-2 20152515 Exp3 免杀原理与实践
  10. 20155235 《网络攻防》 实验五 MSF基础应用