IntelliJ IDEA开发Spark案例之WordCount非Maven、离线版

教程目录

0x00 教程内容
0x01 新建Scala项目
- - - - 1. 新建Scala项目
      - 2. 项目配置
0x02 编写Scala代码
0x03 打包到服务器执行
0x04 统计结果展示
0xFF 总结

0x00 教程内容

新建Scala项目
编写Scala代码
打包到服务器执行

实验前提：
a. 安装好了windows本地的scala
b. 安装好了IDEA的scala插件
c. 安装好了JDK

0x01 新建Scala项目

1. 新建Scala项目

a. 新建一个Scala项目，先选择Java，然后在右边选择Scala，配置好解压之后的scala包，其他的默认

在这里插入图片描述

b. 如果有提示，可以随便选一个

在这里插入图片描述

2. 项目配置

a. 右击src，建一个包，比如：com.shaonaiyi

在这里插入图片描述

b. 然后编辑项目结构，加入我们的Scala SDK（找到我们win本地的Scala主目录即可）：

在这里插入图片描述

导入之后点击OK

在这里插入图片描述

c. 导入我们的Spark依赖jar包（选择Spark主目录下的jars目录，然后一直OK）：

在这里插入图片描述

0x02 编写Scala代码

1. 新建Scala类

a. 右击包名：com.shaonaiyi，创建Scala Class，然后选择Kind为Object：

在这里插入图片描述

2. 编写WordCount代码

a. 修改Wordcount类为：

package com.shaonaiyi

import org.apache.spark.SparkContext

object Wordcount {

  def main(args: Array[String]): Unit = {

    var sc = new SparkContext("local[2]","Wordcount")
    var file = sc.textFile("spark-wc.iml")
    var wordRDD = file.flatMap(_.split(" ")).map((_,1)).reduceByKey(_ + _).sortBy(_._2)
    wordRDD.foreach(println(_))
  }

}