- scala是运行在 JVM 上的多范式编程语言,同时支持
面向对象
和面向函数编程
- 早期scala刚出现的时候,并没有怎么引起重视,随着
Spark
和Kafka
这样基于scala的大数据框架的兴起,scala逐步进入大数据开发者的眼帘。scala的主要优势是它的表达性。 - 官网地址
scala大概是在2003年才正式诞生,而java的诞生可以追溯到1995年
- 开发大数据应用程序(Spark程序、Flink程序)
- 表达能力强,一行代码抵得上Java多行,开发速度快
- 兼容Java,可以访问庞大的Java类库
-
学习如何编写scala代码之前,需要先安装scala编译器以及开发工具
-
scala程序运行需要依赖于Java类库,必须要有**
Java运行环境
**,scala才能正确执行- 要编译运行scala程序需要
jdk ( jvm )
scala编译器(scala SDK)
- 要编译运行scala程序需要
安装JDK 1.8 64位版本,并配置好环境变量
scala SDK是scala语言的编译器,要开发scala程序,必须要先安装SDK
-
访问地址
- https://www.scala-lang.org/download/2.11.8.html
- 下载安装包
scala-2.11.8.zip
- 下载安装包
- https://www.scala-lang.org/download/2.11.8.html
-
在window在配置scala SDK,并配置好环境变量
IDEA默认是不支持scala程序开发,所以需要来安装scala插件来支持scala语言。
- 1、查看IDEA版本
-
2、到IDEA官网下载对应版本的IDEA scala插件
请务必下载IDEA版本一致的scala插件 scala-intellij-bin-2017.2.2.zip
-
3、点击File ,再点击Settings
-
4、添加scala插件后,重启IDEA
-
Scala提供的最重要的一个工具是交互模式(REPL)。
REPL是一个交互式解释器
,可以即时编译、运行代码并返回结果,方便前期做学习和测试 -
REPL
- R(read)、E(evaluate) 、P(print)、L(loop)
-
要
启动scala解释器
,只需要以下几步:- 按住
windows键 + r
- 输入
scala
即可
- 按住
-
退出scala解释器
- 使用
:quit
就可以了
- 使用
-
idea当中创建普通maven工程
新建工程
选择maven工程
填写groupId和Artifact并选择工程存放位置
修改pom.xml添加scala依赖以及编译插件
<dependencies>
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-library</artifactId>
<version>2.11.8</version>
<!-- 如果想要用java -jar 来运行我们打包之后的jar包,则下面这个配置必须注释掉 -->
<!-- <scope>provided</scope>-->
</dependency>
</dependencies>
<build>
<plugins>
<!-- 限制jdk版本插件 -->
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-compiler-plugin</artifactId>
<version>3.0</version>
<configuration>
<source>1.8</source>
<target>1.8</target>
<encoding>UTF-8</encoding>
</configuration>
</plugin>
<!-- 编译scala需要用到的插件 -->
<plugin>
<groupId>net.alchim31.maven</groupId>
<artifactId>scala-maven-plugin</artifactId>
<version>3.2.2</version>
<executions>
<execution>
<goals>
<goal>compile</goal>
<goal>testCompile</goal>
</goals>
</execution>
</executions>
</plugin>
<!-- 项目打包用到的插件 -->
<plugin>
<artifactId>maven-assembly-plugin</artifactId>
<configuration>
<descriptorRefs>
<descriptorRef>jar-with-dependencies</descriptorRef>
</descriptorRefs>
<archive>
<manifest>
<mainClass></mainClass>
</manifest>
</archive>
</configuration>
<executions>
<execution>
<id>make-assembly</id>
<phase>package</phase>
<goals>
<goal>single</goal>
</goals>
</execution>
</executions>
</plugin>
</plugins>
</build>
maven工程添加scala代码保存的source 文件夹
创建scala的workSheet
- 1、语法格式
val/var 变量名称:变量类型 = 初始值
-
其中
val
定义的是不可重新赋值的变量(值不可修改)var
定义的是可重新赋值的变量(值可以修改)
-
ps
- scala中声明变量是变量名称在前,变量类型在后,跟java是正好相反
- scala的语句最后不需要添加分号
-
2、演示
//使用val声明变量,相当于java中的final修饰,不能在指向其他的数据了 val a:Int = 10 //使用var声明变量,后期可以被修改重新赋值 var b:Int = 20 b=100 //scala中的变量的类型可以显式的声明,也可以不声明,如果不显式的声明这会根据变量的值来推断出来变量的类型(scala支持类型推断) val c = 20
-
3、惰性变量
- Scala中使用
关键字lazy
来定义惰性变量,实现延迟加载(懒加载)。 - 惰性变量只能是不可变变量,并且只有在调用惰性变量时,才会去实例化这个变量。
- 语法格式
lazy val 变量名 = 表达式
- Scala中使用
- scala中的类型绝大多数和Java一样
- 数据类型
基础类型 | 类型说明 |
---|---|
Byte | 8位带符号整数 |
Short | 16位带符号整数 |
Int | 32位带符号整数 |
Long | 64位带符号整数 |
Char | 16位无符号Unicode字符 |
String | Char类型的序列(字符串) |
Float | 32位单精度浮点数 |
Double | 64位双精度浮点数 |
Boolean | true或false |
注意下 scala类型与Java的区别
1. scala中所有的类型都使用大写字母开头
2. 整形使用Int而不是Integer
3. scala中定义变量可以不写类型,让scala编译器自动推断
- scala类型层次结构
类型 | 说明 |
---|---|
Any | 所有类型的父类,,它有两个子类AnyRef与AnyVal |
AnyVal | 所有数值类型的父类 |
AnyRef | 所有对象类型(引用类型)的父类 |
Unit | 表示空,Unit是AnyVal的子类,它只有一个的实例(),它类似于Java中的void,但scala要比Java更加面向对象 |
Null | Null是AnyRef的子类,也就是说它是所有引用类型的子类。它的实例是null, 可以将null赋值给任何对象类型 |
Nothing | 所有类型的子类不能直接创建该类型实例,某个方法抛出异常时,返回的就是Nothing类型,因为Nothing是所有类的子类,那么它可以赋值为任何类型 |
- 条件表达式就是if表达式,if表达式可以根据给定的条件是否满足,根据条件的结果(真或假)决定执行对应的操作。scala条件表达式的语法和Java一样。
//定义变量x
scala> val x =1
x: Int = 1
//if表达式
scala> val y =if(x>0) 1 else -1
y: Int = 1
//支持混合类型表达式
scala> val z=if(x>1) 1 else "error"
z: Any = error
//缺失else 相当于 if(x>2) 1 else ()
scala> val m=if(x>2) 1
m: AnyVal = ()
//scala中有个Unit类,用作不返回任何结果的方法的结果类型,相当于Java中的void,Unit只有一个实例值,写成()
scala> val n=if(x>2) 1 else ()
n: AnyVal = ()
//if(xx) else if(xx) val
scala> val k=if(x<0) -1 else if (x==0) 0 else 1
k: Int = 1
+-*/%可以完成和Java中相同的工作,但是有一点区别,他们都是方法。你几乎可以用任何符号来为方法命名。
举例:
scala> 1 + 2
等同于:
scala> 1.+(2)
- 定义变量时用 {} 包含一系列表达式,其中块的最后一个表达式的值就是块的值。
val x=0
val result={
val y=x+10
val z=y+"-hello"
val m=z+"-xichuan"
"over"
}
//result的值就是块表达式的结果
//后期一个方法的返回值不需要加上return,把要返回的结果放在方法的最后一行就可以了
- 在scala解释器中先输入
:paste
,然后写多行代码, 之后按=ctrl+d
结束输入
在scala中,可以使用for和while,但一般推荐使用for表达式,因为for表达式语法更简洁
-
1、语法结构
for (i <- 表达式/数组/集合){ //表达式 }
-
2、演示
- 简单的for循环
//简单的for循环 scala> val nums= 1 to 10 nums: scala.collection.immutable.Range.Inclusive = Range(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) scala> for(i <- nums) println(i) 1 2 3 4 5 6 7 8 9 10
- 双重for循环
//双重for循环 scala> for(i <- 1 to 3; j <- 1 to 3) println(i*10+j) 11 12 13 21 22 23 31 32 33 //双重for循环打印99乘法表 for(i <- 1 to 9; j <- 1 to i){ print(i+"*"+j+"="+i*j+"\t") if(i==j){ println() } } 1*1=1 2*1=2 2*2=4 3*1=3 3*2=6 3*3=9 4*1=4 4*2=8 4*3=12 4*4=16 5*1=5 5*2=10 5*3=15 5*4=20 5*5=25 6*1=6 6*2=12 6*3=18 6*4=24 6*5=30 6*6=36 7*1=7 7*2=14 7*3=21 7*4=28 7*5=35 7*6=42 7*7=49 8*1=8 8*2=16 8*3=24 8*4=32 8*5=40 8*6=48 8*7=56 8*8=64 9*1=9 9*2=18 9*3=27 9*4=36 9*5=45 9*6=54 9*7=63 9*8=72 9*9=81
- 守卫
- 在for表达式中可以添加if判断语句,这个if判断就称为守卫
//语法结构 for(i <- 表达式/数组/集合 if 表达式) { // 表达式 } scala> for(i <- 1 to 10 if i >5) println(i) 6 7 8 9 10
- for推导式
- 在for循环体中,可以使用yield表达式构建出一个集合,我们把使用yield的for表达式称之为推导式
// for推导式:for表达式中以yield开始,该for表达式会构建出一个集合 val v = for(i <- 1 to 5) yield i * 10
- scala中while循环和Java中是一致的
- 语法结构
while(返回值为布尔类型的表达式){
//表达式
}
- 演示
scala> var x = 10
x: Int = 10
scala> while(x >5){
println(x)
x -= 1
}
10
9
8
7
6
在scala当中,函数与方法是两个不同的概念,函数是scala当中的一等公民,scala是一门函数式的编程语言,同时兼顾了面向对象语言的特性。
1、方法与函数的定义方式不同
2、方法可以转换成为函数
3、函数就是对象
4、函数可以作为方法的参数
5、函数可以作为方法的返回值
- 语法
def methodName (参数名:参数类型, 参数名:参数类型) : [return type] = {
// 方法体:一系列的代码
}
示例一:定义一个最标准的方法,且定义方法的返回值类型为Int类型
def hello(first:String,second:Int) :Int = {
second
}
示例二:定义一个方法,且不定义返回值
注意:如果定义的方法没有返回值,那么方法的返回值会做自动推断。根据我们方法的最后一个返回类型来推断我们的方法返回类型
def hello2(first:Int , second:String) ={
//println(first)
//20
}
val hello2Result = hello2(20,"abc")
println( hello2Result)
示例三:定义一个方法,不定义返回值,可以通过自动推断,返回不同类型的值
def hello3(first:Int,second:String) ={
if(first > 10){
first
}else{
second
}
}
val hello3Result = hello3(5,"helloworld")
println(hello3Result)
示例四:定义一个方法,参数给定默认值,如果不传入参数,就使用默认值来代替
def hello4(first:Int = 10,second:String)={
println(first+"\t"+ second)
}
//注意我们在调用方法的时候我们可以通过参数名来指定我们的参数的值
hello4(second="helloworld")
示例五:变长参数,方法的参数个数不定的,类似于java当中的方法的...可变参数
def hello5(first:Int*)={
var result = 0;
for(arg <- first){
result += arg
}
println(result)
}
hello5(10,20,30)
hello5(10,50)
示例六:递归函数。我们可以定义一个方法,使得方法自己调用自己,形成一个递归函数,但是方法的返回值类型必须显示的手动指定
def hello6(first:Int):Int={
if(first <= 1){
1
}else{
first * hello6(first -1)
}
}
val hello6Result = hello6(10)
println(hello6Result)
示例七:定义一个方法,没有显示的指定返回值,那么我们方法当中定义的等号可以省掉
注意:如果省掉了=号,那么这个方法强调的就是一个代码执行的过程
/**
* 定义了一个方法,但是方法的返回值没有显示指定,
* 此时我们就可以省掉方法定义的=号,如果省掉 = 号,
* 那么这个方法强调的是一个过程,代码执行的过程,
* 不会产生任何的返回值
* @param first
*/
def hello7(first:Int){
println(first)
30
}
hello7(20)
示例八:直接通过def定义一个方法
def hello8=10;
val hello8Result = hello8
println(hello8Result)
示例九:如果方法体当中只有一行代码,我们也可以省掉大括号
def hello10(first:Int,second:Int) = first+second
val hello10Result = hello10(10,20)
println(hello10Result)
函数定义的两种形式
第一种形式:
val 函数名 = (参数名1:参数类型1,参数名2:参数类型2) => {函数体}
第二种形式:
val 函数名:(参数类型1,参数类型2) => (返回类型) = {
函数体
}
示例一:定义一个标准函数,使用 =>来进行定义
val func1 =(x:Int,y:Int) =>{
x+y
}
func1(2,8)
示例二:定义匿名函数。也就是我们可以定义一个没有名字的函数
定义一个匿名函数之后,这个函数就没法使用了
(x:Int,y:String) =>{x + y}
示例三:函数定义的另外一种形式,定义一个函数,参数只有一个且是Int类型,返回值也是Int类型
val func3 :Int => Int = {x => x * x }
val func3Result = func3(10)
示例四:定义一个函数,参数值是两个,分别是Int和String,返回值是一个元组,分别是String和Int
val func4:(Int,String) =>(String,Int) ={
(x,y) => (y,x)
}
val func4Result = func4(10,"hello")
println(func4Result)
- 方法是隶属于类或者对象的,在运行时,它是加载到JVM的方法区中
- 可以将函数对象赋值给一个变量,在运行时,它是加载到JVM的堆内存中
函数是一个对象,继承自FunctionN
,函数对象有apply,curried,toString,tupled这些方法,而方法则没有
-
有时候需要将方法转换为函数,作为变量传递,就需要将方法转换为函数
-
使用
_
即可将方法转换为函数 -
示例
scala> def add(x:Int,y:Int)=x+y add: (x: Int, y: Int)Int scala> val a = add _ a: (Int, Int) => Int = <function2>
Scala同时支持可变集合和不可变集合,不可变集合从不可变,可以安全的并发访问。
两个主要的包:
不可变集合:scala.collection.immutable
可变集合: scala.collection.mutable
Scala优先采用不可变集合,对于几乎所有的集合类,Scala都同时提供了可变和不可变的版本。
不可变集合继承层次:
可变集合继承层次:
- scala中数组的概念是和Java类似,可以用数组来存放一组数据
- scala中,有两种数组,一种是定长数组,另一种是变长数组
-
定长数组指的是数组的长度是不允许改变的
-
数组的元素是可以改变的
-
语法
// 通过指定长度定义数组 val/var 变量名 = new Array[元素类型](数组长度) // 用元素直接初始化数组 val/var 变量名 = Array(元素1, 元素2, 元素3...)
-
注意
在scala中,数组的泛型使用[]来指定 使用()来获取元素
-
演示
scala> val a=new Array[Int](10) a: Array[Int] = Array(0, 0, 0, 0, 0, 0, 0, 0, 0, 0) scala> a(0) res19: Int = 0 scala> a(0)=10 scala> a res21: Array[Int] = Array(10, 0, 0, 0, 0, 0, 0, 0, 0, 0) ////////////////////////////////////////////////////////////////// scala> val b =Array("hadoop","spark","hive") b: Array[String] = Array(hadoop, spark, hive)
scala> b(0) res24: String = hadoop
scala> b.length res25: Int = 3
-
变长数组指的是数组的长度是可变的,可以往数组中添加、删除元素
-
创建变长数组,需要提前导入ArrayBuffer类
import scala.collection.mutable.ArrayBuffer
-
语法
- 创建空的ArrayBuffer变长数组
val/var a = ArrayBuffer[元素类型]()
- 创建带有初始元素的ArrayBuffer
val/var a = ArrayBuffer(元素1,元素2,元素3....)
-
演示
//导入ArrayBuffer类型 scala> import scala.collection.mutable.ArrayBuffer import scala.collection.mutable.ArrayBuffer //定义一个长度为0的整型变长数组 scala> val a=ArrayBuffer[Int]() a: scala.collection.mutable.ArrayBuffer[Int] = ArrayBuffer() //定义一个有初始元素的变长数组 scala> val b = ArrayBuffer("hadoop", "storm", "spark") b: scala.collection.mutable.ArrayBuffer[String] = ArrayBuffer(hadoop, storm, spark)
-
变长数组的增删改操作
- 使用
+=
添加元素 - 使用
-=
删除元素 - 使用
++=
追加一个数组到变长数组
- 使用
-
示例
// 定义变长数组 scala> val a = ArrayBuffer("hadoop", "spark", "flink") a: scala.collection.mutable.ArrayBuffer[String] = ArrayBuffer(hadoop, spark, flink) // 追加一个元素 scala> a += "flume" res10: a.type = ArrayBuffer(hadoop, spark, flink, flume) // 删除一个元素 scala> a -= "hadoop" res11: a.type = ArrayBuffer(spark, flink, flume) // 追加一个数组 scala> a ++= Array("hive", "sqoop") res12: a.type = ArrayBuffer(spark, flink, flume, hive, sqoop)
-
可以使用以下两种方式来遍历数组:
- 使用
for表达式
直接遍历数组中的元素 - 使用
索引
遍历数组中的元素
- 使用
-
示例
scala> for(i <- a)println(i)
hadoop
hive
flume
spark
scala> for(i <- 0 to a.length -1 )println(a(i))
hadoop
hive
flume
spark
scala> for(i <- 0 until a.length) println(a(i))
hadoop
hive
flume
spark
//0 until n ——生成一系列的数字,包含0,不包含n
//0 to n ——包含0,也包含n
- scala中的数组封装了丰富的计算操作,将来在对数据处理的时候,不需要我们自己再重新实现。
- 求和——sum方法
- 求最大值——max方法
- 求最小值——min方法
- 排序——sorted方法
- 示例
scala> val array=Array(1,3,4,2,5)
array: Array[Int] = Array(1, 3, 4, 2, 5)
//求和
scala> array.sum
res10: Int = 15
//求最大值
scala> array.max
res11: Int = 5
//求最小值
scala> array.min
res12: Int = 1
//升序
scala> array.sorted
res13: Array[Int] = Array(1, 2, 3, 4, 5)
//降序 reverse 反转
scala> array.sorted.reverse
res14: Array[Int] = Array(5, 4, 3, 2, 1)
- 元组可以用来包含一组不同类型的值。例如:姓名,年龄,性别,出生年月。元组的元素是不可变 的。
-
语法
-
使用括号来定义元组
val/var 元组变量名称 = (元素1, 元素2, 元素3....)
-
使用箭头来定义元素(元组只有两个元素)
val/var 元组 = 元素1->元素2
-
// 可以直接使用括号来定义一个元组
scala> val a = (1, "张三", 20, "北京市")
a: (Int, String, Int, String) = (1,张三,20,北京市)
//使用箭头来定义元素
scala> val b = 1->2
b: (Int, Int) = (1,2)
-
使用
_1、_2、_3....
来访问元组中的元素,_1表示访问第一个元素,依次类推
-
示例
scala> val a = (1, "张三", 20, "北京市")
a: (Int, String, Int, String) = (1,张三,20,北京市)
//获取元组中的第一个元素
scala> a._1
res18: Int = 1
//获取元组中的第二个元素
scala> a._2
res19: String = 张三
//获取元组中的第三个元素
scala> a._3
res20: Int = 20
//获取元组中的第四个元素
scala> a._4
res21: String = 北京市
//不能修改元组中的值
scala> a._4="上海"
<console>:12: error: reassignment to val
a._4="上海"
^
- Map可以称之为映射。它是由键值对组成的集合。scala当中的Map集合与java当中的Map类似,也是key,value对形式的。
- 在scala中,Map也分为不可变Map和可变 Map。
- 定义语法
val/var map = Map(键->值, 键->值, 键->值...) // 推荐,可读性更好
val/var map = Map((键, 值), (键, 值), (键, 值), (键, 值)...)
- 演示
scala> val map1 = Map("zhangsan"->30, "lisi"->40)
map: scala.collection.immutable.Map[String,Int] = Map(zhangsan -> 30, lisi -> 40)
scala> val map2 = Map(("zhangsan", 30), ("lisi", 30))
map: scala.collection.immutable.Map[String,Int] = Map(zhangsan -> 30, lisi -> 30)
// 根据key获取value
scala> map1("zhangsan")
res10: Int = 30
-
可变Map需要手动导入
import scala.collection.mutable.Map
, 定义语法与不可变Map一致。 -
演示
//导包
scala> import scala.collection.mutable.Map
import scala.collection.mutable.Map
//定义可变的map
scala> val map3 = Map("zhangsan"->30, "lisi"->40)
map3: scala.collection.mutable.Map[String,Int] = Map(lisi -> 40, zhangsan -> 30)
//获取zhangsan这个key对应的value
scala> map3("zhangsan")
res26: Int = 30
//给zhangsan这个key重新赋值value
scala> map3("zhangsan")=50
//显示map3
scala> map3
res28: scala.collection.mutable.Map[String,Int] = Map(lisi -> 40, zhangsan -> 50)
- 创建一个可变的map
//导包
scala> import scala.collection.mutable.Map
import scala.collection.mutable.Map
scala> val map = Map("zhangsan"->30, "lisi"->40)
map: scala.collection.mutable.Map[String,Int] = Map(lisi -> 40, zhangsan -> 30)
- 按照key获取value
// 获取zhagnsan的年龄
scala> map("zhangsan")
res10: Int = 30
// 获取wangwu的年龄,如果wangwu不存在,则返回-1 比较友好,避免遇到不存在的key而报错
scala> map.getOrElse("wangwu", -1)
res11: Int = -1
- 修改key对应的value
scala> map("lisi")=50
- 添加key-value键值对
scala> map+=("wangwu" ->35)
res12: map.type = Map(lisi -> 50, zhangsan -> 30, wangwu -> 35)
- 删除key-value键值对
scala> map -="wangwu"
res13: map.type = Map(lisi -> 50, zhangsan -> 30)
- 获取所有的key和所有的value
//获取所有的key
scala> map.keys
res36: Iterable[String] = Set(lisi, zhangsan)
//获取所有的key
scala> map.keySet
res37: scala.collection.Set[String] = Set(lisi, zhangsan)
//获取所有的value
scala> map.values
res38: Iterable[Int] = HashMap(50, 30)
- 遍历map
//第一种遍历
scala> for(k <- map.keys) println(k+" -> " +map(k))
lisi -> 50
zhangsan -> 30
//第二种遍历
scala> for((k,v) <- map) println(k+" -> "+v)
lisi -> 50
zhangsan -> 30
- Set是代表没有重复元素的集合。
- Set具备以下性质:
- 1、元素不重复
- 2、不保证插入顺序
- scala中的set集合也分为两种,一种是不可变集合,另一种是可变集合。
- 语法
//创建一个空的不可变集
val/var 变量名 = Set[类型]()
//给定元素来创建一个不可变集
val/var 变量名 = Set[类型](元素1, 元素2, 元素3...)
- 演示
// 创建set集合
scala> val a = Set(1,1,2,3,4,5)
a: scala.collection.immutable.Set[Int] = Set(5, 1, 2, 3, 4)
// 获取集合的大小
scala> a.size
res0: Int = 5
// 遍历集合
scala> for(i <- a) println(i)
//添加元素生成新的集合
scala> a + 6
res1: scala.collection.immutable.Set[Int] = Set(5, 1, 6, 2, 3, 4)
// 删除一个元素
scala> a - 1
res2: scala.collection.immutable.Set[Int] = Set(5, 2, 3, 4)
// 删除set集合中存在的元素
scala> a -- Set(2,3)
res3: scala.collection.immutable.Set[Int] = Set(5, 1, 4)
// 拼接两个集合
scala> a ++ Set(6,7,8)
res4: scala.collection.immutable.Set[Int] = Set(5, 1, 6, 2, 7, 3, 8, 4)
//求2个Set集合的交集
scala> a & Set(3,4,5,6)
res5: scala.collection.immutable.Set[Int] = Set(5, 3, 4)
//注意:这里对不可变的set集合进行添加删除等操作,对于该集合来说是没有发生任何变化,这里是生成了新的集合,新的集合相比于原来的集合来说发生了变化。
- 要使用可变集,必须要手动导入:
import scala.collection.mutable.Set
- 演示
//导包
scala> import scala.collection.mutable.Set
import scala.collection.mutable.Set
//定义可变的set集合
scala> val set=Set(1,2,3,4,5)
set: scala.collection.mutable.Set[Int] = Set(1, 5, 2, 3, 4)
//添加单个元素
scala> set +=6
res10: set.type = Set(1, 5, 2, 6, 3, 4)
//添加多个元素
scala> set +=(6,7,8,9)
res11: set.type = Set(9, 1, 5, 2, 6, 3, 7, 4, 8)
//添加一个set集合中的元素
scala> set ++=Set(10,11)
res12: set.type = Set(9, 1, 5, 2, 6, 3, 10, 7, 4, 11, 8)
//删除一个元素
scala> set -=11
res13: set.type = Set(9, 1, 5, 2, 6, 3, 10, 7, 4, 8)
//删除多个元素
scala> set -=(9,10)
res15: set.type = Set(1, 5, 2, 6, 3, 7, 4, 8)
//删除一个set子集
scala> set --=Set(7,8)
res19: set.type = Set(1,5, 2, 6, 3, 4)
scala> set.remove(1)
res17: Boolean = true
scala> set
res18: scala.collection.mutable.Set[Int] = Set(5, 2, 6, 3, 4)
-
List是scala中最重要的、也是最常用的数据结构。
-
List具备以下性质:
- 1、可以保存重复的值
- 2、有先后顺序
-
在scala中,也有两种列表,一种是不可变列表、另一种是可变列表
- 不可变列表就是列表的元素、长度都是不可变的
- 语法
- 使用 List(元素1, 元素2, 元素3, ...) 来创建一个不可变列表,语法格式
val/var 变量名 = List(元素1, 元素2, 元素3...)
//使用 Nil 创建一个不可变的空列表
val/var 变量名 = Nil
//使用 :: 方法创建一个不可变列表
val/var 变量名 = 元素1 :: 元素2 :: Nil
- 演示
//创建一个不可变列表,存放以下几个元素(1,2,3,4)
scala> val list1=List(1,2,3,4)
list1: List[Int] = List(1, 2, 3, 4)
//使用Nil创建一个不可变的空列表
scala> val list2=Nil
list2: scala.collection.immutable.Nil.type = List()
//使用 :: 方法创建列表,包含1、2、3三个元素
scala> val list3=1::2::3::Nil
list3: List[Int] = List(1, 2, 3)
-
可变列表就是列表的元素、长度都是可变的。
-
要使用可变列表,先要导入
import scala.collection.mutable.ListBuffer
-
语法
- 使用ListBuffer元素类型 创建空的可变列表,语法结构
val/var 变量名 = ListBuffer[Int]()
- 使用ListBuffer(元素1, 元素2, 元素3...)创建可变列表,语法结构
val/var 变量名 = ListBuffer(元素1,元素2,元素3...)
-
演示
//导包 scala> import scala.collection.mutable.ListBuffer import scala.collection.mutable.ListBuffer //定义一个空的可变列表 scala> val a=ListBuffer[Int]() a: scala.collection.mutable.ListBuffer[Int] = ListBuffer() //定义一个有初始元素的可变列表 scala> val b=ListBuffer(1,2,3,4) b: scala.collection.mutable.ListBuffer[Int] = ListBuffer(1, 2, 3, 4)
//导包
scala> import scala.collection.mutable.ListBuffer
import scala.collection.mutable.ListBuffer
//定义一个可变的列表
scala> val list=ListBuffer(1,2,3,4)
list: scala.collection.mutable.ListBuffer[Int] = ListBuffer(1, 2, 3, 4)
//获取第一个元素
scala> list(0)
res4: Int = 1
//获取第一个元素
scala> list.head
res5: Int = 1
//获取除了第一个元素外其他元素组成的列表
scala> list.tail
res6: scala.collection.mutable.ListBuffer[Int] = ListBuffer(2, 3, 4)
//添加单个元素
scala> list +=5
res7: list.type = ListBuffer(1, 2, 3, 4, 5)
//添加一个不可变的列表
scala> list ++=List(6,7)
res8: list.type = ListBuffer(1, 2, 3, 4, 5, 6, 7)
//添加一个可变的列表
scala> list ++=ListBuffer(8,9)
res9: list.type = ListBuffer(1, 2, 3, 4, 5, 6, 7, 8, 9)
//删除单个元素
scala> list -=9
res10: list.type = ListBuffer(1, 2, 3, 4, 5, 6, 7, 8)
//删除一个不可变的列表存在的元素
scala> list --=List(7,8)
res11: list.type = ListBuffer(1, 2, 3, 4, 5, 6)
//删除一个可变的列表存在的元素
scala> list --=ListBuffer(5,6)
res12: list.type = ListBuffer(1, 2, 3, 4)
//可变的列表转为不可变列表
scala> list.toList
res13: List[Int] = List(1, 2, 3, 4)
//可变的列表转为不可变数组
scala> list.toArray
res14: Array[Int] = Array(1, 2, 3, 4)
- 我们将来使用Spark/Flink的大量业务代码都会使用到函数式编程。
- 下面的这些操作是学习的重点,先来感受下如何进行函数式编程以及它的强大
-
方法描述
foreach(f: (A) ⇒ Unit): Unit
-
方法说明
foreach API 说明 参数 f: (A) ⇒ Unit 接收一个函数对象
函数的输入参数为集合的元素
返回值为空返回值 Unit 空 -
方法实操
scala> val list=List(1,2,3,4)
list: List[Int] = List(1, 2, 3, 4)
//定义一个匿名函数传入到foreach方法中
scala> list.foreach((x:Int)=>println(x))
1
2
3
4
//匿名函数的输入参数类型可以省略,由编译器自动推断
scala> list.foreach(x=>println(x))
1
2
3
4
//当函数参数,只在函数体中出现一次,而且函数体没有嵌套调用时,可以使用下划线来简化函数定 义
scala> list.foreach(println(_))
1
2
3
4
//最简写,直接给定println
scala> list.foreach(println)
1
2
3
4
//很神奇的语法,别害怕,盘它就可以了,后期通过scala语言开发spark、Flink程序非常简洁方便
-
集合的映射操作是将来在编写Spark/Flink用得最多的操作,是我们必须要掌握的掌握。
-
方法描述
def map[B](f: (A) ⇒ B): TraversableOnce[B]
- 方法说明
map方法 | API | 说明 |
---|---|---|
泛型 | [B] | 指定map方法最终返回的集合泛型 |
参数 | f: (A) ⇒ B | 传入一个函数对象 该函数接收一个类型A(要转换的列表元素) 返回值为类型B |
返回值 | TraversableOnce[B] | B类型的集合 |
- 方法实操
//定义一个list集合,实现把内部每一个元素做乘以10,生成一个新的list集合
scala> val list=List(1,2,3,4)
list: List[Int] = List(1, 2, 3, 4)
//定义一个匿名函数
scala> list.map((x:Int)=>x*10)
res21: List[Int] = List(10, 20, 30, 40)
//省略匿名函数参数类型
scala> list.map(x=>x*10)
res22: List[Int] = List(10, 20, 30, 40)
//最简写 用下划线
scala> list.map(_*10)
res23: List[Int] = List(10, 20, 30, 40)
- 映射扁平化也是将来用得非常多的操作,也是必须要掌握的。
- 方法描述
def flatMap[B](f: (A) ⇒ GenTraversableOnce[B]): TraversableOnce[B]
- 方法说明
flatmap方法 | API | 说明 |
---|---|---|
泛型 | [B] | 最终要转换的集合元素类型 |
参数 | f: (A) ⇒ GenTraversableOnce[B] | 传入一个函数对象 函数的参数是集合的元素 函数的返回值是一个集合 |
返回值 | TraversableOnce[B] | B类型的集合 |
- 方法实操
//定义一个List集合,每一个元素中就是一行数据,有很多个单词
scala> val list = List("hadoop hive spark flink", "hbase spark")
list: List[String] = List(hadoop hive spark flink, hbase spark)
//使用flatMap进行偏平化处理,获取得到所有的单词
scala> list.flatMap(x => x.split(" "))
res24: List[String] = List(hadoop, hive, spark, flink, hbase, spark)
//简写
scala> list.flatMap(_.split(" "))
res25: List[String] = List(hadoop, hive, spark, flink, hbase, spark)
// flatMap该方法其本质是先进行了map 然后又调用了flatten
scala> list.map(_.split(" ")).flatten
res26: List[String] = List(hadoop, hive, spark, flink, hbase, spark)
- 过滤符合一定条件的元素
- 方法描述
def filter(p: (A) ⇒ Boolean): TraversableOnce[A]
- 方法说明
filter方法 | API | 说明 |
---|---|---|
参数 | p: (A) ⇒ Boolean | 传入一个函数对象 接收一个集合类型的参数 返回布尔类型,满足条件返回true, 不满足返回false |
返回值 | TraversableOnce[A] | 列表 |
- 方法实操
//定义一个list集合
scala> val list=List(1,2,3,4,5,6,7,8,9,10)
list: List[Int] = List(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
//过滤出集合中大于5的元素
scala> list.filter(x => x >5)
res27: List[Int] = List(6, 7, 8, 9, 10)
//把集合中大于5的元素取出来乘以10生成一个新的list集合
scala> list.filter(_ > 5).map(_ * 10)
res29: List[Int] = List(60, 70, 80, 90, 100)
//通过这个案例,应该是可以感受到scala比java的强大了...
- 在scala集合中,可以使用以下几种方式来进行排序
- sorted默认排序
- sortBy指定字段排序
- sortWith自定义排序
sorted默认排序
//定义一个List集合
scala> val list=List(5,1,2,4,3)
list: List[Int] = List(5, 1, 2, 4, 3)
//默认就是升序
scala> list.sorted
res30: List[Int] = List(1, 2, 3, 4, 5)
-
sortBy指定字段排序
- 根据传入的函数转换后,再进行排序
- 方法描述
def sortBy[B](f: (A) ⇒ B): List[A]
- 方法说明
sortBy方法 API 说明 泛型 [B] 按照什么类型来进行排序 参数 f: (A) ⇒ B 传入函数对象
接收一个集合类型的元素参数
返回B类型的元素进行排序返回值 List[A] 返回排序后的列表 - 方法实操
//定义一个List集合 scala> val list=List("1 hadoop","2 spark","3 flink") list: List[String] = List(1 hadoop, 2 spark, 3 flink) //按照单词的首字母进行排序 scala> list.sortBy(x=>x.split(" ")(1)) res33: List[String] = List(3 flink, 1 hadoop, 2 spark)
-
sortWith自定义排序
- 自定义排序,根据一个函数来进行自定义排序
- 方法描述
def sortWith(lt: (A, A) ⇒ Boolean): List[A]
- 方法说明
sortWith方法 API 说明 参数 lt: (A, A) ⇒ Boolean 传入一个比较大小的函数对象
接收两个集合类型的元素参数
返回两个元素大小,小于返回true,大于返回false返回值 List[A] 返回排序后的列表 - 方法实操
scala> val list = List(2,3,1,6,4,5) a: List[Int] = List(2, 3, 1, 6, 4, 5) //降序 scala> list.sortWith((x,y)=>x>y) res35: List[Int] = List(6, 5, 4, 3, 2, 1) //升序 scala> list.sortWith((x,y)=>x<y) res36: List[Int] = List(1, 2, 3, 4, 5, 6)
- 我们如果要将数据按照分组来进行统计分析,就需要使用到分组方法
- groupBy表示按照函数将列表分成不同的组
- 方法描述
def groupBy[K](f: (A) ⇒ K): Map[K, List[A]]
- 方法说明
groupBy方法 | API | 说明 |
---|---|---|
泛型 | [K] | 分组字段的类型 |
参数 | f: (A) ⇒ K | 传入一个函数对象 接收集合元素类型的参数 返回一个K类型的key,这个key会用来进行分组,相同的key放在一组中 |
返回值 | Map[K, List[A]] | 返回一个映射,K为分组字段,List为这个分组字段对应的一组数据 |
- 方法实操
scala> val a = List("张三"->"男", "李四"->"女", "王五"->"男")
a: List[(String, String)] = List((张三,男), (李四,女), (王五,男))
// 按照性别分组
scala> a.groupBy(_._2)
res0: scala.collection.immutable.Map[String,List[(String, String)]] = Map(男 -> List((张三,男), (王五,男)),
女 -> List((李四,女)))
// 将分组后的映射转换为性别/人数元组列表
scala> res0.map(x => x._1 -> x._2.size)
res3: scala.collection.immutable.Map[String,Int] = Map(男 -> 2, 女 -> 1)
- reduce表示将列表,传入一个函数进行聚合计算
- 方法描述
def reduce[A1 >: A](op: (A1, A1) ⇒ A1): A1
- 方法说明
reduce方法 | API | 说明 |
---|---|---|
泛型 | [A1 >: A] | (下界)A1必须是集合元素类型的子类 |
参数 | op: (A1, A1) ⇒ A1 | 传入函数对象,用来不断进行聚合操作 第一个A1类型参数为:当前聚合后的变量 第二个A1类型参数为:当前要进行聚合的元素 |
返回值 | A1 | 列表最终聚合为一个元素 |
- 方法实操
scala> val a = List(1,2,3,4,5,6,7,8,9,10)
a: List[Int] = List(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
scala> a.reduce((x,y) => x + y)
res5: Int = 55
// 第一个下划线表示第一个参数,就是历史的聚合数据结果
// 第二个下划线表示第二个参数,就是当前要聚合的数据元素
scala> a.reduce(_ + _)
res53: Int = 55
// 与reduce一样,从左往右计算
scala> a.reduceLeft(_ + _)
res0: Int = 55
// 从右往左聚合计算
scala> a.reduceRight(_ + _)
res1: Int = 55
- fold与reduce很像,但是多了一个指定初始值参数
- 方法描述
def fold[A1 >: A](z: A1)(op: (A1, A1) ⇒ A1): A1
- 方法说明
reduce方法 | API | 说明 |
---|---|---|
泛型 | [A1 >: A] | (下界)A1必须是集合元素类型的子类 |
参数1 | z: A1 | 初始值 |
参数2 | op: (A1, A1) ⇒ A1 | 传入函数对象,用来不断进行折叠操作 第一个A1类型参数为:当前折叠后的变量 第二个A1类型参数为:当前要进行折叠的元素 |
返回值 | A1 | 列表最终折叠为一个元素 |
- 方法实操
//定义一个List集合
scala> val a = List(1,2,3,4,5,6,7,8,9,10)
a: List[Int] = List(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
//求和
scala> a.sum
res41: Int = 55
//给定一个初始值,,折叠求和
scala> a.fold(0)(_+_)
res42: Int = 55
scala> a.fold(10)(_+_)
res43: Int = 65
//从左往右
scala> a.foldLeft(10)(_+_)
res44: Int = 65
//从右往左
scala> a.foldRight(10)(_+_)
res45: Int = 65
//fold和foldLet效果一致,表示从左往右计算
//foldRight表示从右往左计算
- 使用函数值作为参数,或者返回值为函数值的“函数”和“方法”,均称之为“高阶函数”。
//定义一个数组
scala> val array=Array(1,2,3,4,5)
array: Array[Int] = Array(1, 2, 3, 4, 5)
//定义一个函数
scala> val func=(x:Int)=>x*10
func: Int => Int = <function1>
//函数作为参数传递到方法中
scala> array.map(func)
res0: Array[Int] = Array(10, 20, 30, 40, 50)
//定义一个数组
scala> val array=Array(1,2,3,4,5)
array: Array[Int] = Array(1, 2, 3, 4, 5)
//定义一个没有名称的函数----匿名函数
scala> array.map(x=>x*10)
res1: Array[Int] = Array(10, 20, 30, 40, 50)
- 方法可以定义多个参数列表,当使用较少的参数列表调用多参数列表的方法时,会产生一个新的函数,该函数接收剩余的参数列表作为其参数。这被称为柯里化。
def getAddress(a:String):(String,String)=>String={
(b:String,c:String)=>a+"-"+b+"-"+c
}
scala> val f1=getAddress("china")
f1: (String, String) => String = <function2>
scala> f1("beijing","tiananmen")
res5: String = china-beijing-tiananmen
//这里就可以这样去定义方法
def getAddress(a:String)(b:String,c:String):String={
a+"-"+b+"-"+c
}
//调用
scala> getAddress("china")("beijing","tiananmen")
res0: String = china-beijing-tiananmen
//之前学习使用的下面这些操作就是使用到了柯里化
List(1,2,3,4).fold(0)(_+_)
List(1,2,3,4).foldLeft(0)(_+_)
List(1,2,3,4).foldRight(0)(_+_)
- 函数里面引用外面类成员变量叫作闭包
var factor=10
val f1=(x:Int) => x*factor
//定义的函数f1,它的返回值是依赖于不在函数作用域的一个变量
//后期必须要要获取到这个变量才能执行
//spark和flink程序的开发中大量的使用到函数,函数的返回值依赖的变量可能都需要进行大量的网络传输获取得到。这里就需要这些变量实现序列化进行网络传输。
- scala是支持面向对象的,也有类和对象的概念。
- 定义一个Customer类,并添加成员变量/成员方法
- 添加一个main方法,并创建Customer类的对象,并给对象赋值,打印对象中的成员,调用成员方法
class Customer {
var name:String = _
var sex:String = _
val registerDate:Date = new Date
def sayHi(msg:String) = {
println(msg)
}
}
object Main {
def main(args: Array[String]): Unit = {
val customer = new Customer
//给对象的成员变量赋值
customer.name = "张三"
customer.sex = "男"
println(s"姓名: ${customer.name}, 性别:${customer.sex}, 注册时间: ${customer.registerDate}")
//对象调用方法
customer.sayHi("你好!")
}
}
- 说明
(1). var name:String = _, _表示使用默认值进行初始化
例如:String类型默认值是null,Int类型默认值是0,Boolean类型默认值是false...
(2). val变量不能使用_来进行初始化,因为val是不可变的,所以必须手动指定一个默认值
(3). main方法必须要放在一个scala的object(单例对象)中才能执行
-
主构造器
- 主构造器是指在类名的后面跟上一系列参数,例如
class 类名(var/val 参数名:类型 = 默认值, var/val 参数名:类型 = 默认值){ // 构造代码块 }
-
辅助构造器
- 在类中使用this来定义,例如
def this(参数名:类型, 参数名:类型) { ... }
-
演示
class Student(val name:String, val age:Int) { val address:String="beijing" // 定义一个参数的辅助构造器 def this(name:String) { // 第一行必须调用主构造器、其他辅助构造器或者super父类的构造器 this(name, 20) } def this(age:Int) { this("某某某", age) } }
-
scala中是没有Java中的静态成员的。如果将来我们需要用到static变量、static方法,就要用到scala中的单例对象object
-
定义object
- 定义单例对象和定义类很像,就是把class换成object
-
演示
- 定义一个工具类,用来格式化日期时间
object DateUtils {
// 在object中定义的成员变量,相当于Java中定义一个静态变量
// 定义一个SimpleDateFormat日期时间格式化对象
val simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm")
// 构造代码
println("构造代码")
// 相当于Java中定义一个静态方法
def format(date:Date) = simpleDateFormat.format(date)
// main是一个静态方法,所以必须要写在object中
def main(args: Array[String]): Unit = {
println { DateUtils.format(new Date()) };
}
}
- 说明
(1). 使用object 单例对象名定义一个单例对象,可以用object作为工具类或者存放常量
(2). 在单例对象中定义的变量,类似于Java中的static成员变量
(3). 在单例对象中定义的方法,类似于Java中的static方法
(4). object单例对象的构造代码可以直接写在花括号中
(5). 调用单例对象的方法,直接使用单例对象名.方法名,访问单例对象的成员变量也是使用单例对象名.变量名
(6). 单例对象只能有一个无参的主构造器,不能添加其他参数
-
在
同一个scala文件,有一个class和object具有同样的名字
=,那么就称这个object是class的伴生对象,class是object的伴生类; -
伴生类和伴生对象的最大特点是,可以相互访问;
-
演示
class ClassObject {
val id = 1
private var name = "xichuan"
def printName(): Unit ={
//在Dog类中可以访问伴生对象Dog的私有属性
println(ClassObject.CONSTANT + name )
}
}
object ClassObject{
//伴生对象中的私有属性
private val CONSTANT = "汪汪汪 : "
def main(args: Array[String]) {
val p = new ClassObject
//访问私有的字段name
p.name = "123"
p.printName()
}
}
- 说明
(1). 伴生类和伴生对象的名字必须是一样的
(2). 伴生类和伴生对象需要在一个scala源文件中
(3). 伴生类和伴生对象可以互相访问private的属性
- 我们之前使用过这种方式来创建一个Array对象。
// 创建一个Array对象
val a = Array(1,2,3,4)
- 这种写法非常简便,不需要再写一个new,然后敲一个空格,再写类名。如何直接使用类名来创建对象呢?
- 查看scala源代码:
-
答案就是:
实现伴生对象的apply方法
-
伴生对象的apply方法用来快速地创建一个伴生类的对象。
-
演示
class Person(var name:String, var age:Int) {
override def toString = s"Person($name, $age)"
}
object Person {
// 实现apply方法
// 返回的是伴生类的对象
def apply(name:String, age:Int): Person = new Person(name, age)
// apply方法支持重载
def apply(name:String):Person = new Person(name, 20)
def apply(age:Int):Person = new Person("某某某", age)
def apply():Person = new Person("某某某", 20)
}
object Main2 {
def main(args: Array[String]): Unit = {
val p1 = Person("张三", 20)
val p2 = Person("李四")
val p3 = Person(100)
val p4 = Person()
println(p1)
println(p2)
println(p3)
println(p4)
}
}
- 说明
(1). 当遇到类名(参数1, 参数2...)会自动调用apply方法,在apply方法中来创建对象
(2). 定义apply时,如果参数列表是空,也不能省略括号(),否则引用的是伴生对象
-
scala和Java一样,如果要运行一个程序,必须有一个main方法。
-
而在Java中main方法是静态的,而在scala中没有静态方法。
-
在scala中,这个main方法必须放在一个object中
-
演示1
object Main1{ def main(args:Array[String]) = { println("hello, scala") } }
-
-
也可以继承自App Trait(特质)
,然后将需要编写在main方法中的代码,写在object的构造方法体内。其本质是调用了Trait这个特质中的main方法。-
演示2
object Main2 extends App { println("hello, scala") }
-
- scala和Java一样,使用extends关键字来实现继承。可以在子类中定义父类中没有的字段和方法,或者重写父类的方法。
示例1:实现简单继承
class Person1 {
var name = "super"
def getName = this.name
}
class Student1 extends Person1
object Main1 {
def main(args: Array[String]): Unit = {
val p1 = new Person1()
val p2 = new Student1()
p2.name = "张三"
println(p2.getName)
}
}
示例2:单例对象实现继承
class Person2 {
var name = "super"
def getName = this.name
}
object Student2 extends Person2
object Main2 {
def main(args: Array[String]): Unit = {
println(Student2.getName)
}
}
- 如果子类要覆盖父类中的一个非抽象方法,必须要使用override关键字
- 可以使用override关键字来重写一个val字段
- 可以使用super关键字来访问父类的成员
示例1:class继承class
class Person3 {
val name = "super"
def getName = name
}
class Student3 extends Person3 {
// 重写val字段
override val name: String = "child"
// 重写getName方法
override def getName: String = "hello, " + super.getName
}
object Main3 {
def main(args: Array[String]): Unit = {
println(new Student3().getName)
}
}
- 我们经常要在代码中进行类型的判断和类型的转换。在Java中,我们可以使用instanceof关键字、以及(类型)object来实现,在scala中如何实现呢?
- scala中对象提供
isInstanceOf
和asInstanceOf
方法。- isInstanceOf判断对象是否为指定类的对象
- asInstanceOf将对象转换为指定类型
Java | Scala | |
---|---|---|
判断对象是否是C类型 | obj instanceof C | obj.isInstanceof[C] |
将对象强转成C类型 | (C ) obj | obj.asInstanceof[C] |
获取类型为T的class对象 | C.class | classOf[C] |
示例
class Person4
class Student4 extends Person4
object Main4 {
def main(args: Array[String]): Unit = {
val s1:Person4 = new Student4
// 判断s1是否为Student4类型
if(s1.isInstanceOf[Student4]) {
// 将s1转换为Student3类型
val s2 = s1.asInstanceOf[Student4]
println(s2)
}
}
}
-
isInstanceOf 只能判断出对象是否为指定类以及其子类的对象,而不能精确的判断出,对象就是指定类的对象。如果要求精确地判断出对象就是指定类的对象,那么就只能使用 getClass 和 classOf 。
-
对象.getClass可以精确获取对象的类型
-
classOf[x]可以精确获取类型
-
使用==操作符就可以直接比较
-
-
示例
class Person5
class Student5 extends Person5
object Student5{
def main(args: Array[String]) {
val p:Person5=new Student5
//判断p是否为Person5类的实例
println(p.isInstanceOf[Person5])//true
//判断p的类型是否为Person5类
println(p.getClass == classOf[Person5])//false
//判断p的类型是否为Student5类
println(p.getClass == classOf[Student5])//true
}
}
-
Java中的访问控制,同样适用于scala,可以在成员前面添加private/protected关键字来控制成员的可见性。但在scala中,
**没有public关键字**,任何没有被标为private或protected的成员都是公共的
。-
**private[this]修饰符**
-
被修饰的成员只能在当前类中被访问。或者可以理解为:
只能通过this.来访问
(在当前类中访问成员会自动添加this.)。 -
示例
class Person6 { // 只有在当前对象中能够访问 private[this] var name = "super" def getName = this.name // 正确! def sayHelloTo(p:Person6) = { println("hello" + p.name) // 报错!无法访问 } } object Person6 { def showName(p:Person6) = println(p.name) // 报错!无法访问 }
-
-
**protected[this]修饰符**
-
被修饰的成员只能在当前类和当前子类中被访问
。也可以理解为:当前类通过**this.访问或者子类通过this.**访问 -
示例
class Person7 { // 只有在当前类以及继承该类的当前对象中能够访问 protected[this] var name = "super" def getName = { // 正确! this.name } def sayHelloTo1(p:Person7) = { // 编译错误!无法访问 println(p.name) } } object Person7 { def sayHelloTo3(p:Person7) = { // 编译错误!无法访问 println(p.name) } } class Student7 extends Person7 { def showName = { // 正确! println(name) } def sayHelloTo2(p:Person7) = { // 编译错误!无法访问 println(p.name) } }
-
-
实例化子类对象,必须要调用父类的构造器
,在scala中,只能在子类的主构造器
中调用父类的构造器- 示例
class Person8(var name:String){
println("name:"+name)
}
// 直接在父类的类名后面调用父类构造器
class Student8(name:String, var clazz:String) extends Person8(name)
object Main8 {
def main(args: Array[String]): Unit = {
val s1 = new Student8("张三", "三年二班")
println(s"${s1.name} - ${s1.clazz}")
}
}
-
如果类的某个成员在当前类中的定义是不包含完整的,它就是一个抽象类
-
不完整定义有两种情况:
- 1.方法没有方法体
- 2.变量没有初始化
-
没有方法体的方法称为抽象方法,没有初始化的变量称为抽象字段。定义抽象类和Java一样,在类前面加上abstract关键字就可以了
-
示例
abstract class Person9(val name:String) {
//抽象方法
def sayHello:String
def sayBye:String
//抽象字段
val address:String
}
class Student9(name:String) extends Person9(name){
//重写抽象方法
def sayHello: String = "Hello,"+name
def sayBye: String ="Bye,"+name
//重写抽象字段
override val address:String ="beijing "
}
object Main9{
def main(args: Array[String]) {
val s = new Student9("tom")
println(s.sayHello)
println(s.sayBye)
println(s.address)
}
}
-
匿名内部类是没有名称的子类,直接用来创建实例对象。Spark的源代码中有大量使用到匿名内部类。
-
示例
abstract class Person10 {
//抽象方法
def sayHello:Unit
}
object Main10 {
def main(args: Array[String]): Unit = {
// 直接用new来创建一个匿名内部类对象
val p1 = new Person10 {
override def sayHello: Unit = println("我是一个匿名内部类")
}
p1.sayHello
}
}
- 特质是scala中代码复用的基础单元
- 它可以将方法和字段定义封装起来,然后添加到类中
- 与类继承不一样的是,类继承要求每个类都只能继承
一个
超类,而一个类可以添加任意数量
的特质。 - 特质的定义和抽象类的定义很像,但它是使用
trait
关键字
-
使用
extends
来继承trait(scala不论是类还是特质,都是使用extends关键字) -
如果要继承多个trait,则使用
with
关键字 -
**示例一:继承单个trait**
trait Logger1 { // 抽象方法 def log(msg:String) } class ConsoleLogger1 extends Logger1 { override def log(msg: String): Unit = println(msg) } object LoggerTrait1 { def main(args: Array[String]): Unit = { val logger = new ConsoleLogger1 logger.log("控制台日志: 这是一条Log") } }
-
**示例二:继承多个trait**
trait Logger2 { // 抽象方法 def log(msg:String) } trait MessageSender { def send(msg:String) } class ConsoleLogger2 extends Logger2 with MessageSender { override def log(msg: String): Unit = println(msg) override def send(msg: String): Unit = println(s"发送消息:${msg}") } object LoggerTrait2 { def main(args: Array[String]): Unit = { val logger = new ConsoleLogger2 logger.log("控制台日志: 这是一条Log") logger.send("你好!") } }
-
和类一样,trait中还可以定义具体的方法。
-
示例
trait LoggerDetail { // 在trait中定义具体方法 def log(msg:String) = println(msg) } class PersonService extends LoggerDetail { def add() = log("添加用户") } object MethodInTrait { def main(args: Array[String]): Unit = { val personService = new PersonService personService.add() } }
-
在trait中,可以混合使用具体方法和抽象方法
-
使用具体方法依赖于抽象方法,而抽象方法可以放到继承trait的子类中实现,这种设计方式也称为模板模式
-
示例
trait Logger3 { // 抽象方法 def log(msg:String) // 具体方法(该方法依赖于抽象方法log def info(msg:String) = log("INFO:" + msg) def warn(msg:String) = log("WARN:" + msg) def error(msg:String) = log("ERROR:" + msg) } class ConsoleLogger3 extends Logger3 { override def log(msg: String): Unit = println(msg) } object LoggerTrait3 { def main(args: Array[String]): Unit = { val logger3 = new ConsoleLogger3 logger3.info("这是一条普通信息") logger3.warn("这是一条警告信息") logger3.error("这是一条错误信息") } }
-
在trait中可以定义具体字段和抽象字段
-
继承trait的子类自动拥有trait中定义的字段
-
字段直接被添加到子类中
-
示例
trait LoggerEx { // 具体字段 val sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm") val INFO = "信息:" + sdf.format(new Date) // 抽象字段 val TYPE:String // 抽象方法 def log(msg:String) } class ConsoleLoggerEx extends LoggerEx { // 实现抽象字段 override val TYPE: String = "控制台" // 实现抽象方法 override def log(msg:String): Unit = print(s"$TYPE$INFO $msg") } object FieldInTrait { def main(args: Array[String]): Unit = { val logger = new ConsoleLoggerEx logger.log("这是一条消息") } }
-
trait还可以混入到
实例对象
中,给对象实例添加额外的行为 -
只有混入了trait的对象才具有trait中的方法,其他的类对象不具有trait中的行为
-
使用with将trait混入到实例对象中
-
示例
trait LoggerMix { def log(msg:String) = println(msg) } class UserService object FixedInClass { def main(args: Array[String]): Unit = { // 使用with关键字直接将特质混入到对象中 val userService = new UserService with LoggerMix userService.log("你好") } }
- scala有一个十分强大的模式匹配机制,可以应用到很多场合。
- java switch case
- switch语句
- 类型查询
- 以及快速获取数据
- 并且scala还提供了样例类,对模式匹配进行了优化,可以快速进行匹配。
//todo:匹配字符串
object CaseDemo01 extends App{
//定义一个数组
val arr=Array("hadoop","zookeeper","spark","storm")
//随机取数组中的一位,使用Random.nextInt
val name = arr(Random.nextInt(arr.length))
println(name)
name match {
case "hadoop" => println("大数据分布式存储和计算框架...")
case "zookeeper" => println("大数据分布式协调服务框架...")
case "spark" => println("大数据分布式内存计算框架...")
//表示以上情况都不满足才会走最后一个
case _ => println("我不认识你")
}
}
//todo:匹配类型
object CaseDemo02 extends App{
//定义一个数组
val arr=Array("hello",1,-2.0,CaseDemo02)
//随机获取数组中的元素
val value=arr(Random.nextInt(arr.length))
println(value)
value match {
case x:Int => println("Int=>"+x)
case y:Double if(y>=0) => println("Double=>"+y)
case z:String => println("String=>"+z)
case _ => throw new Exception("not match exception")
}
}
//匹配数组
object CaseDemo03 extends App{
//匹配数组
val arr=Array(1,3,5)
arr match{
case Array(1,x,y) =>println(x+"---"+y)
case Array(1,_*) =>println("1...")
case Array(0) =>println("only 0")
case _ =>println("something else")
}
}
//匹配集合
object CaseDemo04 extends App{
val list=List(0,3,6)
list match {
case 0::Nil => println("only 0")
case 0::tail => println("0....")
case x::y::z::Nil => println(s"x:$x y:$y z:$z")
case _ => println("something else")
}
}
//匹配元组
object CaseDemo05 extends App{
val tuple=(1,3,5)
tuple match{
case (1,x,y) => println(s"1,$x,$y")
case (2,x,y) => println(s"$x,$y")
case _ => println("others...")
}
}
-
样例类是一种特殊类,它可以用来快速定义一个用于保存数据的类(类似于Java POJO类),
而且它会自动生成apply方法,允许我们快速地创建样例类实例对象
。后面在并发编程和spark、flink这些框架也都会经常使用它。 -
定义样例类
-
语法结构
case class 样例类名(成员变量名1:类型1, 成员变量名2:类型2 ...)
-
-
示例
// 定义一个样例类 // 样例类有两个成员name、age case class CasePerson(name:String, age:Int) // 使用var指定成员变量是可变的 case class CaseStudent(var name:String, var age:Int) object CaseClassDemo { def main(args: Array[String]): Unit = { // 1. 使用new创建实例 val zhagnsan = new CasePerson("张三", 20) println(zhagnsan) // 2. 使用类名直接创建实例 val lisi = CasePerson("李四", 21) println(lisi) // 3. 样例类默认的成员变量都是val的,除非手动指定变量为var类型 //lisi.age = 22 // 编译错误!age默认为val类型 val xiaohong = CaseStudent("小红", 23) xiaohong.age = 24 println(xiaohong) } }
-
样例对象
-
使用case object可以创建样例对象。样例对象是单例的,而且它没有主构造器。样例对象是可序列化的。格式:
case object 样例对象名
-
示例
case class SendMessage(text:String) // 消息如果没有任何参数,就可以定义为样例对象 case object startTask case object PauseTask case object StopTask
-
-
样例类和样例对象结合模式使用
-
示例
case class SubmitTask(id: String, name: String) case class HeartBeat(time: Long) case object CheckTimeOutTask object CaseDemo06 extends App{ val arr = Array(CheckTimeOutTask, HeartBeat(10000), SubmitTask("0001", "task-0001")) arr(Random.nextInt(arr.length)) match { case SubmitTask(id, name) => println(s"id=$id, name=$name") case HeartBeat(time) => println(s"time=$time") case CheckTimeOutTask => println("检查超时") } }
-
-
在Scala中Option类型用样例类来表示可能存在或也可能不存在的值
-
Option类型有2个子类
-
示例
object TestOption { def main(args: Array[String]) { val map = Map("a" -> 1, "b" -> 2) val value: Option[Int] = map.get("b") val v1 =value match { case Some(i) => i case None => 0 } println(v1) //更好的方式 val v2 = map.getOrElse("c", 0) println(v2) } }
-
被包在花括号内
没有match的一组case语句
是一个偏函数 -
它是PartialFunction[A, B]的一个实例,
- A代表输入参数类型
- B代表返回结果类型
- 可以理解为:偏函数是一个参数和一个返回值的函数。
-
示例
object TestPartialFunction { // func1是一个输入参数为Int类型,返回值为String类型的偏函数 val func1: PartialFunction[Int, String] = { case 1 => "一" case 2 => "二" case 3 => "三" case _ => "其他" } def main(args: Array[String]): Unit = { println(func1(1)) val list=List(1,2,3,4,5,6) //使用偏函数操作 val result=list.filter{ case x if x >3 => true case _ => false } println(result) } }
- 来看看下面一段代码
def main(args: Array[String]): Unit = {
val i = 10 / 0
println("你好!")
}
Exception in thread "main" java.lang.ArithmeticException: / by zero
at ForDemo$.main(ForDemo.scala:3)
at ForDemo.main(ForDemo.scala)
- 执行程序,可以看到scala抛出了异常,而且没有打印出来"你好"。说明程序出现错误后就终止了。那怎么解决该问题呢?
-
在scala中,可以使用异常处理来解决这个问题。
- 在Scala里,借用了
模式匹配的思想来做异常的匹配
- 以下为scala中try...catch异常处理的语法格式:
try { // 代码 } catch { case ex:异常类型1 => // 代码 case ex:异常类型2 => // 代码 } finally { // 代码 }
- try中的代码是我们编写的业务处理代码
- 在catch中表示当出现某个异常时,需要执行的代码
- 在finally中,是不管是否出现异常都会执行的代码
- 在Scala里,借用了
-
示例
try { val i = 10 / 0 } catch { case ex: Exception => println(ex.getMessage) } finally { println("我始终都会执行!") }
-
我们也可以在一个方法中,抛出异常。语法格式和Java类似,使用throw new Exception...
-
示例
def main(args: Array[String]): Unit = { throw new Exception("这是一个异常") } Exception in thread "main" java.lang.Exception: 这是一个异常 at ForDemo$.main(ForDemo.scala:3) at ForDemo.main(ForDemo.scala)
-
提取器是从传递给它的对象中提取出构造该对象的参数
。(回想样例类进行模式匹配提取参数) -
scala 提取器是一个带有unapply方法的对象。
unapply方法算是apply方法的反向操作
- unapply接受一个对象,然后从对象中提取值,提取的值通常是用来构造该对象的值。
示例
class Student {
var name:String = _ // 姓名
var age:Int = _ // 年龄
// 实现一个辅助构造器
def this(name:String, age:Int) = {
this()
this.name = name
this.age = age
}
}
object Student {
def apply(name:String, age:Int): Student = new Student(name, age)
// 实现一个解构器
def unapply(arg: Student): Option[(String, Int)] = Some((arg.name, arg.age))
}
object extractor_DEMO {
def main(args: Array[String]): Unit = {
val zhangsan = Student("张三", 20)
zhangsan match {
case Student(name, age) => println(s"姓名:$name 年龄:$age")
case _ => println("未匹配")
}
}
}
- scala和Java一样,类和特质、方法都可以支持泛型。我们在学习集合的时候,一般都会涉及到泛型。
scala> val list1:List[String] = List("1", "2", "3")
list1: List[String] = List(1, 2, 3)
- 在scala中,使用方括号来定义类型参数
-
不考虑泛型的支持
def getMiddle(arr:Array[Int]) = arr(arr.length / 2) def main(args: Array[String]): Unit = { val arr1 = Array(1,2,3,4,5) println(getMiddle(arr1)) }
-
考虑泛型的支持
def getMiddle[A](arr:Array[A]) = arr(arr.length / 2) def main(args: Array[String]): Unit = { val arr1 = Array(1,2,3,4,5) val arr2 = Array("a", "b", "c", "d", "f") println(getMiddle[Int](arr1)) println(getMiddle[String](arr2)) // 简写方式 println(getMiddle(arr1)) println(getMiddle(arr2)) }
- 定义一个Pair类包含2个类型不固定的泛型
示例
// 类名后面的方括号,就表示这个类可以使用两个类型、分别是T和S
// 这个名字可以任意取
class Pair[T, S](val first: T, val second: S)
case class People(var name:String, val age:Int)
object Pair {
def main(args: Array[String]): Unit = {
val p1 = new Pair[String, Int]("张三", 10)
val p2 = new Pair[String, String]("张三", "1988-02-19")
val p3 = new Pair[People, People](People("张三", 20), People("李四", 30))
}
}
在指定泛型类型时,有时需要界定泛型类型的范围,而不是接收任意类型
。比如,要求某个泛型类型,必须是某个类的子类,这样在程序中就可以放心的调用父类的方法,程序才能正常的使用与运行.- scala的上下边界特性允许泛型类型是某个类的子类,或者是某个类的父类
- 1、
U >: T
- 这是类型
下界
的定义,也就是U必须是类型T的父类或者是自己本身。
- 这是类型
- 2、
U <: T
- 这是类型
上界
的定义,也就是U必须是类型T的子类或者是自己本身。
- 这是类型
- 1、
示例一
// 类名后面的指定泛型的范围 ----上界
class Pair1[T <: Person, S <:Person](val first: T, val second: S) {
def chat(msg:String) = println(s"${first.name}对${second.name}说: $msg")
}
class Person(var name:String, val age:Int)
object Pair1 {
def main(args: Array[String]): Unit = {
val p3 = new Pair1[Person,Person](new Person("张三", 20), new Person("李四", 30))
p3.chat("你好啊!")
}
}
//要控制Person只能和Person、Policeman聊天,但是不能和Superman聊天。此时,还需要给泛型添加一个下界。
//上下界
class Pair[T <: Person, S >: Policeman <:Person](val first: T, val second: S) {
def chat(msg:String) = println(s"${first.name}对${second.name}说: $msg")
}
class Person(var name:String, val age:Int)
class Policeman(name:String, age:Int) extends Person(name, age)
class Superman(name:String) extends Policeman(name, -1)
object Pair {
def main(args: Array[String]): Unit = {
// 编译错误:第二个参数必须是Person的子类(包括本身)、Policeman的父类(包括本身)
val p3 = new Pair[Person,Superman](new Person("张三", 20), new Superman("李四"))
p3.chat("你好啊!")
}
}
- 来一个类型转换的问题
class Pair[T](a:T)
object Pair {
def main(args: Array[String]): Unit = {
val p1 = new Pair("hello")
// 编译报错,无法将p1转换为p2
val p2:Pair[AnyRef] = p1
println(p2)
}
}
-
**协变**
class Pair[+T],这种情况是协变。类型B是A的子类型,Pair[B]可以认为是Pair[A]的子类型。这种情况,参数化类型的方向和类型的方向是一致的。
-
**逆变**
class Pair[-T],这种情况是逆变。类型B是A的子类型,Pair[A]反过来可以认为是Pair[B]的子类型。这种情况,参数化类型的方向和类型的方向是相反的。
-
**非变**
class Pair[T]{},这种情况就是非变(默认),类型B是A的子类型,Pair[A]和Pair[B]没有任何从属关系,这种情况和Java是一样的。
-
示例
class Super class Sub extends Super //非变 class Temp1[A](title: String) //协变 class Temp2[+A](title: String) //逆变 class Temp3[-A](title: String) object Covariance_demo { def main(args: Array[String]): Unit = { val a = new Sub() // 没有问题,Sub是Super的子类 val b:Super = a // 非变 val t1:Temp1[Sub] = new Temp1[Sub]("测试") // 报错!默认不允许转换 // val t2:Temp1[Super] = t1 // 协变 val t3:Temp2[Sub] = new Temp2[Sub]("测试") val t4:Temp2[Super] = t3 // 逆变 val t5:Temp3[Super] = new Temp3[Super]("测试") val t6:Temp3[Sub] = t5 } }
-
总结
C[+T]:如果A是B的子类,那么C[A]是C[B]的子类。 C[-T]:如果A是B的子类,那么C[B]是C[A]的子类。 C[T]: 无论A和B是什么关系,C[A]和C[B]没有从属关系。
Scala提供的隐式转换和隐式参数功能,是非常有特色的功能。是Java等编程语言所没有的功能。它可以允许你手动指定,将某种类型的对象转换成其他类型的对象或者是给一个类增加方法。通过这些功能,可以实现非常强大、特殊的功能。
- 隐式转换其核心就是定义一个使用
implicit
关键字修饰的方法 实现把一个原始类转换成目标类,进而可以调用目标类中的方法
所谓的隐式参数,指的是在函数或者方法中,定义一个用implicit修饰的参数,
此时Scala会尝试找到一个指定类型的用implicit修饰的参数,即隐式值,并注入参数。
所有的隐式转换和隐式参数必须定义在一个object中
-
案例一
- 让File类具备RichFile类中的read方法
package com.xichuan.implic_demo import java.io.File import scala.io.Source //todo:隐式转换案例一:让File类具备RichFile类中的read方法 object MyPredef{ //定义一个隐式转换的方法,实现把File转换成RichFile implicit def file2RichFile(file:File)=new RichFile(file) } class RichFile(val file:File){ //读取数据文件的方法 def read():String={ Source.fromFile(file).mkString } } object RichFile{ def main(args: Array[String]): Unit = { //1、构建一个File对象 val file = new File("E:\\aa.txt") //2、手动导入隐式转换 import MyPredef.file2RichFile val data: String = file.read println(data) } }
-
案例二
- 超人变身
package com.xichuan.implic_demo //todo:隐式转换案例二:超人变身 class Man(val name:String) class SuperMan(val name: String) { def heat=print("超人打怪兽") } object SuperMan{ //隐式转换方法 implicit def man2SuperMan(man:Man)=new SuperMan(man.name) def main(args: Array[String]) { val hero=new Man("hero") //Man具备了SuperMan的方法 hero.heat } }
-
案例三
- 一个类隐式转换成具有相同方法的多个类
package com.xichuan.implic_demo //todo:隐式转换案例三(一个类隐式转换成具有相同方法的多个类) class C class A(c:C) { def readBook(): Unit ={ println("A说:好书好书...") } } class B(c:C){ def readBook(): Unit ={ println("B说:看不懂...") } def writeBook(): Unit ={ println("B说:不会写...") } } object AB{ //创建一个类转换为2个类的隐式转换 implicit def C2A(c:C)=new A(c) implicit def C2B(c:C)=new B(c) } object B{ def main(args: Array[String]) { //导包 //1. import AB._ 会将AB类下的所有隐式转换导进来 //2. import AB.C2A 只导入C类到A类的的隐式转换方法 //3. import AB.C2B 只导入C类到B类的的隐式转换方法 import AB._ val c=new C //由于A类与B类中都有readBook(),只能导入其中一个,否则调用共同方法时代码报错 //c.readBook() //C类可以执行B类中的writeBook() c.writeBook() } }
-
案例四
- 员工领取薪水
package com.xichuan.implic_demo //todo:隐式参数案例四:员工领取薪水 object Company{ //在object中定义隐式值 注意:同一类型的隐式值只允许出现一次,否则会报错 implicit val xxx="zhangsan" implicit val yyy=10000.00 //implicit val zzz="lisi" } class Boss { //定义一个用implicit修饰的参数 类型为String //注意参数匹配的类型 它需要的是String类型的隐式值 def callName(implicit name:String):String={ name+" is coming !" } //定义一个用implicit修饰的参数,类型为Double //注意参数匹配的类型 它需要的是Double类型的隐式值 def getMoney(implicit money:Double):String={ " 当月薪水:"+money } } object Boss extends App{ //使用import导入定义好的隐式值,注意:必须先加载否则会报错 import Company.xxx import Company.yyy val boss =new Boss println(boss.callName+boss.getMoney) }