第一部分 Scala基础
第1节 Scala语言概况
1.1 Scala语言起源
马丁·奥德斯基(Martin Odersky)是编译器及编程的狂热爱好者。
主流JVM的Javac编译器就是马丁·奥德斯基编写出来的,JDK5.0、JDK8.0的编译器就是他写的。
长时间的编程之后,他希望发明一种语言,能够让写程序这样的基础工作变得高效,简单。
当接触到Java语言后,对Java这门语言产生了极大的兴趣,所以决定将函数式编程语言的特点融合到Java中,由此发明了Scala。
1.2 Scala语言特点
Scala是一门以 JVM 为运行环境并将面向对象和函数式编程的最佳特性结合在一起的静态类型编程语言。
Scala源代码会被编译成Java字节码,然后运行于JVM之上,并可以调用现有的Java类库,实现两种语言的无缝互操作的。
- 面向对象
Scala是一种面向对象的语言。 Scala中的每个值都是一个对象,包括基本数据类型(即布尔值、数字等)在内,连函数也是对象。
- 函数式编程
Scala也是一种函数式语言,其函数也能当成值来使用。
Scala中支持高阶函数,允许嵌套多层函数,并支持柯里化。
Scala提供了模式匹配,可以匹配各种情况,比如变量的类型、集合的元素、有值或无值。
- 静态类型
Scala具备类型系统,通过编译时检查,保证代码的安全性和一致性。
- 并发性
Scala使用Actor作为其并发模型,Actor是类似线程的实体。
Actor可以复用线程,因此可以在程序中使用数百万个Actor,而线程只能创建数千个。
1.3 为什么要学Scala
优雅:这是框架设计师第一个要考虑的问题,框架的用户是应用开发程序员,API是否优雅直接影响用户体验。
简洁:Scala语言表达能力强,一行代码抵得上Java多行,开发速度快。
融合大数据生态圈:Hadoop现在是大数据事实标准,(Kafka Spark源码都是用Scala编写的,Spark Flink都支持使用 Scala进行开发)Spark并不是要取代Hadoop,而是要完善Hadoop生态。
第2节 环境准备
Scala官网:https://www.scala-lang.org/
1、下载Scala
2、Windows下安装Scala
3、配置IDEA开发环境
4、REPL
2.1 Windows下环境配置
访问Scala官网下载Scala 2.11.8安装包,下载地址:https://www.scala-lang.org/download/2.11.8.html
下载scala-2.11.8.msi后,点击下一步就可以了(自动配置上环境变量)。 也可以下载 scala-2.11.8.zip,解压后配置上环境变量就可以了。
备注:安装Scala之前,Windows系统需要安装JDK。
2.2 IDEA环境配置
IDEA是 Java 的集成开发环境,要支持Scala开发,需要安装Scala插件;
object HelloWorld {
def main(args: Array[String]): Unit = {
println("Hello World")
}
}
2.3 Scala的REPL
在命令行输入Scala可启动Scala REPL。
REPL 是一个交互式解析器环境,R(read)、E(evaluate) 、P(print)、L(loop) 输入值,交互式解析器会读取输入内容并对它求值,再打印结果,并重复此过程。
第3节 基础语法
基础语法规则:
- 区分大小写 - Scala语言对大小写敏感;
- 类名 - 对于所有的类名的第一个字母要大写。如果需要使用几个单词来构成一个类名,每个单词的第一个字母要大写;比如:ListDemo
- 方法名 - 所有方法名的第一个字母用小写。如果需要使用几个单词来构成方法名,除第一个单词外每个词的第一个字母应大写;比如:getResult
- 程序文件名 - Scala程序文件的后缀名是 .scala,程序文件的名称可以不与对象名称完全匹配。这点与Java有所区别。
- 备注:建议遵循 Java 的惯例,程序文件名称与对象名称匹配;
- main()方法 - Scala程序从main()方法开始处理,这是每一个Scala程序的入口点。main()定义在object中;
标识符。所有Scala组件都需要名称,用于对象、类、变量和方法的名称称为标识符。
关键字不能用作标识符,标识符区分大小写;
标识符以字母或下划线开头,后面可以有更多的字母、数字或下划线;
$字符是Scala中的保留关键字,不能在标识符中使用;
注释。Scala使用了与Java相同的单行和多行注释;
换行符。Scala语句可以用分号作为一行的结束,语句末尾的分号通常可以省略,但是如果一行里有多个语句那么分号是必须的。
小结:
Scala的基础语法与Java比较类似,但是仍然有三点不一样的地方:
1、在Scala中换行符是可以省略的
2、Scala中main方法定义在object中
3、Scala中程序文件名可以不与对象名称相匹配,但是建议仍然遵循Java的规范,二者最好匹配
第4节 常用类型与字面量
Scala和Java一样,有8种数值类型 Byte、Short、Int、Long、Float、Double、Char、Boolean 类型;
和 Java 不同的是 ,这些类型都是类,有自己的属性和方法。
Scala并不刻意的区分基本类型和引用类型。
String 直接引用 Java.lang.String 中的类型,String在需要时能隐式转换为StringOps,因此不需要任何额外的转换,String就可以使用StringOps中的方法。
每一种数据类型都有对应的Rich类型,如RichInt、RichChar等,为基本类型提供了更多的有用操作。
-- StringOps。 //toInt等方法都定义在StringLike中;StringOps实现了StringLike
"11".toInt
1.max(10)
1.min(10)
1.to(10)
1.until(10)
整数字面量。整数字面量有两种形式,十进制与十六进制(0X/0x开头)
-- 十六进制整数字面量
scala> val a = 0xa
a: Int = 10
scala> val a = 0X00FF
a: Int = 255
scala> val magic = 0xcafe
magic: Int = 51966
-- 十进制整数字面量
scala> val dec1 = 255
dec1: Int = 255
scala> val dec1 = 31
dec1: Int = 31
-- Long类型整数字面量
scala> val magic = 0xcafeL
magic: Long = 51966
scala> val long1 = 255L
long1: Long = 255
-- Short 或 Byte 类型,需要明确声明,否则编译器会推断为Int类型
scala> val little: Short = 32767
little: Short = 32767
scala> val littler: Byte = 127
littler: Byte = 127
浮点数字面量
-- 十进制数、可选的小数点、可选的e开头的指数
scala> val big = 3.1415926
big: Double = 3.1415926
scala> val bigger = 3.1415926e1
bigger: Double = 31.415926
-- 浮点数字面量以F/f结尾为Float类型;否则为Double类型;
scala> val litte = 0.31415926f
litte: Float = 0.31415927
scala> val litte = 0.31415926e1F
litte: Float = 3.1415925
字符字面量
scala> val a = 'A'
a: Char = A
-- 用字符的Unicode码来表示。Unicode码前128个字符就是ASCII码
scala> val b = '\u0042'
b: Char = B
-- 转义字符
scala> val mark = '\'
<console>:1: error: unclosed character literal
val mark = '\'
^
scala> val mark = '\\'
mark: Char = \
字符串字面量
scala> val str = "Hello Scala"
str: String = Hello Scala
第5节 类层次结构
Scala中,所有的类,包括值类型和引用类型,都最终继承自一个统一的根类型Any。
Scala中定义了以下三个底层类:
- Any是所有类型共同的根类型,Any是AnyRef和AnyVal的超类
- AnyRef是所有引用类型的超类
- AnyVal是所有值类型的超类
上图中有三个类型需要注意:
- Null是所有引用类型的子类型
-
- Null类只有一个实例对象null。
- null可以赋值给任意引用类型,但是不能赋值给值类型。
- Nothing位于Scala类继承关系的底部,它是其他所有其他类型的子类型
-
- Nothing对泛型结构有用 。比如,空列表Nil的类型就是List[Nothing]
- Nothing的可以给出非正常终止的信号。比如,使用Nothing处理异常
- Unit类型用来标识过程,过程就是没有返回值的方法,Unit类似于Java里的void。Unit只有一个实例()。
-- null 不能赋值给值类型
scala> val i: Int = null
<console>:11: error: an expression of type Null is ineligible for implicit conversion
val i: Int = null
scala> val str: String = null
str: String = null
-- 使用 Nothing 处理异常
val test = false
val thing: Int = if (test) 42 else throw new Exception("ERROR!")
-- Unit类型只有一个实例(),该实例没有实际意义
scala> val a = ()
a: Unit = ()
第6节 值与变量&自动类型推断
Scala当中的声明变量可以使用以下两种方式:
val,值 -- value,用val定义的变量,值是不可变的
var,变量 -- variable,用var定义的变量,值是可变的
在Scala中,鼓励使用val。大多数程序并不需要那么多的var变量。
声明变量时,可以不指定变量的数据类型,编译器会根据赋值内容自动推断当前变量的数据类型。
备注:简单数据类型可以省略,对于复杂的数据类型建议明确声明;
声明变量时,可以将多个变量放在一起声明。
-- val定义的变量不可更改,变量的类型编译器可以进行自动类型推断
val name = "zhangsan"
-- 必要时可以指定数据类型
var name: String = null
-- 可以将多个值或变量放在一起声明
val x, y = 100;
var name, message: String = null
书写时推荐使用:a + b 、1 to 10这种代码风格
Scala 没有提供 ++、-- 操作符,但是可以使用+=、-=
第8节 块表达式和赋值语句
{} 块包含一系列表达式,其结果也是一个表达式,块中最后一个表达式的值就是块的值。
赋值语句返回Unit类型,代表没有值;
val x1 = 1
val y1 = 1
val x2 = 0
val y2 = 0
val distance = {
val dx = x1 - x2
val dy = y1 - y2
math.sqrt(dx*dx + dy*dy)
}
-- 赋值语句的值是Unit类型,不要把它们串接在一起。x的值是什么?
var y = 0
val x = y = 1
第9节 输入和输出
通过readLine 从控制台读取一行输入。
如果要读取数字、Boolean或者字符,可以用readInt、readDouble、readByte、readShort、readLong、 readFloat、readBoolean或者readChar。
print、println、printf 可以将结果输出到屏幕;
-- printf 带有C语言风格的格式化字符串的 printf 函数
printf("Hello, %s! You are %d years old.", "Scala", 18)
第10节 字符串插值器
Scala 提供了三种字符串插值器:
- s 插值器,对内嵌的每个表达式求值,对求值结果调用toString,替换掉字面量中的那些表达式
- f 插值器,它除s插值器的功能外,还能进行格式化输出,在变量后用%指定输出格式,使用 java.util.Formatter 中给出的语法
- raw 插值器,按照字符串原样进行输出
-- s插值器
val subject = "Spark"
val str1 = s"Hello, $subject"
println(str1)
val arr = (1 to 10).toArray
val str2 = s"arr.length = ${arr.length}"
println(str2)
println(s"The answer is ${6*6}")
-- f插值器
val year=2020
val month=6
val day=9 println(s"$year-$month-$day")
-- yyyy-MM-dd,不足2位用0填充
println(f"$year-$month%02d-$day%02d")
-- raw插值器
println("a\nb\tc")
println(raw"a\nb\tc")
println("""a\nb\tc""")
第11节 对象相等性
Java 中可以 == 来比较基本类型和引用类型:
- 对基本类型而言,比较的是值的相等性
- 对引用类型而言,比较的是引用相等性,即两个变量是否指向JVM堆上的同个对象
Scala中,要比较两个基础类型的对象是否相等,可以使用 == 或 !=;
1 == 1
1 != 2
2 == 2
== 或 != 可以比较同一类型的两个对象;
List(1,2,3) == List(1,2,3)
List(1,2,3) != Array(4,5,6)
== 或 != 还可以比较不同类型的两个对象:
2 == 2.0
List(1,2,3) == "Scala"