数字文本处理技术
文本是人们通信的主要方式。在计算机中,文字是人与计算机之间信息交换的主要媒体,文字用二进制编码表示,也就是使用不同的编码来代表不同的文字。文本是各种文字的集合,是使用最多的一种符号媒体形式,是人与计算机交互作用的主要形式。文本是计算机文字处理程序的基础,也是多媒体应用程序的基础。常用的文本文件格式有TXT、RTF、DOC以及DOT等。
在制作多媒体作品时,虽然常用的多媒体制作软件中都有文字编辑功能,但对于大量的文字信息一般不在集成时输入,而是预先在字处理软件中输入所需的文字信息后,再将其导入到多媒体制作软件中,这时就需要考虑文件的格式,因为有些多媒体制作软件可能不支持该种类型的格式,导致文件无法导入。在多媒体作品中,文本除了以文字的形式存在,还会以图像的形式存在,这种形式多用于需要将文字以特殊效果表现出来,且在多媒体集成软件中又较难实现的情况
文本输入方法
用计算机生成一个电子文本,首先要将字符输入到计算机中,就要使用字符输入法,输入字符的方法有人工输入和自动识别输入两类。
- 人工输入是指通过键盘、手写笔或语音输入方式输入字符,它的特点是速度慢、成本高,不适合处理大批量文字。
- 自动识别输入分为印刷体识别和手写体识别,是将纸介质上的文本通过识别技术自动转换为文字的编码,它的特点是速度快、效率高。
字符输入的方法还可分为键盘输入法和非键盘输入法两类
键盘输入法
键盘输人法,就是利用键盘,根据一定的编码规则来输入汉字的一种方法。英文字母只有26个&#x