5.1文本与文本处理ppt课件

上传人:仙*** 文档编号:177770895 上传时间:2022-12-26 格式:PPT 页数:59 大小:1,014.50KB
收藏 版权申诉 举报 下载
5.1文本与文本处理ppt课件_第1页
第1页 / 共59页
5.1文本与文本处理ppt课件_第2页
第2页 / 共59页
5.1文本与文本处理ppt课件_第3页
第3页 / 共59页
资源描述:

《5.1文本与文本处理ppt课件》由会员分享,可在线阅读,更多相关《5.1文本与文本处理ppt课件(59页珍藏版)》请在装配图网上搜索。

1、2022-12-261;.2022-12-262n“媒体媒体”指的是信息的各种表示形式(如数值、文字、图像、声音、视频指的是信息的各种表示形式(如数值、文字、图像、声音、视频等)等)n数字媒体就是数值、文字、声音、图像等的二进制数字表示数字媒体就是数值、文字、声音、图像等的二进制数字表示2022-12-263n自然媒体自然媒体(使用数字化方法从现实世界获取的媒体使用数字化方法从现实世界获取的媒体)合成媒体合成媒体(使用计算机制作的媒体使用计算机制作的媒体)Model(description)采用特定符号采用特定符号(语言语言)表示的文本表示的文本,合成语音合成语音,MIDI,图形图形,动画动画

2、Modeling(describing)人工交互方式命令语言方式rendering人可以感知的形式声波光波力温度检测与转检测与转换器换器电电信信号号数字化数字化数字自然媒数字自然媒体体取样声音,扫描图像,数字视频2022-12-264n数字媒体是各种计算机应用的处理对象,也是网络的传输对象。不了解数字媒体是各种计算机应用的处理对象,也是网络的传输对象。不了解“对对象象”,就不能透彻地理解计算机和网络的工作原理。,就不能透彻地理解计算机和网络的工作原理。n进一步理解计算机的工作原理进一步理解计算机的工作原理n更好地理解常用工具软件的操作原理更好地理解常用工具软件的操作原理n扩大知识面,了解更多的

3、计算机应用扩大知识面,了解更多的计算机应用1为各个专业和学科进一步学习、使用计算机打下必要的基础为各个专业和学科进一步学习、使用计算机打下必要的基础2022-12-265;.2022-12-266n文本(文本(texttext):文字信息在计算机中的表示形式:文字信息在计算机中的表示形式是基于特定字符集的、具有上下文相关性的一个(二进制编码)字符流,是基于特定字符集的、具有上下文相关性的一个(二进制编码)字符流,。2022-12-267n文本在计算机中的处理过程:文本的准备(例如汉字的输入),文本编辑,文本处文本在计算机中的处理过程:文本的准备(例如汉字的输入),文本编辑,文本处理,文本存储与

4、传输、文本展现等,根据应用的不同,各个处理环节的内容和要求理,文本存储与传输、文本展现等,根据应用的不同,各个处理环节的内容和要求可能有很大的差别。可能有很大的差别。2022-12-268其他媒体文本展现文本展现(阅读器)(阅读器)文本准备文本准备文本处理文本处理文本处理软件文本处理软件电子电子文本文本文本编辑文本编辑(编辑器)(编辑器)格式化的电格式化的电子文本子文本网络网络传输传输2022-12-269 组成文本的基本元素是字符组成文本的基本元素是字符(character),字符与数值信息一样,字符与数值信息一样,在计算机中也采用二进位编码表示。在计算机中也采用二进位编码表示。2022-1

5、2-2610;.2022-12-2611n字汇字汇:编码字符集中有哪些字符:编码字符集中有哪些字符n编码规则编码规则:如何确定每个字符的代码:如何确定每个字符的代码n码长码长:字符代码的长度。它决定了代码空间的大小字符代码的长度。它决定了代码空间的大小n定长码:定长码:7位,位,8位,双字节,位,双字节,4字节字节n可变长码:单双可变长码:单双4字节码字节码2022-12-2612n西文是表音文字西文是表音文字(拼音文字拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符,它由拉丁字母、数字、标点符号以及一些特殊符号所组成号所组成n美国标准信息交换码美国标准信息交换码(ASCII码码):nA

6、SCII字符集包含字符集包含96个可打印字符和个可打印字符和32个控制字符个控制字符n采用采用7个二进位进行编码个二进位进行编码n计算机中使用计算机中使用1个字节存储个字节存储1个个ASCII 字符字符0X X X X X X X2022-12-2613n空格(空格(3232)20H20Hn0 0(4848)30H 30H nA A(6565)41H41Hna a(9797)61H61Hn回车回车(13)0DH(13)0DH2022-12-2614n汉字的特点:汉字的特点:n数量大(我国汉字自数量大(我国汉字自古至今累计已超过古至今累计已超过7万字万字,国家语委颁布的国家语委颁布的“现代现代汉

7、语通用字表汉语通用字表”包含包含7000汉字)汉字)n多个国家和地区使用:港台地区,日、韩、朝、新、马等多个国家和地区使用:港台地区,日、韩、朝、新、马等n字形复杂,同音字多,异体字多。字形复杂,同音字多,异体字多。2022-12-2615n国家标准国家标准GB2312-1980n汉字扩充规范汉字扩充规范 GBK-1995n国家标准国家标准GB18030-2000/2005n台湾地区的标准汉字字符集台湾地区的标准汉字字符集CNS 11643(BIG 5,俗称,俗称“大五码大五码”)n日本工业标准汉字字符集日本工业标准汉字字符集JIS X 0208-90n韩国国家标准汉字字符集韩国国家标准汉字字

8、符集KSC 5601-87nUCS/Unicode多文种大字符集多文种大字符集2022-12-2616一级汉字一级汉字(3755个)个)二级汉字二级汉字(3008个)个)(扩充使用)(扩充使用)字母、数字和各种符号字母、数字和各种符号 19423位号位号 191655568794区区 号号(按汉语拼音排列按汉语拼音排列)(按偏旁部首排列按偏旁部首排列)n1980年颁布年颁布信息交换用汉字编码字符集信息交换用汉字编码字符集基本集基本集GB2312-1980nGB2312字符集由三个部分构成:字符集由三个部分构成:拉丁字母、俄文、拉丁字母、俄文、日文平假名与片日文平假名与片假名、希腊字母、假名、希

9、腊字母、汉语拼音等共汉语拼音等共682个个共共6763个汉字个汉字2022-12-2617n每一个每一个GB2312汉字使用汉字使用16位位(2个字节个字节)表示表示n为了与为了与ASCII字符相区别,每个字节的最高位均为字符相区别,每个字节的最高位均为“1”n例如:例如:“南南”字的代码是字的代码是11000100 11001111(用十六进制表示为(用十六进制表示为C4CF)11第第1字节字节第第2字节字节X X X X X X XX X X X X X X2022-12-2618练习 1MB的内存空间可以存放的内存空间可以存放 个个GB2312-80的汉字机内码。的汉字机内码。A.102

10、4 B.512 C.1024 C.1024512 D.1024512 D.102410241024设有一串字符的内码为:设有一串字符的内码为:B5C8BCB6BF3DF1E3,则这串字符中包含,则这串字符中包含 个个GB2312-80汉字。汉字。2022-12-2619nGB2312的不足:的不足:n汉字字数太少,缺少繁体字汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与等应用的需要;与ASCII码不兼容码不兼容nGBK汉字汉字内码扩充规范(内码扩充规范(1995):):n在在GB2312基础上,增加了基础上,增加了

11、1万多汉字万多汉字(包括繁体字包括繁体字)和符号和符号n共有共有21003个汉字和个汉字和883个图形符号,如个图形符号,如“計算機計算機”、冃、冄、円、冇等繁、冃、冄、円、冇等繁体字和生僻字体字和生僻字 n与与GB8312保持向下兼容,也使用双字节表示,第保持向下兼容,也使用双字节表示,第1字节最高位必须为字节最高位必须为“1”:1 X第第1字节字节第第2字节字节X X X X X X XX X X X X X X2022-12-2620台湾、香港地区使用。台湾、香港地区使用。注意:注意:GB2312(GBK)GB2312(GBK)与与Big5Big5并不兼容。并不兼容。2022-12-26

12、21n背景:为了实现全球数以千计的不同语言文字的统一编码背景:为了实现全球数以千计的不同语言文字的统一编码n方案:方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前目前共收集了共收集了17x2161,114,112 个个),称为,称为UCS。nUCS:ISO/IEC 10646ISO/IEC 10646 Universal Multiple-Octet Coded Character SetUniversal Multiple-Octet Coded Character Set,通用多,通用多8 8位编码字符集位编码字

13、符集nUnicode:统一码或联合码,微软、:统一码或联合码,微软、IBMIBM等联合制定、与等联合制定、与UCSUCS完全等同的工业标完全等同的工业标准准 nUCS/Unicode用用4 4个字节对全世界现代书面文字所使用的所有字符、符号进行个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作编码(记作 UCS-4UCS-4)2022-12-2622单字节:单字节:ASCII字符字符双字节:拉丁、希腊、阿拉伯,双字节:拉丁、希腊、阿拉伯,三字节:三字节:CJK汉字汉字四字节:其他四字节:其他Unicode:UTF-8 单字节可变长编码单字节可变长编码应用:应用:Linux,Web网

14、页,电子邮件网页,电子邮件双字节:双字节:ASCII字符、拉丁、希腊、字符、拉丁、希腊、阿阿 拉伯,常用拉伯,常用CJK汉字,汉字,四字节:非常用四字节:非常用CJK汉字汉字Unicode:UTF-16双字节可变长编码双字节可变长编码应用:应用:Windows,Mac,Java,n先实现部分字符的编码(共先实现部分字符的编码(共107,361个字符)个字符)n尽量与已有编码标准兼容尽量与已有编码标准兼容n其中包含有中、日、韩统一整理出来的近其中包含有中、日、韩统一整理出来的近3万汉字(称万汉字(称CJK汉字)汉字)n允许有若干不同的编码方案允许有若干不同的编码方案,例如:例如:2022-12-

15、2623n优点:编码空间极大,能容纳足够多的各种字符集(优点:编码空间极大,能容纳足够多的各种字符集(1313亿字符)亿字符)n缺点:缺点:4 4字节的字符编码使存储空间浪费严重字节的字符编码使存储空间浪费严重n克服:在克服:在UCS/UnicodeUCS/Unicode编码空间中,把第编码空间中,把第1 1和第和第2 2字节均为字节均为“0 0”的一个子空间,的一个子空间,作为作为UCS/UnicodeUCS/Unicode的子集来使用,记作的子集来使用,记作UCS-2UCS-2。2022-12-2624n背景:无论是背景:无论是Unicode的的UTF-8还是还是UTF-16,其,其CJK

16、汉字字符集虽然覆盖了汉字字符集虽然覆盖了我国已使用多年的我国已使用多年的GB2312和和GBK标准中的汉字,但它们的编码并不相同标准中的汉字,但它们的编码并不相同n为了既能与为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在资源,我国在2000年和年和2005年两次发布年两次发布GB18030汉字编码国家标准。汉字编码国家标准。nGB18030实质上是实质上是UCS/Unicode字符集的另一种编码方案:字符集的另一种编码方案:n单字节编码(单字节编码(128个)表示个)表示ASCII字符字符n双字节编码(双字节

17、编码(23940个)表示汉字,与个)表示汉字,与GBK(以及(以及GB2312)保持向下兼)保持向下兼容,容,GBK不再使用不再使用n四字节编码(约四字节编码(约158万个)用于表示万个)用于表示 UCS/Unicode中的其他字符中的其他字符nGB18030目前已在我国信息处理产品中强制贯彻执行。目前已在我国信息处理产品中强制贯彻执行。2022-12-2625标准名称标准名称GB2312GBKGB18030UCS-2(Unicode)字符集字符集6763个汉字个汉字(简体字简体字)21003个汉字个汉字(包括(包括GB2312汉字在内)汉字在内)近近3万汉字万汉字(包括包括GBK汉汉字和字和

18、CJK及其及其扩充中的汉字扩充中的汉字)包含包含10万多字符,万多字符,其中的汉字与其中的汉字与GB18030相同相同编码方法编码方法双字节存储和双字节存储和表示,每个字表示,每个字节的最高位均节的最高位均为为“1”双字节存储和双字节存储和表示,第表示,第1个字个字节的最高位必节的最高位必为为“1”部分双字节、部分双字节、部分部分4字节表字节表示,双字节表示,双字节表示方案与示方案与GBK相同相同 UTF-8采用单字采用单字节可变长编码节可变长编码 UTF-16采用双字采用双字节可变长编码节可变长编码兼容性兼容性编码编码不兼容!不兼容!编码保持向下兼容编码保持向下兼容2022-12-26262

19、022-12-2627GB2312-80GB18030-2000/2005GBK-95CJK汉字字汉字字汇汇兼兼 容容兼容UCS/UnicodeISO 646(ASCII码)兼兼 容容兼容映映射射2022-12-2628;.2022-12-2629键盘输入键盘输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入(1)数字编码数字编码,如电报码、区位码等如电报码、区位码等,(2)字音编码字音编码,如智能如智能ABC等等(3)字形编码,如五笔字形和表形码等字形编码,如五笔字形和表形码等,(4)形音编码形音编码发展趋势:基于统计和学习功能的以词语发展趋势:基于统计和学习功能的以词

20、语(短语短语)或句子作为输入单位的输或句子作为输入单位的输入方法入方法2022-12-2630键盘输入键盘输入联机手写输入联机手写输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入优点:优点:自然,流畅自然,流畅小型化,适合移动计算小型化,适合移动计算不足:不足:识别速度和正确性还需提高识别速度和正确性还需提高书写要求还要降低书写要求还要降低2022-12-2631键盘输入键盘输入联机手写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入优点:优点:自然,方便,适合移动计算自然,方便,适合移动计算不足:不足:对说话人、说话

21、方式、说话内容的对说话人、说话方式、说话内容的适应能力要大大增强适应能力要大大增强识别速度和正确性还需大大提高识别速度和正确性还需大大提高2022-12-2632印刷体识别印刷体识别键盘输入键盘输入联机手写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入扫描仪扫描仪OCR数字文数字文本本纸介质文纸介质文本本文本的映文本的映象象(image)识别率已达到识别率已达到98%功能功能:简、繁体字简、繁体字混合识别混合识别 中文、西文混合识别中文、西文混合识别 文字、表格混合识别文字、表格混合识别 智能校对功能智能校对功能2022-12-2633印刷

22、体识别印刷体识别手写体识别手写体识别键盘输入键盘输入联机手写输入联机手写输入语音输入语音输入自动识别输入自动识别输入字符信息的输入字符信息的输入人工输入人工输入 技术上非常困难,还无法实用技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别目前准备先突破工整的楷书手写体的识别!2022-12-2634;.2022-12-2635 本本 书书 由由 南南 京京 大大 学学 出出 B1 BE CA E9 D3 C9 C4 CF BE A9 B4 F3 D1 A7 B3 F6 版版 社社 (P u b l i s h i n g B0 E6 C9 E7 28 50 75 62 6C 69

23、73 68 69 6E 67 H o u s e o f N a n j i n 20 48 6F 75 73 65 20 6F 66 20 4E 61 6E 6A 69 6E g U n i v e r s i t y )出出 版版 67 20 55 6E 69 76 65 72 73 69 74 79 29 B3 F6 B0 E6 文文本本的的内内容容文文本本在在计计算算机机中中的的表表示示 没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,这种文本通这种文本通常称为纯文本或常称为纯文本或ASCII文本,在文本,在PC机

24、中的文件后缀名是机中的文件后缀名是.txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息结构信息 举例:举例:2022-12-2636n有字体字号等属性变化、设置了段落和页面排版格式的文本称为有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式丰富格式文本文本”n丰富格式文本(丰富格式文本(rich textrich text、fancy textfancy text、formatted textformatted text)ndocdoc、xlsxls、RTFRTF等等n多媒

25、体文档(多媒体文档(Multimedia DocumentMultimedia Document)2022-12-2637n超文本的结构超文本的结构ABCDEFGH2022-12-2638n超文本超文本(hypertext)(hypertext)的阅读方式的阅读方式n线性文本是顺序式阅读线性文本是顺序式阅读n通过链接、跳转、导航、回溯等操作实现跳跃式阅读通过链接、跳转、导航、回溯等操作实现跳跃式阅读n超链(超链(hyperlinkhyperlink):链源、链宿):链源、链宿n超链的链宿有两种:超链的链宿有两种:n书签,指的是文本内部标记有书签的某个地方书签,指的是文本内部标记有书签的某个地方

26、n互联网上的某个信息资源(文件),它用统一资源定位器(互联网上的某个信息资源(文件),它用统一资源定位器(URLURL)指定指定2022-12-2639n超文本中的节点不单是文本节点,还包含图形、图像、声音或动画节点,这种基于超文本中的节点不单是文本节点,还包含图形、图像、声音或动画节点,这种基于多媒体信息结点的超文本,有时也称为多媒体信息结点的超文本,有时也称为“超媒体超媒体”n超文本的应用超文本的应用nWindowsWindows等等一些软件中的一些软件中的“帮助帮助”文件文件n使用浏览器从使用浏览器从WebWeb服务器上下载的网页(服务器上下载的网页(htmlhtml或或htmhtm文件

27、)文件)2022-12-2640;.2022-12-2641创建新文档或打开老文档创建新文档或打开老文档文稿输入文稿输入编辑编辑排版排版文档存盘、打印或发送文档存盘、打印或发送输入中西文字、符号和输入中西文字、符号和图表图表进行增、删、改操作,保证进行增、删、改操作,保证文本的正确性文本的正确性满足清晰、美观、便于满足清晰、美观、便于使用等要求使用等要求2022-12-2642n目的:确保文本内容正确无误目的:确保文本内容正确无误n操作:对字、词、句和段落进行添加、删除、修改等操作操作:对字、词、句和段落进行添加、删除、修改等操作nMS Word的功能:的功能:n在文本的任何位置都可以插入新的

28、文字在文本的任何位置都可以插入新的文字n从文本的任何位置都可以删除不需要的文字从文本的任何位置都可以删除不需要的文字n将一段文字从一处移动到另一处将一段文字从一处移动到另一处n将一段文字从一处复制到另一处将一段文字从一处复制到另一处n在文本中自动查找指定的词语在文本中自动查找指定的词语n用一个词语自动替换文本中指定的词语用一个词语自动替换文本中指定的词语2022-12-2643n目的:使文本清晰、美观、便于阅读目的:使文本清晰、美观、便于阅读n操作内容:对文本中的字符、段落乃至整篇文章的格式进行设操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成计和调整,分成3个层次:个层次

29、:n对字符格式进行设置对字符格式进行设置n对段落格式进行设置对段落格式进行设置n对文档页面进行格式设置对文档页面进行格式设置2022-12-2644n字号字号(八号八号 初号初号,5磅磅72磅以上磅以上)1 1磅相当于磅相当于1/721/72英寸英寸 n字体字体(宋体、宋体、楷体楷体、黑体黑体、仿宋仿宋、隶书隶书)n字符的修饰字符的修饰n字符的形状字符的形状(字形字形):正常、加粗、:正常、加粗、倾斜倾斜、加粗倾斜加粗倾斜n字形的修饰:字形的修饰:下划线下划线、着重号、上下标、删除线、着重号、上下标、删除线n字符的颜色字符的颜色n字符的宽度字符的宽度n字符的间距字符的间距n字符的效果字符的效果

30、n字符的排列方向字符的排列方向2022-12-2645n什么是段落?用什么是段落?用“回车回车”相互隔开的一组文字相互隔开的一组文字n段落格式的设置:段落格式的设置:n段落的对齐方式段落的对齐方式(两端对齐、分散对齐、居中对齐、左对齐、右对齐两端对齐、分散对齐、居中对齐、左对齐、右对齐)n段落的缩进方式段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩进首行缩进、悬挂缩进、左缩进、右缩进)n段间距和段内行距段间距和段内行距n使用编号和项目符号使用编号和项目符号n段落段落添加边框和底纹添加边框和底纹n首字下沉或悬挂首字下沉或悬挂n段落与分页的关系段落与分页的关系2022-12-2646n段落缩进是

31、指段落中的文本到正文区左、右边界的距离,包括段落左缩进、段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示指示左缩进标记左缩进标记首行缩进标记首行缩进标记右缩进标记右缩进标记右缩进右缩进左缩进左缩进首行缩进首行缩进正文区正文区右边界右边界正文区正文区左边界左边界悬挂缩进悬挂缩进标记标记2022-12-2647n页面格式的设置:页面格式的设置:n设置纸张大小和页边距设置纸张大小和页边距n设置每页的行、列数目设置每页的行、列数目n设置分栏数目与格式设置

32、分栏数目与格式n设置页码设置页码n设置页眉和页脚设置页眉和页脚2022-12-26482022-12-2649n“所见即所得所见即所得”(操作效果屏幕立即可见,打印结果与屏幕所见完全相操作效果屏幕立即可见,打印结果与屏幕所见完全相同)同)n撤销撤销(undo)和恢复和恢复(redo)操作操作n格式刷格式刷n多种视图多种视图(大纲视图与大纲编辑大纲视图与大纲编辑)n自动更正、自动套用格式、自动编号、自动图文集自动更正、自动套用格式、自动编号、自动图文集 n自动保存功能和自动备份功能自动保存功能和自动备份功能n样式、模板和向导样式、模板和向导(wizard)功能功能n宏操作(宏操作(Macro)2

33、022-12-26502022-12-2651n使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理压缩、加密和检索等有关的处理n文本处理内容:文本处理内容:n字数统计,词频统计,简字数统计,词频统计,简/繁体相互转换,汉字繁体相互转换,汉字/拼音相互转换拼音相互转换n词语排序,词语错误检测,文句语法检查词语排序,词语错误检测,文句语法检查n自动分词,词性标注,词义辨识,大陆自动分词,词性标注,词义辨识,大陆/台湾术语转换台湾术语转换n关键词提取,文摘自动生成,文本分类关键词

34、提取,文摘自动生成,文本分类n文本检索(关键词检索、全文检索),文本过滤文本检索(关键词检索、全文检索),文本过滤n文语转换(语音合成),文种转换(机器翻译)文语转换(语音合成),文种转换(机器翻译)n篇章理解,自动问答,自动写作等篇章理解,自动问答,自动写作等n文本压缩,文本加密,文本著作权保护文本压缩,文本加密,文本著作权保护2022-12-2652n英文拼写检查和英文拼写检查和英语同义词检查英语同义词检查n字数统计字数统计n自动编写摘要自动编写摘要n中文简繁体转换和术语转换中文简繁体转换和术语转换n中英词语翻译中英词语翻译n语法和格式检查语法和格式检查n语音识别(口授命令和听写)语音识别

35、(口授命令和听写)n文档保护文档保护(防止打开或修改文档防止打开或修改文档)2022-12-2653(1)面向通信的文本处理软件)面向通信的文本处理软件:Outlook Express(2)面向办公的文本处理软件)面向办公的文本处理软件:MS Word,WPS2000(3)面向印刷出版的文本处理软件:)面向印刷出版的文本处理软件:“飞腾飞腾”排版软件,排版软件,PageMaker,PDF Writer(4)面向网络信息发布和电子出版的文本处理软件:)面向网络信息发布和电子出版的文本处理软件:FrontPage,PDF Writer 2022-12-26542022-12-2655n过程:过程:

36、n对文本的格式描述进行解释对文本的格式描述进行解释n生成文字和图表的映像(生成文字和图表的映像(bitmap)n传送到显示器或打印机输出传送到显示器或打印机输出n2 2种文本阅读器种文本阅读器/浏览器:浏览器:n嵌入在文本编辑嵌入在文本编辑(处理处理)软件中,如微软的软件中,如微软的Word,1.1.独立的软件:如独立的软件:如Adobe公司的公司的Acrobat Reader,微软公司的,微软公司的IE等。等。2022-12-2656n过程:过程:n先根据字符的字体确定相应的字型库(先根据字符的字体确定相应的字型库(font),),n再按照该字符的代码从字型库中取出该字符的形状描述信息,再按

37、照该字符的代码从字型库中取出该字符的形状描述信息,n然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换,横线)将字形作必要的变换,n最后将变换得到的字形放置在页面的指定位置处。最后将变换得到的字形放置在页面的指定位置处。2022-12-2657n字型库字型库(FONT)(FONT):简称字库,同一种字体的所有字符:简称字库,同一种字体的所有字符(例如例如GB2312GB2312中的中的70007000多字符多字符)的形状描述信息的集合。的形状描述信息的集合。n不同的字体不同的字体(如宋体、仿宋、楷体、黑体等如宋体、仿宋、楷体、黑体等)对应不同的字库。对应不同的字库。2022-12-2658n2种不同的字库:种不同的字库:n点阵描述点阵描述2022-12-2659n汉字库的作用是用于汉字库的作用是用于 。A.汉字的存取汉字的存取 B.汉字的传输汉字的传输 C.汉字的输入汉字的输入 D.汉字的显示与打印汉字的显示与打印 n在下列汉字编码标准在下列汉字编码标准(字符集字符集)中,不支持简化汉字的是中,不支持简化汉字的是 。A.GB2312-80 B.GBK C.BIG 5 D.Unicode n2424点阵的字形码占点阵的字形码占字节。字节。A72 B572 C24 D36

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!