free789免费资源网
 

电子图书格式一览

本文发布于2006-03-15 22:21:14,浏览...次,好评(3个)投一票

电子读物及电子图书存在的格式有很多种,下面简单地介绍一下当前比较流行和比较常见的几种电子读物文件格式。

1.EXE文件格式
这是目前比较流行也是被许多人青睐的一种电子读物文件格式,这种格式的制作工具也是最多的。它最大的特点就是阅读方便,制作简单,制作出来的电子读物相当精美,无需专门的阅读器支持就可以阅读。这种格式的电子读物对运行环境并无很高的要求。
但是这种格式的电子图书也有一些不足之处,如多数相关制作软件制作出来的EXE文件都不支持Flash和Java及常见的音频视频文件,需要IE浏览器支持等。而且由于多数此格式的电子图书均无法直接获取其中的文字图像资料。

2.CHM文件格式
CHM文件格式是微软1998年推出的基于HTML文件特性的帮助文件系统,以替代早先的WinHelp帮助系统,在Windows 98中把CHM类型文件称作“已编译的HTML帮助文件”。被IE浏览器支持的&#106avascript、VBScript、ActiveX、Java Applet、Flash、常见图形文件(GIF、JPEG、PNG)、音频视频文件(MID、WAV、AVI)等等,CHM同样支持,并可以通过 URL 与Internet联系在一起。
这种格式的电子读物的缺点是:要求使用者的操作系统必须是Windows 98或NT及以上版本。如果读者的操作系统还是Windows 95,还需要安装一个被称作CHM文件阅读升级包。

3.HLP文件格式
HLP文件格式是早期的操作系统所使用的帮助文件系统。这种格式对读者的操作系统没有太多要求,Windows 95及以后的版本都可以运行。现在很多运行于Windows平台的软件,其帮助文件几乎都是HLP格式的。当然,随着微软CHM帮助文件系统的推出和操作系统的发展,HLP文件格式很可能会被CHM所代替。
HLP文件格式的不足之处是美观程度不够好。由于现在很多人对电子读物的美观程度提出了较高的要求,所以这种格式的电子读物目前在网络上不是很有市场。但是,我们可以肯定一点的是,这种格式的电子读物制作简单、获取方便、对阅读者无需特别的要求。另外,目前很多软件的帮助文件还是使用这种格式,所以在短时间内这种格式还不会退出历史舞台。

4.PDF文件格式 (http://www.adobe.com.cn/)
PDF文件格式是美国Adobe公司开发的电子读物文件格式。这种文件格式的电子读物需要该公司的PDF文件阅读器Adobe Acrobat Reader来阅读,所以要求读者的计算机安装有这个阅读器。该阅读器完全免费,可以到Adobe的站点下载。PDF的优点在于这种格式的电子读物美观、便于浏览、安全性很高。但是这种格式不支持CSS、Flash、Java、&#106avascript等基于HTML的各种技术,所以它只适合于浏览静态的电子图书。PDF格式的电子图书可以使用Adobe Acrobat来制作和编辑,该软件最新的版本是4.0。

5.WDL文件格式 (http://www.dynalab.com/ )
WDL是北京华康公司开发的一种电子读物文件格式,目前国内很多大型的电子出版物都使用这种格式。其特点是较好地保留了原来的版面设计,可以通过在线阅读也可以将电子读物下载到本地阅读,但是需要使用该公司专门的阅读器DynaDoc Free Reader来阅读,该阅读器可以从该公司的网站免费下载。
这种格式的电子读物由于对打印和拷贝作了限制,所以适当保护了作者和出版商的利益。与PDF格式一样,该格式依然不支持上述的一些效果。但是支持图片的导入。该格式对文件图像文字质量和最后成品的大小之间的平衡做了较好的处理,采用该格式的文件一般压缩率都比较高。对大中小电子读物都是一个不错的选择。
制作该种格式的电子读物需要使用该公司的软件DynaDoc生成器来完成。该软件目前还没有共享版本,读者可以到该公司的站点去查找关于该软件的相关信息。

6.SWB文件格式
SWB格式是比较少见的一种电子读物文件格式。它是软件WinEbook Compiler(原名Super Winbook 98 Compiler)的一种专有格式。由于这种格式的电子读物只能使用这个软件来制作,并且需要安装有该软件的阅读器方可浏览。所以这种格式的电子读物目前市场不是很大。

7.LIT文件格式
这种格式是美国微软公司开发的软件Microsoft Reader的一种专有的文件格式。该文件格式由于刚刚推出,目前还不支持与HTML相关的各种技术,只是支持图片的浏览。但是,该格式对中文支持得不是很好,目前国内还没有开始大量使用这种文件格式来制作和出版电子读物。

8.EBX文件格式
该格式也是最近才出现的,它的阅读风格与微软的Microsoft Reader很相似。该格式的电子读物可以使用名为the Glassbook Reader的阅读器来阅读,该格式还可以包括sound、wave等多媒体文档。目前美国BARNES&NOBLE公司提供了大量的关于这种格式的电子读物。如果读者有兴趣可以到该站点(http://www.bn.com/)去查看相关的资料。

9.RB文件格式
“RB”是“Rocket eBook”的缩写,这是一种类似于掌上型电脑的电子读物阅读器。传说中它还可以用来做其他一些工作,不过至今无从查证。

10.EBK文件格式
该格式是Voyager公司的MAC机(也有PC格式)读书软件格式。目前国内某些站点已经开始使用这种格式了。最著名的是“百博电子书城”(http://www.bbook.net/)率先使用了这种文件格式来发布电子读物。这种格式的电子读物的特点是先下载一个客户端软件,然后在软件指定的站点上登录后,才能下载图书。

11. CEB 文件格式 (http://www.apabi.com.cn/ )
CEB即Chinese eBook,是完全高保真的中文电子书的格式。由北大方正电子有限公司开发的全新的电子图书阅读工具——方正Apabi Reader 使用的格式. 它能够保留原文件的字符、字体、版式和色彩的所有信息,包括图片、数字公式、化学公式、表格、棋牌以及乐谱等,同时,该格式对文字图象等进行很好的压缩,文件的数据量小。

12. CAJ 文件格式 (http://test.cnki.net/ )
(Chinese academic journal 简称 CAJ)由清华大学光盘国家工程研究中心学术电子出版物编辑部和北京清华信息系统工程公司编辑制作。对于读者来说,访问“中国期刊网”的“全文数据库”,在查找到特定的文章后可以下载相应的CAJ文件。可以使用CAJ文件阅读器 CAJViewer在本机阅读和打印通过“全文数据库”获得的CAJ文件。

13. PDG 文件格式 (http://www.ssreader.com.cn/ )
北京世纪超星公司拥有的自主知识产权的图文资料数字化技术(PDG)、专用阅读软件----超星图书阅览器(SSReader),形成了数字图书馆的整套解决方案,并已成功应用于中央档案馆、中山图书馆、深圳图书馆、解放军医学图书馆、温州图书馆、美国加州大学圣地亚哥分校图书馆等国内外500多家单位,成为中国乃至全世界数字图书馆建设的基本模式之一.

14. NLC 文件格式
NLC格式中国国家图书馆的电子图书格式。它把扫描的图书图像以JBIG标准压缩(无损压缩)为很小的NLC文件。NLC文件是JBIG格式的一种变种。可使用软件Book Reader for NLC阅读.

电子读物资料的转存
随着Internet的迅猛发展,电子读物网络化已成为现实。电子读物是目前正逐渐流行的一种新兴网络传播方式。所谓电子读物是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备使用并可复制发行的大众传播体。目前电子读物的类型有电子图书、电子期刊、电子报纸和软件读物等。

电子读物及电子图书的文件格式有很多种,如*.hlp、*.chm、*.exe、*.html、*.txt、*.doc、*.pdf、*.wdl、*.PDG、*.ebk等。但比较麻烦的是,阅读不同格式的电子书需要不同的软件。

一、电子读物的文件格式

1.HLP文件格式
Windows操作系统所使用的帮助文件系统就采用这种文件格式。这种格式对操作系统没有太多的要求,Win95及以后的版本都可以运行。HLP文件格式优点是制作简单,获得方便,无需特别的要求。缺点是美观程度不够好。目前很多软件的帮助文件还是使用这种格式。

2.CHM文件格式
CHM文件格式是微软1998年推出的基于HTML文件特性的帮助文件系统,以替代早先的HLP帮助系统,在Win98中把CHM类型文件称作“已编译的HTML帮助文件”。IE浏览器支持的&#106avascript、VBScript、ActiveX、Java Applet、Flash,以及常见图形文件(GIF、JPEG、PNG)、音频视频文件(MIDI、WAV、AVI)等,CHM同样支持。另外,通过URL(超级链接),CHM还可以与Internet联系在一起。这种格式的电子读物要求读者的操作系统必须是Win98及以上版本,并装有IE3.0或以上版本。

3.EXE文件格式
这是目前比较流行也是被许多人青睐的一种电子读物文件格式。这种格式最大的特点就是阅读方便、制作简单,制作出来的电子读物相当精美,而且无需专门的阅读器支持。此格式的电子读物对运行环境并无很高的要求。这种格式的电子读物的缺点是:多数相关制作软件制作出来的EXE文件都不支持Flash和Java及常见的音频视频文件,需要IE浏览器支持等。

4.HTML超文本格式
超文本是目前网上最流行的文件显示格式,许多电子小说也采用了这种格式。HTML格式的特点就是显示效果好,表现力强,兼容性非常好,且文件比较紧凑,不会占用太多的磁盘空间。

5.TXT文本文件格式
这是最原始的文本文件格式,它的显示效果虽然较差,但文件的容量无疑最小,在网速不快的今天,可为广大读者节省更多的时间和金钱。

6.DOC文件格式
是用功能强大的Word字处理软件生成的文档格式,能处理图形、图表等,也能通过书签设置跳转。目前也有一部分电子文件采用这一格式。

7.PDF格式
PDF格式是Adobe公司推出的电子图书专用格式,需要该公司的PDF文件阅读器Adobe Acrobat Reader来阅读,该阅读器完全免费,可以到Adobe的站点下载。PDF文件中可包含图形、声音等多媒体信息,还可建立主题间的跳转、注释。PDF文件的信息是“内含”的,我们甚至可以把字体“嵌入”文件中,从而使得PDF文件成为在任何语言的Windows下都可以正确显示的电子文档,许多电子图书都采用此类格式。PDF的优点在于这种格式的电子读物美观、便于浏览、安全性很高。PDF格式的电子图书可以使用Adobe Acrobat来制作和编辑。

8.WDL格式
是北京华康信息技术有限公司开发研制的一种电子读物文件格式。这是一种非常流行的电子图书专用文件格式,它采用图文混排方式,一个文件就是一本电子图书,阅读、携带都很方便,更重要的是WDL格式对中文的支持非常好。目前国内很多大型电子出版物都使用这种格式。这种格式的文件特点是较好地保留了原来的版面设计,可以在线阅读,也可以将电子读物下载到本地阅读,但是需要该公司专门的阅读器DynaDoc Free Reader来阅读,该阅读器可以从该公司的网站免费下载。这种格式的电子读物由于对打印和拷贝作了限制,所以能保护作者和出版商的利益。

9.EBK文件格式
EBK文件格式是Voyager公司的一种电子读物文件格式。目前国内某些站点已经开始使用这种格式了。如“百博电子书城”(http://www.bbook.net)。百博电子图书阅读器由深圳市百博电子商务网络技术有限公司开发,你可以在百博指定的网上电子书店内购买、下载、阅读多种格式(如百博EBK、TXT、HTML等格式)的电子图书,电子图书下载后会存放在你电脑内。

电子读物及电子图书是电子出版物中最常见的表现形式。教师们如何充分利用电子读物及电子图书上的资料为教育教学服务呢?比如在这些电子读物及电子图书中获取我们所需的资料,以供制作电子教案(讲义)之用,进一步提高课堂的教育教学效果(注意这里谈的只是供教学研究用)。下面谈一下笔者作为教育工作者在这方面的做法,以资借鉴。

二、非专门电子书资料的提取
*.hlp、*.chm 、*.html、 *.txt、*.doc、*.exe文件格式的电子读物及电子图书是比较常见的。对于这几种文件格式的电子读物及电子图书上的资料,获取比较容易,对于文字只要简单用鼠标拖动选择,然后复制、粘贴即可。

EXE(可执行文件格式)格式的部分电子图书采用了可执行文件格式,当然,这种格式的电子书大多提供了专门的阅读界面,并有目录、搜索等功能,使用效果非常好。 由于使用的制作工具不同,有的能部分拷贝,有的文字及图片可选择,但不能拷贝、粘贴。要用其中的素材,只能用截图软件进行截取使用,需要文字时可借助文字识别(OCR)软件进行提取。

三、PDF文件格式电子读物资料的提取

1.用Acrobat reader 5.0(下载地址http://www.adobe.com.cn/products/acrobat/readstep.html)打开一个PDF文件,在工具栏点击带T字的按钮(文字选择按钮)右边的倒三角符号,弹出三个子菜单:文本选择工具、栏选择工具、扩展该按钮。使用文本选择工具选择要复制的内容,然后用鼠标右键菜单的“复制”命令,再在其他文字处理工具中粘贴编辑。如选择工具栏的“图形选择”工具进行框选,则能把所需的内容作为图片文件复制、粘贴使用。

2.用Adobe Acrobat5.0,它是一个集成的软件开发包,是一个商业产品。该产品可以制作PDF文件。Acrobat5.0可以将PDF文件另存为RichTextFormat(RTF)格式文件(RTF文件可以用Word、写字板打开),Acrobat5.0也能从AdobePDF文件中提取图像,另存为TIFF、JPEG或PNG格式文件。另外,运用Acrobat5.0,也可以快速地将AdobePDF文件转换成TIFF、JPEG或PNG格式图像。

3.随着PDF文件的广泛应用,制作PDF的第三方工具也逐渐多起来。有能将TXT文件转成PDF的TXT2PDF、TXT2PDF PRO;有能将HTML文件转成PDF的HTML2PDF; 有能将GIF、JPG等图形文件转成PDF的FREE PDF; 当然还有将PDF文件转成GIF、TIF图形文件的PDF2GIF、PDF2TIF等。如软件BCL Drake plugin(下载地址http://software.chinese.com/soft/soft_converter/indexb.html),是在国外网站获得五星级评价的PDF转RTF文件工具。BCL Magellan plugin(http://software.chinese.com/soft/soft_converter/indexb.html),是Acrobat的外挂程序,可以将PDF文件转成HTML文件,方便于网上浏览。北京红樱枫软件有限公司则推出了PDF文本抽出软件,该软件可以将文本内容从PDF文件中分离出来,另存为TXT文件。

4.用OCR软件识别图形文件。当遇上扫描的纯图形文字的PDF文件时就无能为力了。要想把此类PDF文件转成文本文件,就相对麻烦一些了,具体步骤如下:
先用Acrobat打开PDF文件,选定区域,放大到一定程度(视具体情况而定),复制到剪贴板。再用Photoshop或Photoimpact等图形软件调出剪贴板的图形,存成单色的(注意:一定要单色)TIF、PCX或BMP文件,图形文件格式视你所用的OCR软件而定。然后用OCR软件识别图形文件,经过简单的排版校正后,一般能有95%以上的识别率。再经过你的手工修改后,就可以了。

四、WDL文件格式电子读物资料的提取
目前国内很多大型电子出版物都使用这种格式。这种格式的文件的特点是较好地保留了原来的版面设计,可以在线阅读,也可以将电子读物下载到本地阅读。要提取WDL文件的资料,方法很简单,选择菜单“工具/选择文字”,则可用鼠标选择文字,再用编辑/复制,把文字复制到剪贴板。

五、PDG格式文件资料的提取
PDG格式文件(*.PDG)是用超星数字图书馆技术制作的数字图书,要用超星图书阅览器(SSReader)进行阅读。可在超星数字图书馆网站(www.SSReader.com)免费下载,是国内外用户数量最多的专用图书阅览器之一。对于PDG信息资料的保存,主要用到文字识别功能及剪贴图像功能。
文字识别: 由于在SSReader图书阅览器中显示的都是以PDG格式存储的图片,而不是文本,但SSReader图书阅览器嵌入了汉王OCR识别系统,用户可以将图像格式的图书资料转换成文本文件加以利用。方法为点击“图书”菜单,在其下拉菜单中选择“文字识别”;或在阅读区内任意处点击鼠标右键,在弹出的快捷菜单中选择“文字识别”,然后按下鼠标左键任意拖动一个矩形,则在其中的文字全部被进行文字识别,识别过程在弹出的一个面板中进行,识别完成后,点击“保存”即可。
剪贴图像:点击“图书”菜单下的“剪贴图像”命令,或在图书阅览区内单击鼠标右键,在弹出的快捷菜单中选择“剪贴图像”命令,然后按下鼠标左键拖动将所要剪贴的图像全部包围进矩形框中,图像即被放入了剪贴板中,经过粘贴后即可保存。

六、CEB、OEB文件格式电子读物资料的提取
方正Apabi Reader是用于阅读电子书(eBook)的阅读软件(http://www.apabi.com/),可以阅读CEB、PDF、HTML、TXT和OEB等文件。方正Apabi Reader的界面友好,尽量使电子书的阅读接近于传统纸书的阅读习惯,并带有常用的中英文电子词典软件,可以通过屏幕取词,对方正Apabi Reader中的词进行翻译。方正Apabi Reader有部分拷贝功能。Apabi Reader1.5每次只能拷贝64个汉字。

七、EBK文件格式电子读物资料的提取
EBK文件格式“百博电子书城”(http://www.bbook.net)率先使用。百博电子图书阅读器由深圳市百博电子商务网络技术有限公司独立开发。该阅读软件有强大的版权保护功能:图书内容经过深层次加密,不仅可限制拷贝和打印数量,还可限制只在有合法授权的电脑上使用。但对于无保护图书的资料,通过百博阅读器获取比较容易,对于文字只要简单用鼠标拖动选择,复制、粘贴则可。也可借助第三方工具进行采集,如Advanced eBook Processor,可以转换eBook Pro(*.EBK),从eBook Pro中抓取出HTML网页及图片。

几个电子书反编译及相关软件

UnEBook http://www.comicer.com/stronghorse/software/exe/UnEBook_chn.zip

功能:
1、电子书批量反编译,支持的格式包括:CHM、HLP、Web Compiler 1.67、Caislabs eBook Pack Express 1.6、ebx/XReader。
2、在反编译CHM电子书的时候,为了对付某些没有索引页,单纯依*左侧目录树导航的情况,可以自动根据hhc文件,生成框架页和导航页。
3、将 RTF 文件批量转换成 TEXT

CtrlN http://www.comicer.com/stronghorse/software/exe/CtrlN_chn.zip

功能: 一个简单的网页查看程序,在浏览网页,或基于IE内核的电子书的时候,按下指定的快捷键(缺省为Ctrl+N,可配置),即可实现下面功能中的一种:
1、弹出一个新的IE窗口,在其中显示与当前浏览的页面完全相同的内容,但是这个新的窗口包含IE的全部菜单,就好像在用IE浏览普通网页的时候按下快捷键Ctrl+N一样(这个软件的名字就是从这里来的)。
2、弹出一个“记事本”窗口,显示当前浏览页面的HTML源代码。这个功能经过特殊处理,比IE的“查看源代码”功能*得住些,可以有效对付那些通过流,动态生成的页面。
3、弹出一个“记事本”窗口,显示当前浏览页面的文本。这个功能目前IE 6还没有

miniKillEBook http://www.comicer.com/stronghor ... niKillEBook_chn.zip

一个专门针对基于IE内核电子书的反编译软件,可以在不知道电子书具体文件格式的情况下,反编译电子书的内容。但是内部对功能进行了限制,只能反编译HTML内容,不能反编译电子书中的图片、动画、css、js、音乐等。反编译结果可以是原始的HTML文件,也可以直接存为文本文件,方便转换成PDA电子书格式。

eBookRegClean http://www.comicer.com/stronghorse/software/exe/eBookRegClean.zip

E书注册表垃圾清理器。
在打开用eBook Workshop、eBook Edit Pro等生成的EXE格式电子书后,在系统注册表中会留下垃圾。
本软件的目的就是清除这种垃圾。系统temp目录下的文件垃圾,需要手工清理。

 

======全球免费中心版权声明(本站从09-4-29开始加强免费资源版权管理)=========
不管出于何目的转载本文,请注明版权信息(包括来源和作者),否则一经发现将逐个处理。
若本站转了您的信息而未标明或标错或未找到出处而没标明的,请联系我们,2天内处理。

网友点评

 

因为目前没有时间可以管理点评,所以于2009年12月19日暂停点评功能!

 

随机推荐

本分类排行榜:

本分类好评榜:

全站随机推荐

© 2005-2020 free789免费中心 | Power by Free789 v18 | 联系我们 | 关于本站
如何访问 | 广告服务 | 免责声明 | 版权声明 闽公网安备 35052402000110号
GMT +8, 2018-10-19 00:00:41, Processed in 10.1ms 闽ICP备12008353号-2
本站程序和风格皆由站长飕飕然100%原创制作,谢绝模仿,违者必究。
本站页面兼容几乎所有主流浏览器,您可根据自己的喜好选择浏览器。
原名『全球免费中心』,于2013年6月16日改名为『free789免费中心』