制作一个符合自己习惯的电子书模板

在买回电子书阅读器后,可能很多人都开始考虑要读什么。对于以英文阅读为主的人,并且如果买了Kindle等本身提供了网上书店服务的产品,那就简单了。Amazon的网上书店提供了大量各种类型的图书,有最新的需要付费的,也有比较老,已经进入公有领域,可以免费下载的。

但对于以中文内容为主的人,这个问题似乎就比较麻烦了。截至目前,中文图书市场对电子出版物的重视程度并不是很高,因此很多人就算想要阅读正版的电子书籍,也根本无法实现。另一个问题则主要是文件格式的困扰。不同品牌的电子书阅读器对文件格式的支持各不相同,因此有时候我们可能找到了自己想要阅读的书的电子版,但因为格式的差异,无法在自己的阅读器上打开。

在电子阅读器上,我最喜欢的文件格式是PDF。因为:PDF格式内嵌字体,因此不管阅读器是否支持更换字体,只要在PDF文件中指定了要使用的字体,就可以在阅读器上正确显示。而且PDF可以尽量保证内容版面的“原汁原味”,制作好的文件,只要不使用重排功能,在任何设备,以及在电脑上打开,都可以看到完全相同的结果。

所以目前除了阅读Amazon商店里买来的电子书,其他需要看的图书,我都喜欢找PDF版本。那如果没有PDF版本怎么办?其实现在网上最多的还是txt格式,因为这种格式的适用范围更广,电脑、手机(智能的或非智能的),以及电子阅读器,基本上都可以支持txt格式的文件。

因此如果需要看txt格式的文件,我通常都会把它转换成PDF格式。比较简单的办法是,在MS Word中创建一个预配置的模板,设置好需要的纸张大小、边距、字体、字号等内容,然后把txt文件的内容复制进去,并保存成PDF格式就行了。一起来试试看吧。

前提条件

对于MS Word软件,2007版在安装一个微软提供的免费加载项后,即可将文件输出为PDF。因此如果没有装,可以在这里下载和安装。

对于2010版Word,原生支持这一功能,不需要安装任何额外的程序就可以直接把文件输出成PDF。

随后还需要知道自己所用的阅读器的屏幕面积。这时最简单的办法就是用尺子丈量一下,或者在网上查找相关数据。这里列出了很多常见阅读器产品的参数信息,其中就包括屏幕面积。以Kindle 3为例,屏幕显示面积(Display Size)为90*120mm。

在获得屏幕面积信息后,还需要注意一个问题,那就是阅读器强制设置的页面边距。也就是说,最然屏幕面积是确定的,但无论要查看的文件本身其页面面积是多少,阅读器都会在屏幕上下左右四个方向留出一定的空白。有些阅读器的这个“留白”是可以自定义的,但有些不行。还是以Kindle 3为例,可以通过指定像素数的方式设置边距的大小,默认为40个像素,四个方向的边距都是这么多,并且只能指定相同大小。要更改Kindle 3的默认边距,可以参考这里的做法。

对于其他阅读器,要判断边距大小,最简单的办法就是,让设备显示一个txt文件,然后用尺子丈量屏幕四周边距的宽度,并结合屏幕的显示精度,根据边距的长度换算成像素数。至于不同设备的边距修改方法,则可能各不相同,并且不一定所有设备都能修改。因为手头暂无其他设备,无从得知,有需要的朋友请自行搜索。

对于Kindle 3,我将默认的边距修改为20像素,并且丈量的屏幕大小为90*120mm。继续操作吧。

创建所需的Word模板

以MS Word 2010为例。新建一个文档,在“页面布局”工具栏下点击“纸张大小”按钮下方的三角形箭头,选择“其他页面大小”,输入宽度为“9cm”,高度为“12cm”,然后单击“确定”。虽然上文提到过默认边距的问题,但实际操作后发现,就算设置页面大小时不考虑边距,直接设置,这样获得的文件效果也是可以接受的。

默认情况下,经过这样设置后,应该可以看到下图所示的结果,页面四周仍有一定的留白,这是文档本身的页边距。

设置好纸张大小后的默认状态

因此除了考虑阅读器本身的页边距,还需要设置Word文档的页边距。直接在Word的“页面布局”工具栏下单击“页边距”按钮下方的三角形箭头,选择“自定义边距”,然后将上下左右四个方向的边距都设置为“0”,并将装订线设置为“0”。这样的设置不会有问题,因为设备本身留有页边距的情况下,文档内部就没必要指定边距了,毕竟屏幕大小有限,没理由把宝贵的屏幕空间浪费在边距上。设置完点击确定后Word会提示超出可打印区域范围的信息,请将其“忽略”。

随后可以看到下图所示内容,从途中可以看到,文档范围内代表页边距的“直角”边框已经消失了。

设置好页边距后的结果

随后需要设置图书的封面。通常封面上只需要显示图书的名称,图书的作者等信息即可。因此在留出足够的行后,直接插入一个分页(“插入”-“分页”)。由于每本书的名称和作者信息都不是固定的,因此这些信息可通过插入文档部件的方式设置。在想要插入图书名称的地方,使用“插入”-“文档部件”-“文档属性”-“标题”的方式进行插入。而作者信息,则通过“插入”-“文档部件”-“文档属性”-“作者”的方式插入。如果需要,还可以通过类似方式插入其他信息。对于插入的字段信息,还可以按照普通文字的方式设置对齐方式、字体和字号等属性。设置好的结果如下图所示。

设置图书的属性信息

在图书的第二页,我喜欢放置图书的封面图像。因此只需要在第二页留出一行内容,并让这一行内容居中显示,然后插入一个分页符。

随后开始设置正文内容,主要是正文的页眉和页脚,正文的文字字体和字号、行间距等。

首先是页眉和页脚的设置。通常情况下,图书的页眉主要显示图书的名称,或章节名称;页脚则显示页码。因为大部分电子阅读器会直接显示页码信息,因此文档内部不再需要显示页码,只要设置好页眉的书名或章节名称即可。这里可以按照实际需要进行设置,例如我只希望在页眉处显示图书名称,不需要显示章节名称。而且我不需要像传统图书一样奇数页页偶数页显示不同的页眉(例如奇数页左对齐,偶数页右对齐),所以直接设置一个不区分基数偶数页,只区分首页和非首页的页眉即可,但要想实现更复杂的设置也是可以的。

将光标放在第二页,即封面图像所在的页,从“插入”工具栏下选择“页眉”,并选择“空白”。随后文档的所有页面都会显示出页眉和页脚,此时请在“页眉和页脚工具-设计”工具栏中选中“首页不同”,这样才能设置首页不显示页眉内容。

在首页上,不需要显示任何页眉内容,因此首先将光标放在首页的页眉区域,按下Del键删除页眉中所有可删除的内容。接着使用页眉工具栏的“页眉顶端距离”和“页脚低端距离”选项,设置页眉和页脚的高度。对于首页,这两个内容都可以设置为“0”,如下图所示:

设置首页的页眉和页脚

从上图可以看到,就算首页的页眉和页脚高度都设置为0,依然会占据一部分屏幕空间,并且页眉下方有一条横线。如何取消这条横线?将光标放在横线上放的插入点前方,在“页面布局”工具栏下打开“页面边框”按钮,打开“边框”选项卡,在左上角的设置中选择“无”,并在右下角的“应用于”下拉菜单中选择“段落”,随后确定即可。

隐藏页眉下方的横线

照此设置后,首页的页眉将不再显示横线。至此首页的设置全部完毕。

随后看正文的页眉和页脚。因为选择了“首页不同”,因此刚才对首页页眉的设置都不会影响到首页外其他页面的页眉。因此还需要根据习惯对正文的页眉和页脚调整。如果不希望正文页眉下方显示横线,按照上图设置进行操作即可。随后,因为需要在正文页眉显示图书名称,因此可以按照上文插入文档属性的方式进行设置。例如首先将插入点设置为右对齐,然后插入文档属性中的“标题”属性。这样做的好处在于,日后创建电子书的时候,只要在首页的“标题”属性中输入图书的名称,页眉上的相应位置就会自动更新。随后根据需要,在首页上放置要显示的其他内容。

设置正文页眉

然后看看正文页脚的处理。按照之前的考虑,正文页脚不显示任何内容,可Word中并不允许只显示页眉并隐藏页脚。难道屏幕上必须有一行内容被不显示任何内容的页脚所占据?其实不需要那么麻烦。虽然不能直接隐藏页脚,但我们可以设置让页脚的高度尽可能低。将光标放在正文页脚的插入点上,选中代表也叫所在行的换行符,右键单击,选择“段落”。在随后出现的对话框中,段前和段后间距设置为“0”,行距选择“固定值”,输入值为“1”磅。

通过设置,让页脚尽可能“小巧”

随后页脚位置就会尽量隐藏起来,从截图中看,几乎已经不占据屏幕空间了:

设置好的页眉和页脚

然后开始设置正文内容。建议为了方便设置,首先在正文区域输入一些文字内容,然后直接选择需要使用的字体和字号。这个需要结合个人的习惯进行设置,例如我使用的字体是方正准雅宋,字号为标准的五号。取决于具体使用的字体,某些字体可能会导致行间距和段间距增大。此时就需要根据所用字体进行进一步的调整。选中所有正文内容,右键单击,选择“段落”,并在随后打开的对话框中将段前和段后间距设置为“0”行,并设置行距为“固定值”,具体磅值则取决于所用的字体。经过合理设置,保证每一行都清晰可见,并且不同段落和行之间的距离足够区分,但又不至于太浪费屏幕面积即可。

安排好正文的版面设置

经过适当的调整和预览,应该已经可以获得令人满意的版面。随后,将用作示例的文字删除,然后将这个文档保存成模板即可。以后需要时直接右键单击这个文件,选择“新建”,然后输入相应的内容,并保存成PDF文件。

有关查找和替换的高级技巧

按照上文的介绍,已经可以创建出比较令人满意的PDF文件。然而有时候,从网上获取的一些txt文件内部有很多不需要的字符。例如额外的不必要的换行,以及不必要的文字。其实这些内容并不太影响阅读,不过如果你和我一样,属于完美主义者,那还是把这些内容删除比较好。人肉删除?不必这样做,还有更简单更智能的办法。

但首先,为了更好地解决这一问题,应设置让Word显示所有格式标记。为此请打开选项对话框,打开“显示”选项,在“始终在屏幕上显示这些格式标记”选项下,选中“显示所有格式标记”。这样所有格式标记都会用不同的字符显示出来,但只是在Word中显示,打印的文件,或输出后的PDF中并不会包含这些内容。然后看看该如何处理吧。

首先,额外空行的删除。以上图为例,左侧这个页面中可以看到,两段文字之间被插入了一个空行。对于这种内容,只要在Word中查找“^p^p”(不包含引号),并将其批量替换为“^p”(不包含引号)即可。

随后,有些网络小说,可能会在章节标题旁边显示类似“本章字数:12345字,更新时间:2010-11-21”之类的字样,这种内容如何替换删除?按下Ctrl-H打开替换对话框,在“查找”框中输入下列内容(带下划线的内容为完整的查找目标,通配符中的标点符号需要使用英文半角符号,非通配符内容则需要根据要查找的目标的设置来决定。例如“字”后面的逗号是中文逗号,查找的时候就要查找中文逗号,反之亦然):

本章字数:[0-9]{1,5}字,更新时间:[0-9]{1,4}-[0-9]{1,2}-[0-9]{1,2}

替换为的内容保持为空白,并单击“更多”按钮,选中“使用通配符”,然后“全部替换”,搞定!

这是什么意思?在上述查找目标中,中括号[]之间的内容是要查找的目标,例如“[0-9]”就代表要查找从0到9这十个数字字符,而大括号{}之间的内容是要查找的数字位数。例如上面的例子里,字数是五位数,因此输入的位数就是{1,5}。时间的年份是四位,月份和日子是两位,所以有了上述查找内容。

有关在Word中利用通配符实现高级查找和替换的更多信息,可参考这里这里,当然,还有更高级的做法,可搜索了解。通过正确使用通配符,就可以把文档中大量不需要,并且符合特定规律的所有内容全部批量删除。

最后还有首航缩进的问题。正规的中文出版物,习惯于每一段开头的地方首行缩进两个字符。然而不同来源的内容,首行缩进的处理方式各不相同。例如,有些文档使用四个半角空格,有些文档使用两个全角空格,有些文档干脆没有缩进。

在Word中,使用点代表半角空格,使用空心方块实现全角空格。例如下图就是使用半角空格实现缩进的例子(需要设置显示所有格式标记后才能看到),这里一共使用了四个半角空格。但如果这里显示为两个空心方块,则代表使用了两个全角空格。因为网络上的很多内容都是转来转去,我甚至见过某些文件,有半角空格四个,后跟全角空格两个,后再跟半角空格四个。这可能是因为文件内容被转载多次,每次都被使用不同方法添加空格实现缩进,进而最终的文件被缩进了N多个位置。

首行缩进的不同实现方式

对于缩进的处理,我习惯通过样式进行统一实现。因此首先可以使用查找功能,查找相当数量的半角或全角空格,“替换为”一栏留空,然后进行批量替换,把所有为了缩进而设置的空格全部删除。随后如果操作正确,每一段开头处将没有任何缩进。这时候打开“开始”工具栏,在“正文”样式,或你的正文所应用的其他样式上点击右键,选择“全选”,选中所有应用了正文样式的内容,然后继续右键单击该样式,选择“修改”,在随后打开的对话框左下角单击“格式”,选择“段落”,并在随后出现的对话框的“特殊格式”下拉菜单选择“首行缩进”,并设置缩进量为“2字符”,搞定。

Snap13

最终内容的输出

全部设置完毕后,只要另存为,并选择PDF格式,即可进行输出。

开始用自己喜欢的格式,看自己喜欢的内容吧!

分享:

12 thoughts on “制作一个符合自己习惯的电子书模板”

  1. 写得真好,是不是刘哥推广得不够啊,居然没留言
    就是有个问题,正文的页眉都必须一样的吗
    那我想分章节,都分不了
    (后来我去Google了,解决了,哈哈)

    1. 呵呵,这个博客本身就是记录我平时写的东西,没打算怎么去推广,反正需要的人通过搜索都能找到:)

      如果希望正文页眉不一样,每次需要使用不同页眉的时候必须插入一个分节符,在下一节设置不同的页眉页脚就行了

  2. 对啊,后来我就这么弄了
    我又碰到一个问题,打个比方,我昨天下载的三体2黑暗森林,里面的文章宽度他都按照一个固定长度自己换行了,导致这样

    —————
    这次褐蚁来到故地,只是觅食途中偶然路过而已。它来到孤峰脚下,用触须
    摸了摸这顶天立地的存在,发现孤峰的表面坚硬光滑,但能爬上去,于是它向上
    爬去。没有什么且的,只是那小小的简陋神经网络中的一次随机扰动所致。这扰
    动随处可见,在地面的每一株小草和草叶上的每一粒露珠中,在天空中的每一片

    —————-
    如果用替换,把^p替换为空,那就整部小说都没有换行了,所以也不可行
    遇到过很多次这种情况了,这还有办法吗,还是只能删掉去找别的版本了。。。

  3. 不同文件在版面上包含的控制字符可能有所不同,你把文字复制到这里,里面包含的版面控制符都丢了。

    有一个比较简单的办法:把所有文字都复制到Word里,然后设置让Word显示所有隐藏字符,这时候版面控制符之类的东西都会显示出来,你再对照着看看有没有啥规律,可用来批量更换吧。如果实在不行,那可能就只能换个文件了。话说三体3好像Hi-Pad那里有完美排版后的版本呢

  4. 研究得真好,学到东西了,谢谢。
    刚刚用WPS转了一个pdf,感觉好极了。
    昨天发现一个奇怪的问题,我从网上下载了一个扫描版的pdf,按理说是能用Kindle看的,但却只能看到它的封面,后面全是空白页。封面和内容的区别,在我看来仅仅是图像格式不同,封面是彩色的,而内容估计是二值的,难道Kindle不能显示二值影像吗?可是它已经做到Pdf里了啊?

    1. 不太清楚,我从来没没有遇到过这种使用二值图像的PDF文件,也没试过。你手头这样的文件很多吗?全部都无法正常显示?

  5. 我手里就那一个是这种格式的PDF。后来试了一下,在网上找到一个叫PDF2Img的免费软件,把页面提取出来转成tiff后重新制作了一个PDF,这回能看了,但就是文件大了好多。看来确实是与页面的图像格式有关,很有意思的问题。

    1. 呵呵,我本身看扫描版文件比较少,这种二值图像甚至是看到你的留言后才听说。看来过度压缩还是不行啊,不过好在能看了,只要提及不是大的离谱,还是凑合看吧

发表评论

电子邮件地址不会被公开。 必填项已用*标注

发表评论前,先做个简单的数学题吧: * Time limit is exhausted. Please reload CAPTCHA.