常见格式及其反编译思路-第 4 节-雨来不躲-社会文学-新龙腾小说

第 4 节

作者：雨来不躲更新：2022-08-10 08:35 字数：2820

身就已经提供了完整的反编译功能了。
该网站后来发行的电子书虽然经过升级，但还是延续了这种模式，只不过在temp目录里存放的是加过密的HTML文件，但是图像文件却是不加密的，因此我猜测他们可能改用MIME　Filter技术了。
3、基于流或document。write方法
用流往IE控件中写入内容的方法，在MSDN和CSDN中都有详细的讨论，连源代码都有。有需要的到MSDN搜索“Loading　HTML　content　from　a　Stream”即可。
document。write在动态网页中比较常用，很多网页加密工具都是使用这招来实现网页源代码的隐藏。对于VC、Delphi等来说，这招不过是换成了IHTMLDocument2：：write，效果是一样的。
使用这种方法做电子书的虽然不多，不过毕竟还是有的，我见过的就是读写网。由于打开这个网站的电子书后，IE主页就会自动设置为这个网站的URL，所以在这里就不给出这个网站的URL了，以免各位受到意外伤害。破解这种电子书的收费验证的方法，已经有人在紫宸殿网络论坛的技术区贴出来过，有兴趣的可以去看看。
在MSDN中对这种基于流的方法的局限性说得很清楚：
页面不能太复杂，如果页面包含的tag太多，显示出来的就不是解析后生成的页面，而是原始的HTML代码。大概就是因为这个原因，所以读写网放出来的电子书清一色都只有纯文本，加背景色。
当前页面的URL永远不变（读写网的永远都是about：blank），因此IE内核没有办法从相对URL自动构造出绝对URL。就是因为这个原因，读写网早期的电子书在页面中使用jpg文件作为背景，就只能将这个背景图片写到temp目录下，然后在网页中使用绝对URL引用这个图片。也正是因为这个原因，所以在页面中不能包含“上一页”、“下一页”、“回目录”等链接，只能自己在左侧放一棵目录树，让用户一页、一页去点。
由于这种电子书的页面没有自己的URL，因此不能用KillEBook进行反编译，只能用IECracker或CtrlN，一页、一页手工抓取。
4、采用MIME　Filter
与基于流的方法相比，这种方法不仅支持包含众多tag的复杂HTML页面，而且可以从相对URL构造绝对URL，因此支持页面之间的链接，实现也不复杂，MSDN上就有现成的例子可供参考。
不过这种方法的缺点也很明显：不能对图像等内容进行加密处理。下面说的协议插件方法就比这种方法强些。
5、基于web服务器
对于不懂行的人来说，“web服务器”听起来可能是一个很了不起的东东，但是对于懂行的人来说，实现其实很简单：
起一个监听线程，对本地80或任何一个指定的端口进行监听。
每监听到一个连接请求，起一个服务线程，根据请求内容，按照HTTP协议，返回内容。
在codeguru和codeproject上，有很多现成的web　server代码，直接拿来用就好，自己只要考虑怎么填写返回内容即可。VC　6自带的MSDN光盘上，也带了一个名为HTTPSVR的例子，说明如何用MFC和WinSock创建web　server。
使用这种方法虽然简单、直截了当，而且只要愿意，差不多能够模拟一个真正web　server的功能（就算想实现app　server也并非不可能，不过要花点功夫），但是也有问题：
基本上没有什么保密性可言，服务器起来后，本机其它进程很轻松就能下载到需要的内容。
如果本机上其它进程也提供TCP/IP服务，可能会产生端口冲突。
6、协议插件（Asynchronous　Pluggable　Protocols）
这个是微软专门为IE扩展的东西。
在互联网上，常见的应用层协议包括http、FTP等。出于种种原因，微软允许用户在标准的应用层协议之外，扩展自己的协议，称为Asynchronous　Pluggable　Protocol。到MSDN、codeguru和codeproject上搜索这几个关键字，从理论到源代码都能找出一堆，在这里我就不罗嗦了。
Asynchronous　Pluggable　Protocol可以指定对所有进程有效，这个在注册表的HKEY_CLASSES_ROOTPROTOCOLSHandler下注册一下就好；也可以指定只在某个进程内有效，以增加保密性，不过这个时候微软就不叫它Asynchronous　Pluggable　Protocol了，而是Pluggable　Namespace　Handler。
由于Asynchronous　Pluggable　Protocol具有一定的保密性，实现起来又有例子可参考，而且差不多与架设web　server一样，能够对网页显示提供全面的支持，因此在电子书中得到了广泛的应用，我见过的就有mk（chm）、ada99（eBook　Workshop）、wc2p（Web　piler　2000）、ic32pp（Web　piler　2000—exe防反编译格式）、e…book（E…Book　Creator）、mec（E…ditor　eBook　piler）等。不过这种技术如果使用不好，可能会在注册表中产生垃圾，或产生垃圾文件（插件本身是一个控件，一般用DLL实现，使用前必须在注册表中注册）。
7、最后一招
即使使用Asynchronous　Pluggable　Protocol，由于在IE内核中还存在可显示的HTML源代码，因此还是存在被导出的可能，这个就是上面正文里讨论了半天的东西。
我想到的最后一招制作防反编译的电子书的办法就是：在制作的时候，将所有页面内容全部转换成图片，然后再打包。将网页转换成图片的源代码参见这里：
codeproject/internet/htmlimagecapture。asp
使用这种方法，在拿到一本制作好的电子书后，想得到原始文本信息的方法大概只有两个：OCR和key　in。这个也可以用起点中文网的方法来对付：使用手写体，加水印，故意增加错别字或替换标点符号等。据传说，起点就是根据用户ID，生成错别字和错误标点的，因此如果是原样key　in或OCR，就可能被查出来。
但是回头一想，如果哪个电子书制作工具真的走到了这一步，大概也就离消亡不远了，用户还不如直接去做PDF：
所有动态效果全部没有，页面上的链接也全部失效，大概又只能靠在左侧放一棵目录树才能导航了。
页面大小、字符大小基本固定，显示的时候很难放大、缩小，尤其是放大的时候，要么速度比较慢，要么必须忍受难看的锯齿。
文件尺寸大增。对于以收藏为目的的电子书来说，这是一个必须以严肃的态度，认真地加以考虑的问题。