登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

破解Google book方法的探讨  

2009-12-10 22:33:27|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

什么是Google Book?

Google Book是Google推出的图书计划,前身是Google Print。Google想要打造全球最大的电子图书馆,实际上是图书检索系统。换句话说,Google为了避免可能发生的版权纠纷,并不提供电子书的下载,只是提供有限预览,目的是让读者“看好了去书店购买”。

每本书的内容都是不完整的?

不知大家使用过“读秀”么?只要在读秀的检索系统中可以“试读”的图书,都可以找到电子版。明白了吧?如果Google扫描纸质图书,难道会刻意留下几页?只是我们在网站中能看到的预览版本,是经过处理(限制其中一部分页面访问权限)的而已。

使用Google Book遇到的问题和解决方法

1、我能看到完整的图书么?

曾见某网友提到,用不同IP登陆,“限制阅读”页面是不一样的。即,Google是对不同的人有不同的限制,于是通过更换IP(使用代理,或者 ADSL用户“重新拨号”即可)即可搞定看完整图书的问题。不过,经过我的尝试,却没有发现此类情况。由于研究Google Cookie的资料大多是2007年以前Google Print时代的成果,貌似现在已经失效,不知那位高人有高招?

2、为什么我只能看几页?

虽然“限制阅读”所能限制的量一般不超过20%,但由于Google对同一IP的预览页数有限制(大概三两页,中文图书有的可能会多一些,不知何故),故而经常给我们带来不便。不过这个问题好解决,只需要在页面右上角“在此书中搜索”中输入某一常见关键词(这和书籍种类有关了,比如桥梁工程,就搜索“桥”),即可看到带有此关键词的所有页面,而这些页面的前后几页也就都能看到了。

有人尝试搜索 1 or 2 or 3 or 3 or 5  ,搜索页码,更加奏效。

我能把Google Book上的电子书下载下来么?

这也是我正在尝试的工作。完成这项任务,需要两个步骤:第一,需要得到书中每页图片的下载地址;第二,把这些图片下载下来。

这其实一点也不简单,因为Google不会让我们轻易得逞……

方法1:firefox+Greasemonkey

步骤:英文好的朋友,可参考这里。其他人可向下看:

  1. 打开Firefox,没有的话去下载一个;
  2. 通过firefox,打开这个网址,安装Greasemonkey插件。【注】此插件的功能是允许执行一些自定义的JS脚本,实现高级的网络功能。
  3. 打开这个页面,点击右上角的“Install”按钮,安装Google Book Downloader脚本。
  4. 安装后,重新打开图书的页面,在左上角出现”Download  this book”按钮,当然是要按下去啦。
  5. 随后,程序自动查找可以下载的书籍图片下载地址。

本插件的功能,也就只能达到“获取下载地址”了,这点请注意。下载的时候,可以使用Flashget,迅雷(尽量少用),或者DownThemAll插件。期间若遇到无法下载,那就是代理的问题了,不再此文讨论范围之内。

方法2:使用Google Book Downloader下载

这和上面提到的不一样,这次可是一个现成的软件,集合了检索页面+代理下载的整套功能。官方网站在这里,安装步骤如下:

  1. 确认你已经安装了Microsoft .net Framework 3.5 SP1 。如果没有,则到这里下载安装。需要注意的是,这个软件安装时间非常长~
  2. 下载并安装GBD
  3. 此软件为绿色软件,解压后运行mgbd.exe即可。
  4. 在Book Code 里,输入书籍ID,然后点击CHECK,开始检索图书。
  5. 检索完毕(有时程序不停止,自己看差不多了就STOP),点击Download all开始下载。

【注】Book ID的获取,看图书链接地址,举例:http://books.google.com/books?hl=zh-CN&lr=&id=0u5G8E3uPUAC&oi=fnd&pg=PA1&ots=oo670o8cZ0&sig=SHw29x_8OJxDtdh68uD-6pL3yOA#PPP1,M1

红色的部分,就是ID,在软件中输入0u5G8E3uPUAC即可。

如果你还有其他好方法,欢迎与我分享啊。

原创文章,版权所有,转载请注明源自清溪长河

原文地址? http://www.10kn.com/google-book-download/

 

 

update:老鬼介绍了一个折腾的方法:
可以在 Firefox 上试一试下面这个方法:

首先,你要安装 浏览器 firefox、扩展 greasemonkey、脚本 google book downloader、下载工具如 flashget

这三者的关系是,脚本 google book downloader 的运行需要“扩展greasemonkey”,“扩展 greasemonkey”的运行需要“浏览器firefox”。

你安装好这三个东东后,打开 http://books.google.com/,输入你想要的书籍,如 Neuroeconomics: Decision Making and the Brain,就会到达这个页面。

点击 download this book 按钮,Google 图书的每页就以图片链接格式呈现,等到全部解析完毕,你可以用 flashget 下载全部链接,下载完后以注释来重命名,然后再用 acrobat 压制 成pdf,这样书就下过来了。

整个过程相当复杂,但能批量下书实在是太幸福了。

  评论这张
 
阅读(5241)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018