

互动娱乐---图书运营商
作者:三联生活周刊(文 / 邹剑宇)
(
4月12日,Google公司首席执行官埃里克·施密特(右)与Google中国区总裁李开复在拼写中国汉字“谷歌”,正式宣布Google的中文名字为“谷歌”,意为丰收之歌 )
上网搜索一下《论语》,结果有《论语》所有的篇目和原文。但是搜索相对专业、生僻的图书,比如《说郛》中所收录的古籍,得到的结果就不像《论语》那么好了,至少网络上还读不到它的原文。想看《说郛》中的内容得去大图书馆。
图书是人类文化的主要载体,图书上网与当下的新闻、社会记录上网有同样的意义:一个完成新生信息的网络化,另一个让过去的文明资产上网。说大了这是一个追寻历史、延续文明的大事情,有互联网以来就是人类的一个梦想。由于已有书籍的数量巨大,以目前的手段(主要是扫描,重新打字录入,还有保证没有错误的问题)似乎是一个不可能完成的任务。
1999年我采访当时最大的中文图书个人网站“黄金书屋”的站长,年轻的站长每天做两个事情:不停地扫描和上传,累个半死,然后靠一些广告每月拿3000多元维持生活。在他扫描的书里面,部分书籍已经没有版权,比如《红楼梦》四大名著。但由于他扫描后没有做数据处理,留下的文件里如果有该书的出版社排版时制作的特殊版式,也还有被追究侵权的可能。而另外一些例如温瑞安小说,作者温大侠还活着;古龙小说的作者虽然已经离去,也没过50年期限。对此站长无言以对。1999年是网络内容建设的初级阶段,没人追究这些。
直到有一些大公司介入,例如微软和盖茨本人就购买了许多书籍、名画和百科丛书的版权,世界级出版社的电子出版也不是新闻。微软公司发行的《微软百科全书》是目前最著名的电子版全书,用户从此不再受查找之苦,需要的只是输入关键词再查询。
“输入关键词——查询”这一动作做得最好的显然是Google,其英文版的图书频道早已启动。按照Google处理信息的范围和它目前面对的用户来说,这个图书频道绝对不会仅仅是“Google出版社”(就像微软做的那样)做几本电子书那么简单。6月5日,Google(谷歌)公司宣布清华大学出版社和少儿出版社成为其图书搜索的首批合作伙伴。Google是怎么做的?它并不买版权,但是它让书籍上网。
Google和出版社签的合同里,书籍上网目前有3种方式:全文上网、部分内容以文本形式上网、部分内容以图片形式上网(图片文件和文本文件的区别在于,文本文件里的所有内容都是可以复制下来再使用)。版权方(出版社)根据自己的需要选择。Google做的是让这些文件可以被查询的人迅速找到,然后用户再去找买书的途径。此前Google给版权方提供的服务都是免费的,但是卖书的广告或者其他广告,则要给Google付费。
对于一些版权期限过时、进入公共领域的书,Google只需买一本样书或像它制订的“图书馆计划”那样,从图书馆批量“借阅”扫描,成本就更低了。虽然Google做的还是“黄金书屋”站长做的那个苦差使:扫描,上传,但是手段升级了。
Google为此专门开发了一个扫描仪,Google大中华区总裁李开复介绍说:他的扫描仪可以辨认图书里的文字、图片和图片里的文字,辨认图书里上下文关系等等,扫描后的文件处理后和Google的搜索软件对接。有一些古书无法切开单页扫描,为此还专门开发了一个翻书仪。最后的操作画面是这样的:一个工人脚踩扫描开关,翻书仪自动翻一页,开关喀嚓一下完成扫描,再下一页……(类似的机器中国有家公司也开发出来了,不过是用来扫描和处理名片信息,商业模式类似于当年的商务通。)
原则上,Google拥有扫描后的文件而不与版权方共享,因为“出版社一般没有这么大的存储硬盘”。因此图书频道的内容和它每天从全球互联网抓来的其他信息页面不一样,只有Google拥有完整的图书数据库,尽管它不拥有版权。
按照一般的预测:图书出版与音乐出版一样未来将紧密地和互联网结合,传统出版社越来越像做收藏品的公司。内容和读者将直接见面,价钱和购买方式也不会是买一整本书、大家都付同样的价钱。这个变化应该比唱片业遭遇的变化要缓慢,但是像Google这样掌握内容和用户的公司肯定成为“图书运营商”,尽管它现在“只收广告费”。■ 图书运营商