http://blog.ikindle.mobi/archives/302

先同意楼上。从豆瓣抓取标签固然好,还是不如分类来的实在。仅凭一个书籍的链接估计是抓取不了了。干脆自己建分类好了。 1、提供用户用户上传时选择分类的功能,每本书属于一个大类,N个小类(比如算法导论在豆瓣既是算法也是编程)。 2、提供其他用户报告分类错误的功能。用户如果觉得哪本书分类有问题,可以用此功能报告。

再提两个自己的建议

第一个,抓取作者的时候为啥只抓取最后的一个- -,如果不能抓取多个作者,至少也抓取第一个吧。

第二个,可以参考http://library.nu/,对于版本信息(是否扫描(主要针对pdf),是否有封面,是否有目录等)可以采用‘判断题’的形式,个人觉得效果会比现在的‘填空题’的形式要好。大多数上传者的版本信息还是太简略了。参考我传的这本:http://ikindle.mobi/book/detail/955?next=/book/