准备做个 wantu.yfzdg.com 目前 网站已经扒下来了 ,但是内容还没有。
目前2个方向:
wantu.taobao.com
tmall.com 数据直接抓取
本品文章是根据wantu.taobao.com 写的 这只是个记录 最终的抓取类没有做 因为我觉得这样抓取太费时间了.
wantu数据抓取还真心尴尬 里面有些数据确实让人挺纠结的 :
首先按照关键字 进入 分类抓取【列表】
http://wantu.taobao.com/search/picture?spm=a1z0j.1000655.5070275.2.kvmFmC&q=%C5%AE%D7%B0
抓取后获得 【单独分享url】 进入页面后 自动抓取 改分享内容的相册数据 + 当前 分享数据的详细信息
http://wantu.taobao.com/detail/66439071?spm=0.0.0.0.sANXQT&wantu_c=qinzi&u=26524668
某用户分享相册数据 picid 为当前图片信息 userid 为用户id albumid 相册id 【相册信息】
http://wantu.taobao.com/ajax/PicDetailAjax.do?picId=61484452&userId=234517611&albumId=22269298&_method=read
某商品详细信息 包括价格等 需要传入imgfiled 【分享url信息】
http://wantu.taobao.com/ajax/PicDetailAjax.do?_method=get_auction&picId=61484452&userId=234517611&imgFileId=17611020004786368
😯 目前为止我还不清楚淘宝客是怎样做的。。。