javascript - java如何从一个文件下载链接中获取真实的url地址
本文介绍了javascript - java如何从一个文件下载链接中获取真实的url地址的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
在写爬虫的时候需要下载每个网页的附件,比如
http://www.jsqts.gov.cn/zjxx/...
这个网页,附件的链接是http://www.jsqts.gov.cn/zjxx/...;
如何从这个链接中获取真实的url?我用chrome打开链接可以直接下载附件,然后查看下载地址得到的是http://www.jsqts.gov.cn/zjxx/...;
也就是说怎么从http://www.jsqts.gov.cn/zjxx/...解析出http://www.jsqts.gov.cn/zjxx/...。。
求大神指教
解决方案
你如果用java的HttpURLConnection的话,必须设置setFollowRedirects(false),默认是true,也就是java会自动跳转,这样无法得到中间步骤的应答头信息。
发起请求后,用getHeaderField("Location")即可获得跳转地址。
这篇关于javascript - java如何从一个文件下载链接中获取真实的url地址的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文