爬虫遇到 js 动态数据时,主要解决方法有两种:
- 使用一些库,例如 Selenium,来模拟浏览器环境抓取数据。但这样做对内存和 CPU 的消耗都比较大,爬虫效率低,应尽量避免。
- 手动分析 js 请求
下面我选了一个漫画网站作为小例子,讲一下第二个方法。
https://manhua.sfacg.com/mh/YSJ/4519/
我们的目的是获取漫画图片 url,然后下载下来。
爬虫遇到 js 动态数据时,主要解决方法有两种:
下面我选了一个漫画网站作为小例子,讲一下第二个方法。
https://manhua.sfacg.com/mh/YSJ/4519/
我们的目的是获取漫画图片 url,然后下载下来。
这篇文章主要讲 MyBatis 的配置, Spring MVC 的配置,以及 SSM 整合配置。此文章仅涉及常用的基本设置。
本文章是基于我个人的理解和知识水平,通过查阅资料所写下的笔记总结,主要是方便自己记住常用的基本配置。更详细的知识点请参见文末的参考资料。
1 | ArrayList<String> a=new ArrayList<String>(); |
-
使用hexo+github搭建个人博客,具体操作见参考网址
http://mp.weixin.qq.com/s/rMZZkHbMeKXsSAvAdsgyRw
这里我用的是next主题,GitHub地址
https://github.com/iissnan/hexo-theme-next
在站点目录打开git bash,输入
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
1 | $ hexo new "My New Post" |
More info: Writing
1 | $ hexo server |
More info: Server
1 | $ hexo generate |
More info: Generating
1 | $ hexo deploy |
More info: Deployment