第一次的爬虫

老实说我就是一菜鸟小白,学习程序设计也不过一年多吧,而且也不是特别拿手,就是希望能透由这次的自主学习多得到些乐趣,能够继续坚定我走程序设计这条路的心。这是我第一次做这种自我学习的文章,就是可能会有很多我理解错的地方,还请希望不小心点进来并且观看的大大们,如果不嫌弃的话可以帮助我纠正我的错误,感谢!
那拉回正题,前两天关於node.js的初步练习就先告一段落了,接下来就是正式开始爬虫学习。这篇呢,会先讲讲我第一次爬虫的准备,下一篇才会有实作,所以这篇可能会比较短吧。
首先,关於node.js的部分,我所要使用的套件有express(就上篇提到过能够简单架设一http服务器)、superagent(关於这套件我也不是很了解,不过这次是要来请求目标页面)、cheerio(这个好像是常见的爬虫套件,主要是获取所需的资料资讯),大概就这三个。下面是将三个套件装在专案中
https://ithelp.ithome.com.tw/upload/images/20210908/201410743HiZbkR1Kg.png
接下来是这次爬虫的目标是新闻,百度新闻的热点要闻。选新闻是因为感觉新闻标题一个个的,在页面资讯中很容易分辨。那下面补充说如何快速找到所要资料的资讯结构。
当然可以使用F12来打开控制台,但在茫茫资讯中想要找到所要的可能会花一些时间,所以只要将游标移置所要的资料上,点击右键,选择”检查”,控制台出现的同时也会把资讯反白出来。
https://ithelp.ithome.com.tw/upload/images/20210908/2014107493KSrrrKUL.png
https://ithelp.ithome.com.tw/upload/images/20210908/201410740J6rGLR0W5.png


<<:  Day-8 剖析Excel排序功能

>>:  DAY8 - BFS

Unity与Photon的新手相遇旅途 | Day22-Photon Lobby UI (下)

今天讲的内容为制作Lobby的一些基本简单UI(下集)。 ...

[从0到1] C#小乳牛 练成基础程序逻辑 Day 9 - 运算子Demo 程序码演示

实码演示 | 算术-数值 | 逻辑-T/F | 递增递减 | 前置後置 🐄点此填写今日份随堂测验 ...

Day 12 - 下单电子凭证及Stock股票Order建立

本篇重点 api.activate_ca 启动下单电子凭证 Stock股票Order建立 api.a...

Day21-JDK可视化监控工具:jconsole(一)

Jconsole介绍 Jconsole是一个JMX相容的监视工具。它使用Java虚拟机器的JMX机制...

33岁转职者的前端笔记-DAY 17 Bootstrap 介绍及使用方法

什麽是 Bootstrap ? 是一个框架系统 是一个UI的框架 (framework) 已提供现成...