爬虫怎麽爬从零开始的爬虫自学 DAY16 html基本介绍

前言

各位早安，书接上回我们完成了 python 基本知识的介绍，今天我们要来介绍 html 也就是网页的编写语法

html 介绍

一样开启 VSCode
点选新增档案只是这次档名取 index.html 就建立好 html 档了

建好之後要加入内容
html 是从上到下照顺序显示
并且由许多组标签构成

先给你们看最基本的结构

可以看到每组标签都有一个开始标签跟一个结束标签
标签由 < > (角括号)包住结束标签会比开始标签在前面多一个 /

我们先讲如何看我们写出的网页

用我在图片中标示的方式打开就会看到我们刚刚写的网页记得在 VSCode 先存档

打开长这样

对应关系都标明在上面了
其他如下

第一行 <!DOCTYPE> 是告诉你的浏览器档案类型
下面由 < html > < /html > 包住的是网页内容
< meta > < /meta > 是告诉浏览器我们要用 UTF-8 编码方式
有缩排代表是在他的区块里面例如: < title > 是在 < head > 里面的
html 是一层一层包住的每个标签都一定有对应的结束标签
所以我们找资料的时候也是一层一层呼叫

有这个概念後基本上我们已经能大概知道我们到时候想抓取的资料位置在哪
html 的部分我就不细说了剩下的明天我们实作爬虫的时候会再教大家怎麽看