[Python 爬虫这样学,一定是大拇指拉!] DAY15 - Cookie / Session

相信 Cookie 与 Session 很多人常常搞不清楚,今天就用超级简单的方式来让大家了解。

Cookie 与 Session

不知道大家还记不记得,HTTP 有个特性(HTTP / HTTPS 复习传送门),那就是每次连线都是独立的,与前次连线都毫无关系。以现实来比喻,就是每次跟同一个人讲话时都要重新自我介绍,明明前 1 分钟才自我介绍过==

所以!要怎麽让 HTTP 解决这个问题呢!?那就是偷偷记下来拉~
那记下来之後,恩...要放哪里呢?重点来了,会根据这些偷记下来的资讯的存放位置来给予称呼。
存在 Client 端的,叫做 Cookie
Server 端的,则叫 Session

  • Cookie

    • 记录网站上的个人设定或是操作,像是:购物车,填到一半的资料等。这也是为什麽有些网拍网站,明明没登入下次再访问同个网站时,却还能记着你购物车的内容或输入的资料。
      有些也会记录登入资讯(Session ID),这样就不用每次一直重复登录了!
    • 而 Cookie 是以明码的方式储存传送的,又是存在 Client 端,所以有被窜改的疑虑,所以通常不会放太重要的资料。
    • 另外 Cookie 也是有时效性的,像是太久没访问某个网站,就需要再重新登入一次。
  • Session

    • 相对於 Cookie 而言安全性高,因位处存在 Server 端。主要记录 Server 上使用者的资讯,像是人数计数器、使用者的访问日期、登入资讯(登入日期、Session ID)等。
    • Session ID:就是使用者登入後,会产生一组 Session ID 。通常会存入 Cookie,当使用者再次访问时,Server 会去确认此 Session ID 使否存在或失效,来要求使用者是否需要重新登入。

所以有些资料是需要登入後才能获取的,就需要在爬虫程序中把 Cookie 的资讯填上,来维持登入状态。

以上就是 Cookie 与 Session 的简单介绍!


<<:  [Day 30] 资料产品开发实务 - 完结撒花!

>>:  【DAY 16】关於微软生产力平台 Microsoft Power Platform

Day 26 - XSS 与防范输入相关攻击的方式

倒数五天!倒数五天!倒数五天! 出於书本 Chapter 14. Web sites and Ap...

[Day 16] 第一主餐 pt.8-我带几个data去。你就在此地,不要走动

上一篇由於作者有点不舒服,因此用了HTTP code灌水...不是... 因此中场先讲些HTTP c...

Youtube Analytics API 教学 - 年轻人取暖小窝 'ageGroup' 维度

「鲑鱼均,因为一场鲑鱼之乱被主管称为鲑鱼世代,广义来说以年龄和脸蛋分类的话这应该算是一种 KNN 的...

卡夫卡的藏书阁【Book18】- Kafka - KafkaJS 生产者 - 6

“I have spent all my life resisting the desire to...

如何修复无法在Windows 10中创建恢复磁碟机的错误

Windows 10允许您创建复原磁碟机,以便您可以使用该装置将Windows 10复原到以前的日期...