[Day 3] 资料产品第一层 - 原始资料的类型

原始资料可能来自非常多不同的地方,我们可以根据资料产生的方式来加以分类

感应器资料

这边泛指各种 Sensor 测量得到的资料。Sensor 是普遍用来将资讯资料化的工具,像是温度计、地震仪、光度计等等。以自驾车来说更是在车内车外都布满 Sensor,像是感测距离的、感测光线、感测电池电压、视讯等等。

https://ithelp.ithome.com.tw/upload/images/20210903/20141140BkUJyuqHtr.jpg
(Credit: www.nytimes.com)

使用者输入

有些资料需要使用者自行输入才能得知,例如 Email 帐号、密码、性别、生日等等,另外像是心理测验、性向测验、意见调查等等,需要依赖人类判断才能得知的资料,都需要使用者输入。另外像是机器学习或是 AI,也需要大量的使用者协助贴标签才能得到训练资料。像 Google 也常透过这种验证机制来让世界各地的使用者来协助辨识文字或图片。

https://ithelp.ithome.com.tw/upload/images/20210903/20141140GikCluBbOu.png

互动资料

所谓互动资料是使用者在跟装置互动过程中留下的资料。例如大家常常看到的网路广告,其实背後我们会埋下非常多的资事件,当这些使用者事件发生时,就会向 Server 回传资料。像是打开 App 的时候、特定页面出现时、当广告被曝光时、广告被点击或是被按 X 的时候,都会留下这些数位足迹。这些互动资料可以帮助这些 App 开发者或广告代理商更了解使用者怎麽跟他们的产品互动,进而进算像是用户留存、点击率、跳出率的数据来优化产品。

https://ithelp.ithome.com.tw/upload/images/20210903/20141140NLXeWz6Jyx.png

交易资料

交易资料特别指的是发生交易行为时的资料。例如上网购物,在银行存钱、提款时都会产生交易资料。交易资料由於资料性质比较敏感且不允许发生错误,所以会特别注重交易机制的设计,毕竟没人想要帐户明明没有钱却还能提款、或是明明付了款但是厂商没接到订单这样的情形发生。

机器资料

相对於由人类留下来的行为资料,机器资料就是在机器或装置在运作过程中记录下来的资讯。例如当你的电脑当掉时,会出现一份机器产生的报告,里面包括了机器型号、资源、当下发生的错误讯息等等方便工程师查找 Bug。那像我们平常在运行 Hadoop Cluster 时,也会需要各个节点即时地将机器资源(CPU、Memory、网路 Latency)这些资讯集中起来,方便我们观察机器的状态。这些机器资料也有赖软件开发时埋入相关的 Log 讯息并送出来。

操作资料

操作资料指的是执行商业逻辑时留下的资料,也就是软件执行时的 Log。像是我们在写爬虫程序时,可能会在与网站建立连结时发出一个「已建立连线」的讯息,然後每爬完一页的资料就留下一笔「以爬完 XXX 页」这样的讯息。这些讯息有助於开发者了解程序目前运行状态,搜集这些 Log 也有助於我们分析程序的运行是否正常。

小结

今天介绍了几个常见的原始资料来源,希望让大家更能了解生活周遭的原始资料,未来在开发相关资料产品时,也能知道可以在哪里埋下资料的种子。

References

https://simplicable.com/new/raw-data
https://www.electronicsforu.com/technology-trends/tech-focus/automobile-industry-sensor


<<:  Day03 测试写起乃 - 安装Rspec

>>:  [Day 3] Atomic Operation

[Angular] Day14. Built-in directives - structural

在上一章中介绍了 attribute directive 的用法,接着要来介绍另一种 Angular...

[Day 08] Sass - Nesting

Nest CSS with Sass 在Sass中,可以将CSS一层一层的包起来,不但简单直觉能直接...

[Day29] 立即函式 IIFE

立即函式简介 立即函式 IIFE (Immediately Invoked Function Exp...

【Day28】建立一个 LUIS Bot

今天我们要来将 Chatbot 与 Language Understanding Service (...

D-27-变数 variable ? int ? string

认识变数 variable 在昨天的历程中小光学习到如何透过dotnet cli来产生专案跟方案,并...