在处理资料时,有些资料需要需要做转换,如在做分类时直接将每个类别都直接丢下去做训练,这样比较难训练外还有可能训练结果不好,所以将类别或是文字的资料标记成数字,而在做训练时程序能更好的运算。
Label encoding:只要新增一个类别,类别的那一栏位就增加一个类别。
One hot encoding : 为每个类别新增一个栏位,用0和1来表示是否存在。
两者更有利弊,在第一种,若在Categorical的那一栏,有顺序大小之分,当我们对其进行Label encoding後,在训练时模型可能会误认为数字越大的代表'大於'小数字,但其实这数字只代表他们是不同种类,那这种资料使用无序的离散值One hot encoding会比较合适。
在每一种资料使用前都要去了解资料背後代表的意义是甚麽,要如何使用这些资料在训练上最为合适。
>>: [Day 22] Edge Impulse + BLE Sense实现唤醒词辨识(下)
最後一天复习一下 Django是MTV架构 MTV架构分别是model、Template、views...
这礼拜进度缓慢了下来,还在跟第六周的切版作业奋斗。到这边才慢慢找到自己切版比较顺的流程 RWD 一开...
Event 事件是什麽? Event 介面表示一个在 DOM 物件上所发生的事件。 一个事件可以是由...
Fragments在Navigation中的参数传递 - SafeArgs 继上篇我们得知如何运用N...
对於网上可用的服务,通常使用通过ID和密码进行身份验证,以验证使用者是否有权使用该服务。LINE 开...