我们前面所练习的资料视觉化在数据领域中比较偏向後段的工作。
一个完整的数据分析专案(数据团队)包括了以下五个环节:
1.取得原始资料
2.清理原始资料
3.模型训练/评估
4.资料视觉化
5.决策应用
看起来只有五个环节很容易理解,不过在这当中又包含了以下或更多的所需知识技能:
1.程序语言(Python or R or Excel vba)
2.资料库(Oracle or MySql…等)
3.网路爬虫
4.资料ETL(载入、清理、读取)
5.资料视觉化(Power bi or Tableau…等)
6.机器学习
7.深度学习
8.影像辨识
9.自然语言处理
以上是针对有兴趣往资料领域发展的人可以先做功课的建议。
回归我们这30天的练习,我们所接触到的资料集(原始资料),几乎都是整理好的(乾净的),不过在现实企业中,其实是纠结在一坨,就像是找不到线头的毛线一样。
所以我们前面练习的内容可以说是学习制作视觉化报表的那种思维跟感觉,我觉得一个资料分析师必须要有一个客观的态度,不知道的事情就不要预设立场,而且一个很重要的就是「保持学习,学无止尽」。
很高兴今年参与铁人赛,挑战成功了。
明年若时间允许还会再报名参赛的,到时候的主题会比较focus在资料的ETL。
Hachicorp Consul: Server configuration for product...
问世间Docker为何物,直教DotCloud以死相许,所以Docker到底是虾毁?不仅让当时云端巨...
团队目标的建立 提供对应的元素,催化IT团队与事业体相呼应的目标 身为产品经理,需要清楚知道公司目标...
如标题,这篇想教大家如何自己手动分割硬碟 Windows有C槽、D槽、E槽……等,但linux没有w...
到底是页面还是纯指令? 这是一开始碰 php 的时候会觉得蛮混乱的地方,或者说网页後端的情况应该都差...