资料分析商业应用与策略管理 #笔记四

举个平时所接触到的巨量资料例子:金融领域应用,股市、汇市、债市... 有人向银行申请信用卡不过,就是因为银行的系统侦测到一个人可能有多张信用卡,此时再根据其他因素推断是否继续让此人多申办是合适的。金融科技以网路平台为基础,透过网路互联进行金融服务,以线上服务架构出金融科技云端服务平台,以社群以社群网路和搜寻引擎使用大数据应用支持金融业务服务,应用大数据的可以是网路银行,也可以企业或个人对於小额支付、外汇交易、存款贷款的挑选。

金融科技与大数据结合的优势,在於资讯多、资料全、搜集范围广、费用 / 帐目透明化、自动化以後得以节省时间人力物力、传统银行容易排除不易发觉的客户... 等,但同样有竞争加剧、资讯流通加速、资安问题的风险。我们来利用 Python 数据爬取的内建网路联通功能,试试看取得重要的金融资讯,打开 Jupyter 利用 http 通讯模式找到远方服务设备沟通 io 和 urllib.request,找到台湾证券交易所网址并贴进 url 里(记得加上 https),再加上外挂去把某一页放到 page 里,再读取到 mypage 的变数里,送过来会先看到网路完全没排版的原始码:
https://ithelp.ithome.com.tw/upload/images/20201015/20129989V0LJ4TJEPZ.png

建议只要不是纯英文的网页,输出撷取资料时把内部字串加上编码对照:
https://ithelp.ithome.com.tw/upload/images/20201015/20129989S8NZJsPZYi.png

假设资讯提供者直接提供重要资讯的文件档案,可以透过标准 java io 准备预计留下来的文件档案,告诉它我要存成 x.html,预计写入 (w),标准编码是 utf-8,完成之後关闭档案。回到 Jupyter 资料夹,就发现抓回来的文字档被我们抓回来了。
https://ithelp.ithome.com.tw/upload/images/20201015/20129989Es0DueIyws.png
https://ithelp.ithome.com.tw/upload/images/20201015/20129989OkqJojiV3B.png


<<:  关於使用 ID 及选择 CSS 选取器

>>:  第30天:终於撑到完赛QQ-後端或是ASP.NET Core的学习笔记

Expression 与 Statement

表达式 (Expression) A unit of code that results in a ...

[Day-2] 探索Dev C++

我今天要来记录探索Dev C++的过程 还有C++的基本架构 我所使用的开发环境是Dev C++ 上...

程序码流程规划之...日记文

今天,依然是篇日记文,每天遇到的事有太多好写了。 一早 同事:Mandy, 今天是 deadline...

Day11:【TypeScript 学起来】只有 TS 才有的型别 : Union Types(联合型别) / Intersection types (交集型别)

四个工程师一起坐上了车,发现车子发不动了。 机械工程师说: 看来是引擎出问题了。 电机工程师说: ...

Day16 - RadioButton(一)

RadioButton多选一的单选按钮 听到名字很多人都会以为RadioButton本身就提供单选 ...