Day5-如何超越Google

今天也来讨论一个科幻问题现在一台家用的Home Lab的处理能力是否超过当年Google的Date Center,众所周知Google的三驾马车GFS、MapReduce、Bigtable最早发表於2003年,那时Google号称它的Date Center已经有破千台Server,出於方便计算假设全部的服务器全采用Supermicro X6DH8使用Intel Nocona Xeon单核处理器(2004推出),因为是双路主机板(可以插两个CPU)故整体跑分提高为431分,但分散式系统最大的问题是IO,当年的记忆体,硬碟,网路可是慢到靠杯,同时IO属於特权指令导致程序必须在User Mode与Kernel Mode反覆切来切去,而且记忆体在北桥但网路与硬碟在南桥所以在整个分散式系统中单台机器能发挥的效能给它打个5折好了得215.5分。但考量当时IBM的大型主机 or 超级电脑价格昂贵,以Google的规模使用Intel x86白菜服务器组分散式系统就算单台机器只能发挥出3成效能,从财务的角度出发也是很划算的所以Paper一发表,Yahoo!就跟着做了一个类似的系统名为Hadoop, HDFS, MapReduce。

2021/10为止在Geekbench上跑分最高的是AMD EPYC的7万5千分,OS选ubuntu 20.04配上GIGABYTE R282当Home Lab刚刚好,微软的小算盘拿出来按一下,7万5除215.5得348而且现在还有NVMe, SSD, DDR5, PCIe 4/5 , GPU(早期的GPU只能做影像处理没有甚麽科学计算与数据处理能力,毕竟CPU里除了计算单元ALU还有控制单元CU) 加上不用跑网路自然不会有封包碰撞, 路由, 网路设备故障等一拖拉库的问题,也就是说现在一台Home LAB的处理能力确实有可能跟2004年Google的Date Center的处理能力一较高下何况1台Home Lab不够可以买3台呀,只要机器都属於同一个物理二层网路效能耗损与延迟应该不会太大,再挂个Load Balance或做HA简直美滋滋。最後这就是一篇科幻文完全张飞打张菲,喔说错是张飞打岳飞。

终於知道为什麽Python等了20年才称王,以当时的CPU用Python算MSE(均方误差),还是人工打卡西欧计算机好了。


<<:  【Day 4】机器学习基本功(二) --- Regression

>>:  02 - Elastic 的 Observability 解决方案

Day 7【钱包登入区 - Login Button】Kitten or Ice Cream?

【前言】 先来回顾一下 Day2 Project 分析的使用者流程,今天先来做第一步的 「登入按钮...

[Day8] 从入门到入狱! 用Python窃听电脑键盘事件!

《刑法》第315之1条:「无故利用『工具』或『设备』窥视、窃听」或无故以『录音』、『照相』、『录影...

Day 16 ( 中级 ) 灯光绕圈圈 ( 座标 )

灯光绕圈圈 ( 座标 ) 教学原文参考:灯光绕圈圈 ( 座标 ) 这篇文章会介绍如何使用「重复无限次...

[Day6] 注册API – model之AbstractUser

各位夥伴们大家好,今天是我们进入API阶段的第一天,在撰写API的逻辑之前,我们需要先到user\m...

DAY18聚类演算法(kmeans)

昨天介绍完kmeans演算法,今天就要实际写程序: 首先先创建一笔资料并绘图: 程序如下: impo...