Day 10 Self-attention(四) 要如何平行运算?

Self-attention

昨天讲到要怎麽用input的四个vector,a1、a2、a3、a4来产生b1
但是今天没有要介绍b2到b4是怎麽产生的,因为这几个值的产生方法都跟b1一样

b1到b4这几个值并不是依序产生的,而是平行被计算出来的

那这几个值是怎麽被平行计算出来的呢?

平行计算的方法是利用线性代数的方法做矩阵运算,把a1~a4串成一个向量
产生的结果就会得到Q、K、V这三个矩阵

由於明天有点事情,今天的进度明天会再补上
今天先打到这边


<<:  Day 8. 版控很重要!

>>:  Day 04: Anaconda开发环境 Jupyter Notebook

Day-12 Pytorch 介绍

机器学习的路上仍然需要撰写程序来达到我们期望的效果,在前面的文章中,我们已经介绍了从机器学习的基本...

MVC架构

Model 常译为「模型」,负责和资料库沟通。这里我们要先注意:应用程序和资料库是两个不同的东西,在...

结语

终於!! 来到最後一天了,先为自己鼓鼓掌。 想不到我也撑好撑满,写完 30 天了 这些文章也将会同步...

OpenCart 4.0 内建一页式结帐

今天稍微测试了一下 OpenCart 4.0,很多地方不同於 OpenCart 3,之前光是看到规格...

走骇客的路让骇客无路可走

废宅看到的几个新闻重点 上级机关视察回收厂发现圾垃车满戴、系统资讯与现况不符合,经行政程序报请南调组...