我们的基因体时代-AI, Data和生物资讯 Day29-大数据追踪COVID病毒之演进

上一篇我们的基因体时代-AI, Data和生物资讯 Day28-COVID大数据:资料哪里来
开始进入另一个主题,关於COVID时期,其衍生的资料量其实是相关可观的,分享目前有哪些关於疫情的公开资料是可以由API、官方网站或是相关应用而来的。

典范转移:从此新兴病毒不在迷漾

这次COVID疫情,造成全世界的动荡不安,但其实对於生医领域的人则是看到完全不一样的一面,就是人类生医技术的进步,怎麽说呢?以前对於新兴传染病的认知和诊断,从来没有像现在那麽的快速,甚至过去历史没有在这麽短的时间内就开发了药物以及检验试剂,这其实就归功於基因定序技术的进步以及检测大数据辅助开发的关系。过去,对於新兴病毒传染病的诊断,都是依据病人的症状以及相关的旅游史来做推测,甚至如过去的SARS,可能都快过一年以上,才把相关的基因定序完成,可以看看下面这个时间轴,在2019年12月31号开始有相关新闻发布。
https://ithelp.ithome.com.tw/upload/images/20210929/20103989ZMTeafYQoV.png
而在2020年1月11日左右我们就有这只新兴病毒的定序资料,而且这样跨国合作的资讯就在Twitter平台上公开,相关资料也能很轻易地取得,这个算是前所未见的事情。
https://ithelp.ithome.com.tw/upload/images/20210929/20103989zweFLmq2bp.png

病毒,其实就是一段基因代码

也许这样过度简化病毒了,但本质上其实可以这样理解,细菌之於质体,有如人类之於病毒的关系,而这段基因其实决定了整个病毒的一切个性,
https://ithelp.ithome.com.tw/upload/images/20210929/20103989R6WmYYa4nj.png
从上面这个figure,其来自於Nature Reivews Microbiology在2021年三月发表的文章:Coronavirus biology and replication:implications for SARS-CoV-2,可以看到整个病毒的序列基本决定了这个病毒的行为和组成。而且这个序列过了一年,我们还持续理解更多事情。
https://ithelp.ithome.com.tw/upload/images/20210929/20103989cxrpjaHQmF.png
上面这张图的上面示意图是我们2020年初对於COVID病毒基因区块的理解,下面则是过了一年各式各样的定序资料取得後我们对其更深入的理解。

可以藉由序列的差异来追踪全世界病毒的演变

https://ithelp.ithome.com.tw/upload/images/20210929/20103989tYs7GpGAfA.png
这个来自Nextstrain网站的截图,这边视觉化清清楚楚每个COVID病毒定序资料就是一个点,每组资料的相近程度,和演进前後可以由距离和相对关系所组成的,这样的分析其实相当复杂,方法也很多,其中蛮常见的是使用[Bayesian inference in phylogeny](Bayesian inference in phylogeny)的方法

相关阅读

https://en.wikipedia.org/wiki/Maximum_clade_credibility_tree

https://www.publichealthontario.ca/en/data-and-analysis/infectious-disease/covid-19-data-surveillance/nextstrain

Su, S., Du, L. & Jiang, S. Learning from the past: development of safe and effective COVID-19 vaccines. Nat Rev Microbiol 19, 211–219 (2021). https://doi.org/10.1038/s41579-020-00462-y

V’kovski, P., Kratzel, A., Steiner, S. et al. Coronavirus biology and replication: implications for SARS-CoV-2. Nat Rev Microbiol 19, 155–170 (2021). https://doi.org/10.1038/s41579-020-00468-6

Hu, B., Guo, H., Zhou, P. et al. Characteristics of SARS-CoV-2 and COVID-19. Nat Rev Microbiol 19, 141–154 (2021). https://doi.org/10.1038/s41579-020-00459-7

Fernandes, J.D., Hinrichs, A.S., Clawson, H. et al. The UCSC SARS-CoV-2 Genome Browser. Nat Genet 52, 991–998 (2020). https://doi.org/10.1038/s41588-020-0700-8


这个月的规划贴在这篇文章中我们的基因体时代-AI, Data和生物资讯 Overview,也会持续调整!我们的基因体时代是我经营的部落格,如有对於生物资讯、检验医学、资料视觉化、R语言有兴趣的话,可以来交流交流!


<<:  Day14# Thread

>>:  离职倒数2天:40%的工作没意义,为什麽还抢着做

第 11 天 迈向下个阶段努力( leetcode 005 )

https://leetcode.com/problems/longest-palindromic...

14. 为何归咎於human error不是个好作法?

前言 这篇是个非常general的议题,关於从错误中学习,适合所有的工程师看。如果你常遇到工作上把...

DAY 09 Extends, Inhreitance

共用与继承 Extends, Inhreitance 官方宣称最方便、有用的方法,但我觉得参数比较有...

关於因果关系推论-AB testing

你是不是有碰过以下问题: 新产品上线介面优化不知道哪一个版本比较好? 行销活动中哪一个素材能真正打动...

[Day 24] DOM Array Methods 实作练习

前言 当 JS 学了将基本语法练习、观念都学过之後,就开始学找实作练习,透过看老师的作法慢慢拆解每个...