2021 11-28 扫盲贴:基因上的这些符号究竟是什么鬼? 基因究竟是如何命名的? 转载请注明:解螺旋·临床医生科研成长平台关于基因,它早期的名称可以说是毫无章法,命名全凭研究者的个人喜好以及天马行空的想象力,比如果蝇里的吸血鬼基因(dracula,怕光)、蓝精灵基因(Smurf,调控SMAD)、冰山美人基因(Icebox,突变后对异性示好无感)、都铎王朝基因(tudor,无后)等等。显然,这种杂乱的命名方式,总会让科研者与基因面对面时感到一脸懵逼且无所适从,尤其不利于科研者对基... 阅 读 全 部 >
2021 11-13 手把手学习TCGA数据库:SNP突变分析第二期 各位芝士的朋友好,今天我们继续聊我们的SNP话题,前面两讲我们分享了SNP发生的位置,发生的类型以及SNP的命名,并且特意提到了SNP的两个数据库,今天我们来学习一下这两个数据库的使用。dbSNPdbSNP 全称为The Single Nucleotide Polymorphism Database,即单核苷酸多态性数据库,意思是“DNA序列中的单一碱基对(base p...阅读全文>>... 阅 读 全 部 >
2021 11-09 “浅尝”全转录组研究套路! 最近越来越多的科研君紧跟“步伐”,“玩转”起了全转录组(全转录组即包含mRNA,small RNA,lncRNA,circRNA的测序)。全转录组之所以这么火的原因就在于大家逐渐意识到单一的mRNA或ncRNA研究已无法满足科研需求,需要结合多种RNA信息进行整合分析,探索潜在的调控网络机制。而全转录组测序无疑成为阐释生物学问题的利器!但是目前存在的一个问题可能很多老师对全转录数据如何进行深度..... 阅 读 全 部 >
2021 11-06 可变剪接及其表观遗传调控(万字长文总结) 本文根据 2016 年 8 月复旦大学倪挺教授在「表观基因组学暑期国际讲习班」中的报告整理而成,本文采用第一人称叙述,文中的“我”皆指倪挺教授。报告原视频详见: 表观遗传系列视频13 | 复旦倪挺:表观遗传调控与基因剪接(附PPT) ,视频全长约 2h34min,文字约 1.6 万字。虽然是四年前的视频,但内容依然不过时,可帮助我们快速建立对转录水平表观调控的认识。 倪挺博士,复旦大学...阅读全... 阅 读 全 部 >
2021 11-05 原来转录过程这么不规矩!——可变剪接 ❝如大家所知,RNA是由DNA转录而来的。然而,作为一个转录本来源的DNA转录区域却不一定是由某个连续DNA片段提供的,其中甚至可能有间隔DNA转录区的交叉,不同区域不同顺序的转录产物共同组成一个转录本,极大增加了DNA产生RNA的复杂度。高通量测序和表达谱芯片可以检测这种非常有意义的转录本剪接,今天小编就带大家简单了解一下可变剪接。❞概述可变剪接是指从...阅读全文>>... 阅 读 全 部 >
2021 11-04 来说说关于DNA甲基化检测和CpG岛的小常识 DNA甲基化是最早发现的基因表观修饰方式之一,可能存在于所有高等生物中。DNA甲基化能关闭某些基因的活性,去甲基化则诱导了基因的重新活化和表达。甲基化的主要形式有5-甲基胞嘧啶,N6-甲基腺嘌呤和7-甲基鸟嘌呤。原核生物中CCA/TGG和GATC常被甲基化,而真核生物中甲基化仅发生于胞嘧啶。DNA的甲基化是在DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5'端的胞嘧...阅读全文>... 阅 读 全 部 >
2021 10-22 手把手教你用R处理常见的数据清洗问题(附步骤解析、R语言代码) 本文约5300字,建议阅读10+分钟。本文将介绍数据清洗过程的主要步骤,并通过案例和代码演示如何利用R语言进行数据清洗。R是进行运算、清洗、汇总及生成概率统计等数据处理的一个绝佳选择。此外,由于它独立于平台、短期内不会消失,所以生成的程序可以在任何地方运行。并且,它具备非常棒的辅助资源。本文摘录自James D.Miller撰写的《数据科学统计学》(Statistics for Data S...... 阅 读 全 部 >
2021 10-16 使用dplyr进行数据操作(30个实例) dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr软件包来清理和转换数据。这是一个关于数据操作和数据处理的完整教程。什么是dplyr?dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它...阅读全文>... 阅 读 全 部 >
2021 10-11 R语言网络爬虫初学者指南(使用rvest包) 引言网上的数据和信息无穷无尽,如今人人都用百度谷歌来作为获取知识,了解新鲜事物的首要信息源。所有的这些网上的信息都是直接可得的,而为了满足日益增长的数据需求,我坚信网络数据爬取已经是每个数据科学家的必备技能了。在本文的帮助下,你将会突破网络爬虫的技术壁垒,实现从不会到会。大部分网上呈现的信息都是以非结构化的格式存储(html)且不提供直接的下载链接,因此,我们需要学习一些知识和...阅读全文>... 阅 读 全 部 >
2021 10-08 R语言对象的操作总结 现在本文将4种对象的程序方法进行进一步总结和凝练。一、is和as系列函数is 和as系列函数涉及不同类型数据和对象的鉴定和转换。我们经常在R语言编程过程中需要了解某一种数据的类型,也可能进行转换方便计算,所以诸位要熟悉他们。is系列是判断某一个数据中的观察值是何种类型,或者数据属于何种对象与结构• is.character(x) #判断是否为字符型• is.numer...阅读全文>>... 阅 读 全 部 >