通过前面的纠错和校正步骤,我们得到了组装完成的基因组序列,接下来就是进行基因组的组装质量评估。质量评估的软件和方法比较多,这里分两篇博客记录,本篇主要演示如何用BUSCO和LAI指数评价基因组组装质量。
通过前面的纠错和校正步骤,我们得到了组装完成的基因组序列,接下来就是进行基因组的组装质量评估。质量评估的软件和方法比较多,这里分两篇博客记录,本篇主要演示如何用BUSCO和LAI指数评价基因组组装质量。
三代基因组de novo组装后得到一系列contig,由于三代测序的错误率较高,我们需要对组装结果进行打磨(以下均用polish表示)以提高基因组的拼接指标如Contig N50,Scaffold N50。
前段时间比较忙,现在继续整理基因组测序组装系列的学习笔记。第四篇笔记写的二代测序基因组组装,主要是演示二代测序数据组装的主流工具SOAPdenovo 2.0是如何应用的。我这里有了二代和三代的测序数据,后续组装还是以三代数据为主,这里就继续记录下几款三代测序数据组装的主流工具和用法。
前面介绍递归函数的时候用到了sys模块,介绍文件操作函数的时候用到了os模块,之前只是简单说了这两个模块下部分函数的用法,这里详细介绍一下对于模块、包和库的概念,以及一些常见的模块用法。
前面在通过讲什么是高阶函数(能够接受函数作为参数传入的函数,或者可以返回函数对象的函数)引出了装饰器的由来和存在的意义。这里对python函数的其他基础概念做个补充和记录。
这里讲一讲前面提到的python装饰器,@classmethod和@staticmethod是python内置装饰器,在了解什么是装饰器之前首先要了解函数的几个特征。
前面说到python中一切皆为对象,面向对象是python的核心,也通过代码方式了解了什么是类和对象、属性和方法以及具体的分类。这篇笔记主要记录下前面没讲完的面向对象编程具体的三个特征。
这两个月经历了突然的疫情隔离,研究生开题,学术论坛,研究生创新项目等等……终于在这一周尘埃落定了,得以静下心来整理整理自己的一些学习笔记。之前我用过一些python编写的项目,我也只是依葫芦画瓢或者在demo上直接改,还没有系统性地学习过这门编程语言。这里就再记录下自己自学python的一些入门时的笔记,以及记录下几个机器学习方面的python库的使用方法。