机器学习数据分析极简思路及sklearn算法小试 原创:老板,来一打TPU 机器学习拥有庞大的知识体系,这里对机器学习的数据分析的整个思路和流程作最最简单的归纳。机器学习的步骤大致包括:1)理解和清理数据2)特征选择3)算法建模4)测试评估模型 机器学习数据分析极简思路1)理解 2019-03-27 Machine Learning algorithm 浅谈文献综述二三事(上篇) 浅谈文献综述二三事(上篇) 大家好,阿白师姐第一次上路,还请多多关照。前一段时间刚写完 academic proposal ,老板说,哎呀,你这文字功底不太好啊,那你再写一篇 review 给我瞅瞅吧。就这样,我才有机会和大家谈一下文献综述 2019-05-22 Uranusyt R语言编程入门(数据可视化及可视化思维) R语言编程入门(数据可视化及可视化思维)写在前面的 上期推文主要介绍了如何学习R语言的函数包,并以rvest爬虫函数包为例,详细介绍了函数包学习、爬虫知识和R语言编程的强化训练并掌握R语言爬虫的三个重要函数read_html、html_no 2019-05-22 Uranusyt r R语言编程入门(爬虫函数包的使用) R语言编程入门(爬虫函数包的使用)写在前面的 上期推文介绍了R语言编程入门,从了解R语言的5种数据结构和两种控制结构开始,再到借上上篇推文的Readscount数据综合利用R语言编程证明Readscount属于负二项分布。现在再回顾一下R语 2019-05-22 Uranusyt r 群体结构分析三种常用方法 (下篇) 写在前面在上篇文章中,我们学习了PCA分析基本过程,接下来接着学习系统发育树的构建和祖先成分分析。 二、 邻接法构建系统发生树基于SNP数据构建系统发生树,省略了序列比对的步骤,这里推荐使用邻接法(Neighbour-Joining,NJ) 2019-05-22 Bioinformatics 群体结构分析三种常用方法 (上篇) 写在前面在群体遗传学和进化生物学相关的项目中,群体结构分析是最常见也是最初步的分析内容,可以帮助我们确认样本分群是否符合预期以及检测离群样本。群体结构分析最常用的三种方法就是PCA、系统发生树和祖先成分堆叠图,下面我们将使用发表在Genom 2019-05-13 Bioinformatics population genetics pca 从零开始入门R语言编程 R语言编程入门写在前面的 上期推文介绍了如何使用R语言编程进行样本间相关性分析,主要涉及了R语言矩阵、循环、统计分析函数、ggplot2、corrplot等函数包的使用,涉及的知识面较多,如果不是经常做生物信息或者是编程出家,很难在短时间内 2019-05-10 Bioinformatics R 浅说动力学模型(下篇) 浅说动力学模型(下篇)原创: 赵洪龙 宇宙实验媛图1. 数学建模在生物学研究中的应用范式书接上文浅说动力学模型(上篇),由于本人主要研究植物学代谢建模,下面就举例说明使用模型在植物生理研究中取得的一些重要成就。在过去的研究中,植物领域对光合 2019-05-08 Bio Cooking dynamic model RNA-seq中的那些统计学问题(一)为什么是负二项分布? 1. 转录组数据统计推断的难题在RNA-seq中进行两组间的差异分析是最正常不过的了。 我们在其它实验中同样会遇到类似的分析,通常,我们可以用方差分析判定两组“分布”数据间是否存在显著差异。原理是:当组间方差大于组内方差(误差效应),并且统 2019-05-07 Bioinformatics 运用AI对科研文章中的图片进行绘图 TMJ universebiologygirl本次视频主要以《Polarizing brain organoids》这篇文章内的Fig. 1为例,使用Adobe Illustrator CS6 对Fig.1 进行绘图,供大家学习参考。此次视 2019-05-07 Paper writing