科学网

 找回密码
  注册
Python中的结构化数据分析利器-Pandas简介
郑俊娟 2015-1-12 15:59
此文转载于XXXXXX处... Pandas 是python的一个数据分析包,最初由 AQR Capital Management 于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的 PyData 开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好 ...
个人分类: python|6608 次阅读|没有评论
10 Minutes to pandas
郑俊娟 2015-1-12 15:57
This is a short introduction to pandas, geared mainly for new users. You can see more complex recipes in the Cookbook Customarily, we import as follows In : import pandas as pd In : import numpy as np In : import matplotlib.pyplot as plt Object Creation See the Da ...
个人分类: python|3519 次阅读|没有评论
层次聚类算法 各种linkage
郑俊娟 2015-1-12 11:59
转自XXXX(忘了) 基本工作原理 给定要聚类的 N 的对象以及 N*N 的距离矩阵 ( 或者是相似性矩阵 ), 层次式聚类方法的基本步骤 ( 参看 S.C. Johnson in 1967) 如下 : 1. 将每个对象归为一类 , 共得到 N 类 , 每类仅包含一个对象 . 类与类之间的距离就是它们所包含的对象之间 ...
个人分类: Statistical|26874 次阅读|没有评论
全基因组重亚硫酸盐测序(whole genome bisulfite sequencing)
热度 1 郑俊娟 2015-1-5 18:41
表观遗传学研究已经证实了特定基因区域的DNA甲基化修饰对于染色体构象、基因表达调控机制有着重要影响,而全基因组DNA甲基化研究将是表观基因组学最为关注的内容之一。 Bisulfite处理能够将基因组中未发生甲基化的C碱基转换成U,进行PCR扩增后变成T,与原本具有甲基化修饰的C碱基区分开来,再结合高通量测序技术,可绘制 ...
个人分类: Methylation|21262 次阅读|1 个评论 热度 1
三种常见的聚类算法的python实现 kmeans、Hierarchical clusteri
郑俊娟 2014-12-30 17:23
聚类是机器学习、数据挖掘相关的一类很常见的问题。关于聚类算法的介绍这里就不多写了,因为无论是教科书还是网络上都有太多的资料了。这里,用一个《Programming Collective Intelligence》中的聚类例子,写几个经典聚类算法的实现,分别是hierachiclaCluster、kmeans、kmedoids。 另外,最近一直在看数据挖掘、 ...
个人分类: Machine Learning|12259 次阅读|没有评论

本页有 5 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 09:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部