Python scipy.stats.stats 模块，pearsonr() 实例源码

我们从Python开源项目中，提取了以下25个代码示例，用于说明如何使用scipy.stats.stats.pearsonr()。

项目：YuGiOh_Deep 作者：RongoDog | 项目源码 | 文件源码

def determineCoefficientDifference(self, coefficients):
        targetList = []
        comparisionList = []
        for key in self.wantedCoefficients:
            targetList.append(self.wantedCoefficients[key])
            if key in coefficients:
                comparisionList.append(coefficients[key])
            else:
                comparisionList.append(0)
        for key in coefficients:
            if key in self.wantedCoefficients:
                continue
            else:
                targetList.append(0)
                comparisionList.append(coefficients[key])
        return pearsonr(targetList, comparisionList)

项目：blog_analysis 作者：Databrawl | 项目源码 | 文件源码

def plot_scatter_charts(data, file_name):
    scatters = []
    for lang, values in data.items():
        s = figure(width=300, plot_height=300, title=lang)
        s.yaxis.formatter = NumeralTickFormatter(format="0.0a")
        s.circle(values[0], values[1], size=10, color="navy", alpha=0.5)
        x = np.linspace(1, 100, 10)
        # noinspection PyTupleAssignmentBalance
        m, b = np.polyfit(values[0], 1)
        y = m * x + b
        corr_coef = round(pearsonr(values[0], values[1])[0], 1)
        s.line(x, y, legend=f'PCC = {corr_coef}')
        scatters.append(s)
    split_scatters = split(scatters, 3)
    p = gridplot(split_scatters)
    output_file(file_name)
    show(p)

项目：mrqap-python 作者：lisette-espin | 项目源码 | 文件源码

def correlation(self, x, show=True):
        '''
        Computes Pearson's correlation value of variables x and y.
        Diagonal values are removed.
        :param x: numpy array independent variable
        :param y: numpu array dependent variable
        :param show: if True then shows pearson's correlation and p-value.
        :return:
        '''
        if not self.diagonal:
            xflatten = np.delete(x, [i*(x.shape[0]+1)for i in range(x.shape[0])])
            yflatten = np.delete(y, [i*(y.shape[0]+1)for i in range(y.shape[0])])
            pc = pearsonr(xflatten, yflatten)
        else:
            pc = pearsonr(x.flatten(), y.flatten())
        if show:
            utils.printf('Pearson Correlation: {}'.format(pc[0]))
            utils.printf('p-value: {}'.format(pc[1]))
        return pc

    #####################################################################################
    # Handlers
    #####################################################################################

项目：optomatic 作者：erlendd | 项目源码 | 文件源码

def get_best_two_params(self):
        param_names = self.jobs.get_param_names()
        if len(param_names) == 2:
            return param_names # there can be only two.

        # how much does each parameter correlate with the achieved loss...
        param_losscorr = {}
        for name in self.param_names:
            corr_coef, pval = pearsonr( self.losses, self.param_values[name] )
            logging.info('Correlation of {} with loss: {}'.format(name, corr_coef))
            param_losscorr[name] = abs(corr_coef) # abs,since we don't care about the direction

        sorted_by_corr = sorted(param_losscorr.items(), key=lambda x:x[1], reverse=True)
        best_params  = []
        for i in sorted_by_corr:
            if math.isnan( i[1] ): continue
            best_params.append(i[0])
            if len(best_params) == 2: return best_params
        return best_params
        #return sorted_by_corr[0][0],sorted_by_corr[1][0] # TODO: could be made more general/robust

项目：wikilinks 作者：trovdimi | 项目源码 | 文件源码

def correlations_ground_truth():
    print 'ground truth'
    #load network
    wikipedia = load_graph("output/weightedpagerank/wikipedianetwork_hyp_engineering.xml.gz")
    #read counts with zeros
    article_counts  =  pd.read_csv(TMP+'article_counts.tsv', sep='\t')
    cor = {}
    for damping in [0.8,0.9]:
        page_rank = pagerank(wikipedia, damping=damping)
        wikipedia.vertex_properties['page_rank_'+str(damping)] = page_rank
        page_rank_values = list()
        counts = list()
        correlations_values = {}
        for index, row in article_counts.iterrows():
            counts.append(float(row['counts']))
            page_rank_values.append(page_rank[wikipedia.vertex(int(row['target_article_id']))])
        print 'pearson'
        p = pearsonr(page_rank_values, counts)
        print p
        correlations_values['pearson']=p
        print 'spearmanr'
        s = spearmanr(page_rank_values, counts)
        print s
        correlations_values['spearmanr']=s
        print 'kendalltau'
        k = kendalltau(page_rank_values, counts)
        print k
        correlations_values['kendalltau']=k
        cor['page_rank_'+str(damping)]=correlations_values
    write_pickle(HOME+'output/correlations/correlations_pagerank.obj', cor)

项目：wikilinks 作者：trovdimi | 项目源码 | 文件源码

def correlations_weighted_unweighted(labels):
    #load network
    print 'weighted vs unweighted'
    name = '_'.join(labels)
    wikipedia = load_graph("output/weightedpagerank/wikipedianetwork_hyp_engineering_"+name+".xml.gz")
    #read counts with zeros

    wikipedia_u = load_graph("output/weightedpagerank/wikipedianetwork_sem_sim_distinct_links.xml.gz")
    correlations_weighted_pagerank = {}
    for label in labels:
        for damping in [0.8,0.85,0.9]:
            correlations_values={}
            key_weighted = label+"_page_rank_weighted_"+str(damping)
            pagerank_weighted = wikipedia.vertex_properties[key_weighted]
            key_unweighted = "page_rank"+str(damping)
            pagerank_unweighted = wikipedia_u.vertex_properties[key_unweighted]
            print 'pearson'
            p = pearsonr(pagerank_weighted.a, pagerank_unweighted.a)
            print p
            correlations_values['pearson']=p
            print 'spearmanr'
            s = spearmanr(pagerank_weighted.a, pagerank_unweighted.a)
            print s
            correlations_values['spearmanr']=s
            print 'kendalltau'
            k = kendalltau(pagerank_weighted.a, pagerank_unweighted.a)
            print k
            correlations_values['kendalltau']=k
            correlations_weighted_pagerank[label+str(damping)]=correlations_values

    write_pickle(HOME+'output/correlations/correlations_pagerank_weightedvsunweighted'+name+'.obj', correlations_weighted_pagerank)

项目：copper_price_forecast 作者：liyinwei | 项目源码 | 文件源码

def cor_analysis(co_price, pcb_price):
    """
    ???PCB??????? 
    """
    cor_draw(co_price, pcb_price)
    print(pearsonr(co_price.values, pcb_price.values))

项目：merlin 作者：CSTR-Edinburgh | 项目源码 | 文件源码

def compute_corr(self, ref_data, gen_data):
        corr_coef = pearsonr(ref_data, gen_data)

        return corr_coef[0]

项目：DeepLearn 作者：GauravBh1010tt | 项目源码 | 文件源码

def sum_corr(view1,view2,flag=''):

    print("test correlation")
    corr = 0
    for i,j in zip(view1,view2):
        corr += measures.pearsonr(i,j)[0]
    print('avg sum corr ::',flag,'::',corr/len(view1))

项目：DeepLearn 作者：GauravBh1010tt | 项目源码 | 文件源码

def cal_sim(model,ind1,ind2=1999):
    view1 = np.load("test_v1.npy")[0:ind1]
    view2 = np.load("test_v2.npy")[0:ind2]
    label1 = np.load('test_l.npy')
    x1 = project(model,[view1,np.zeros_like(view1)])
    x2 = project(model,[np.zeros_like(view2),view2])
    label2 = []
    count = 0
    MAP=0
    for i,j in enumerate(x1):
        cor = []
        AP=0
        for y in x2:
            temp1 = j.tolist()
            temp2 = y.tolist()
            cor.append(pearsonr(temp1,temp2))
        #if i == np.argmax(cor):
        #    count+=1
        #val=[(q,(i*ind1+p))for p,q in enumerate(cor)]
        val=[(q,p)for p,q in enumerate(cor)]
        val.sort()
        val.reverse()
        label2.append(val[0:4])
        t = [w[1]for w in val[0:7]]
        #print t
        for x,y in enumerate(t):
            if y in range(i,i+5):
                AP+=1/(x+1)
        print(t)
        print(AP)
        MAP+=AP
    #print 'accuracy  :- ',float(count)*100/ind1,'%'
    print('MAP is : ',MAP/ind1)

项目：MOSPAT 作者：CR2MOS | 项目源码 | 文件源码

def mospat_manip_calcstats(c_Variable, c_Model, f_ObsData, f_ModelData):

   # ELIMINATING ELEMENTS WITH NAN
   idx_ModData=np.where(~np.isnan(f_ModelData))
   idx_ObsData=np.where(~np.isnan(f_ObsData))

   f_ObsData_aux=f_ObsData[idx_ModData]
   f_ModelData_aux=f_ModelData[idx_ModData]

   # Model Mean
   f_ModMean=np.nanmean(f_ModelData_aux)
   # Obs Mean
   f_ObsMean=np.nanmean(f_ObsData_aux)
   # Mean Bias
   f_MeanBias=f_ModMean-f_ObsMean
   # Mean Normalized Bias
   f_mnb=(f_ModMean-f_ObsMean)/f_ObsMean
   # Root Mean Square Error
   f_rms=np.sqrt(((f_ModelData_aux-f_ObsData_aux)**2).mean())
   # Pearson Correlation Coefficient
   f_corr=pearsonr(f_ObsData_aux,f_ModelData_aux)[0]
   # Standard Deviation of Observations
   f_StdObs=np.std(f_ObsData_aux)
   # Standard Deviation of Model Data
   f_StdMod=np.std(f_ModelData_aux)
   # Ratio of Standard Deviation
   f_StdRatio=f_StdMod/f_StdObs

   f_Statistics=[f_ObsMean, f_ModMean, f_MeanBias, f_mnb, f_rms, f_corr, f_StdObs, f_StdMod, f_StdRatio]

   return f_Statistics

项目：ml-talks-duolingo 作者：burrsettles | 项目源码 | 文件源码

def evaluate(DATA_SET):
    PREDS = [predict(u, m) for (u, m, r) in DATA_SET]
    REALS = [r for (u, r) in DATA_SET]
    mae = sum(abs(REALS[i] - PREDS[i]) for i in range(len(PREDS)))/len(PREDS)
    print 'MAE = ', round(mae, 3)
    r, p = pearsonr(PREDS, REALS)
    print 'cor = ', round(r, 3)

项目：world_merlin 作者：pbaljeka | 项目源码 | 文件源码

def compute_corr(self, gen_data)

        return corr_coef[0]