mk-mode BLOG

このブログは自作の自宅サーバに構築した Debian GNU/Linux で運用しています。
PC・サーバ構築等の話題を中心に公開しております。(クローンサイト: GitHub Pages

ブログ開設日2009-01-05
サーバ連続稼働時間
Reading...
Page View 合計
Reading...
今日
Reading...
昨日
Reading...

Python - 2 つの list から相関係数計算!

[ プログラミング, 数学 ] [ Python ]

こんばんは。

Python で、数値からなる同サイズの list 2つを2つの確率変数とみなして相関係数を計算する方法についての記録です。

0. 前提条件

  • LMDE 2 (Linux Mint Debian Edition 2; 64bit) での作業を想定。
  • Python 3.6.4 での作業を想定。
  • 当方は他のバージョンとの共存環境であり、 python3.6, pip3.6 で 3.6 系を使用するようにしている。(適宜、置き換えて考えること)

1. アルゴリズムについて

当ブログ過去記事を参照。

2. Python スクリプトの作成

  • 敢えてオブジェクト指向で作成している。
  • Shebang ストリング(1行目)では、フルパスでコマンド指定している。(当方の慣習
  • 数値計算ライブラリ NumPy は使用しない。(この程度の行列計算は list で充分)
correlation_coefficient.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
#! /usr/local/bin/python3.6
"""
Correlation coefficient computaion
"""
import math
import sys
import traceback


class CorrelationCoefficient:
    def compute_r(self, x, y):
        """ R computation

        :param  list  x: 1st list of random variables
        :param  list  y: 2nd list of random variables
        :return float r: correlation coefficient of X and Y
        """
        if type(x) != list:
            print("Argument(X) is not a list!")
            sys.exit()
        if type(y) != list:
            print("Argument(Y) is not a list!")
            sys.exit()
        if len(x) == 0:
            print("List(X) is none!")
            sys.exit()
        if len(y) == 0:
            print("List(Y) is none!")
            sys.exit()
        if len(x) != len(y):
            print("Argument list size is invalid!")
            sys.exit()
        try:
            mean_x, mean_y  = sum(x) / len(x), sum(y) / len(y)
            cov   = sum([(a - mean_x) * (b - mean_y) for a, b in zip(x, y)])
            var_x = sum([(a - mean_x) ** 2 for a in x])
            var_y = sum([(b - mean_y) ** 2 for b in y])
            return (cov / math.sqrt(var_x)) / math.sqrt(var_y)
        except Exception as e:
            raise


if __name__ == '__main__':
    try:
        x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
        obj = CorrelationCoefficient()
        print(obj.compute_r(x, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]))
        print(obj.compute_r(x, [2, 3, 3, 4, 6, 7, 8, 9, 10, 11]))
        print(obj.compute_r(x, [15, 13, 12, 12, 10, 10, 8, 7, 4, 3]))
    except Exception as e:
        traceback.print_exc()
        sys.exit(1)

3. Python スクリプトの実行

まず、実行権限を付与。

1
$ chmod +x correlation_coefficient.py

そして、実行。

1
2
3
4
$ ./correlation_coefficient.rb
1.0
0.9923373049285564
-0.9803906931996748

以上

Comments