Ruby - Array クラス拡張で単回帰曲線(e指数回帰モデル)計算!

Updated:


Ruby で Array クラスを拡張して単回帰曲線(e指数回帰モデル)を計算してみました。(連立方程式の解法にはガウスの消去法を使用)

0. 前提条件

  • LMDE 3 (Linux Mint Debian Edition 3; 64bit) での作業を想定。
  • Ruby 2.6.3 での作業を想定。

1. 単回帰曲線(e指数回帰モデル)の求め方

求める曲線を \(y=ae^{bx}\) とする。両辺自然対数をとると
\(\log{y} = \log{ae^{bx}}\) で、さらに \(\log{y}=\log{a} + bx\) と変形できる。
(ここでの \(\log\) は自然対数 \(\log_e\) のことである)
そして、残差の二乗和 \(S\) は

\[\begin{eqnarray*} S = \sum_{i=1}^{N}(\log{y_i} - \log{a} - bx_{i})^2 \end{eqnarray*}\]

となる。 \(a,b\) それぞれで偏微分したものを \(0\) とする。

\[\begin{eqnarray*} \frac{\partial S}{\partial a} &=& \frac{2}{a}\sum_{i=1}^{N}(\log{a}+bx_{i} - \log{y_i})= 0 \\ \frac{\partial S}{\partial a} &=& 2\sum_{i=1}^{N}(\log{a}+bx_{i} - \log{y_i})x_i= 0 \end{eqnarray*}\]

\(\log{a} = A\) とおいて、これらを変形すると、

\[\begin{eqnarray*} AN + b\sum_{i=1}^{N}x_i &=& \sum_{i=1}^{N}\log{y_i} \\ A\sum_{i=1}^{N}x_i + b\sum_{i=1}^{N}x_i^2 &=& \sum_{i=1}^{N}x_{i}\log{y_i } \end{eqnarray*}\]

となる。これらの連立方程式を解いて、 \(A,\ b\) を得る。
\(\log{a} = A\) より \(a=e^A\) であることから、 \(a\) が求まる。

2. ガウスの消去法による連立方程式の解法について

当ブログ過去記事を参照。

3. Ruby スクリプトの作成

  • Shebang ストリング(1行目)では、フルパスでコマンド指定している。(当方の慣習

File: regression_curve_exp_e.rb

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
#! /usr/local/bin/ruby
#*********************************************
# Ruby script to calculate a simple regression curve.
# : y = a * exp(b * x)
# : 連立方程式を ガウスの消去法で解く方法
#*********************************************
#
class Array
  def reg_curve_exp(y)
    # 以下の場合は例外スロー
    # - 引数の配列が Array クラスでない
    # - 自身配列が空
    # - 配列サイズが異なれば例外
    raise "Argument is not a Array class!"  unless y.class == Array
    raise "Self array is nil!"              if self.size == 0
    raise "Argument array size is invalid!" unless self.size == y.size

    sum_x   = self.inject(0) { |s, a| s += a }
    sum_x2  = self.inject(0) { |s, a| s += a * a }
    sum_ly  = y.inject(0) { |s, a| s += Math.log(a) }
    sum_xly = self.zip(y).inject(0) { |s, a| s += a[0] * Math.log(a[1]) }
    mtx = [
      [self.size,  sum_x,  sum_ly],
      [    sum_x, sum_x2, sum_xly]
    ]
    ans = solve_ge(mtx)
    {a: Math.exp(ans[0][-1]), b: ans[1][-1]}
  end

  private

  # 連立方程式の解(ガウスの消去法)
  def solve_ge(a)
    n = a.size
    # 前進消去
    (n - 1).times do |k|
      (k + 1).upto(n - 1) do |i|
        d = a[i][k] / a[k][k].to_f
        (k + 1).upto(n) do |j|
          a[i][j] -= a[k][j] * d
        end
      end
    end
    # 後退代入
    (n - 1).downto(0) do |i|
      d = a[i][n]
      (i + 1).upto(n - 1) do |j|
        d -= a[i][j] * a[j][n]
      end
      a[i][n] = d / a[i][i].to_f
    end
    return a
  end
end

# 説明変数と目的変数
#ary_x = [107, 336, 233, 82, 61, 378, 129, 313, 142, 428]
#ary_y = [286, 851, 589, 389, 158, 1037, 463, 563, 372, 1020]
ary_x = [83, 71, 64, 69, 69, 64, 68, 59, 81, 91, 57, 65, 58, 62]
ary_y = [183, 168, 171, 178, 176, 172, 165, 158, 183, 182, 163, 175, 164, 175]
puts "説明変数 X = {#{ary_x.join(', ')}}"
puts "目的変数 Y = {#{ary_y.join(', ')}}"
puts "---"

# 単回帰曲線算出
reg_line = ary_x.reg_curve_exp(ary_y)
puts "a = #{reg_line[:a]}"
puts "b = #{reg_line[:b]}"

4. Ruby スクリプトの実行

$ ./regression_curve_exp_e.rb
説明変数 X = {83, 71, 64, 69, 69, 64, 68, 59, 81, 91, 57, 65, 58, 62}
目的変数 Y = {183, 168, 171, 178, 176, 172, 165, 158, 183, 182, 163, 175,164, 175}
---
a = 134.44579218933998
b = 0.0036044146031955627

5. 視覚的な確認

参考までに、上記スクリプトで使用した2変量の各点と作成された単回帰曲線を gnuplot で描画してみた。

REGRESSION_CURVE_EXP_E


以上。





 

Sponsored Link

 

Comments