本発明は、測定値の変換方法およびシステムに関する。
(測定と測定値) 測定とは、測定されるものまたは現象(以下「測定対象」)の測定の対象となる量(以下「測定量」)を、基準として用いる量と比較し、数値または符号を用いて表すことであり、測定によって求めた値を測定値という。 (測定系) また、ある量の測定を目的として、必要な機能を集めて対象と共に構成された系を「測定系」という。 図1に、測定系の模式図を示す。 測定系は、測定者、測定器、測定対象および測定環境の全てを含む。 (誤差) 測定を行った場合、測定値には誤差が含まれている。 誤差とは、測定値と真の値との差のことである。 ここに、真の値とは便宜上導入された理想的なあるいは仮想的な値であり、実際には、真の値が不明の状態で誤差を評価しなければならない。 (誤差要因) 測定系の各構成要素おける誤差要因を表1に示す。 誤差は、これらの誤差要因に附帯して発生する。
(誤差の分類) 誤差は、通常、系統誤差と偶然誤差とに分けて扱うことができる。 (系統誤差) 系統誤差とは、いろいろな誤差要因の中で、測定値の母平均を真の値から偏らせるような要因による誤差の総称である。 計測器の誤差、個人誤差などはこの種類に属する。 (偶然誤差) 偶然誤差とは、突き止められない原因によって起こり、測定値のばらつきとなって現れる誤差をいう。 同一条件で測定を繰り返すときでも個々の測定値が不揃いになるのは、この種の誤差があるからである。 偶然誤差は、突き止めることのできない、極めて多様な原因によって現れるものと考え、通常は確率・統計的に扱われる。 (測定値および誤差のモデル) 今、任意の測定対象における任意の測定量について、その真の値をν、測定値をx、測定値における誤差をε、そのうちの系統誤差をε S 、偶然誤差をε Rとする。 また、偶然誤差ε Rの分布が正規分布であると仮定し、測定値xの平均をx av 、標準偏差をσと表す。 このとき、測定値xおよび誤差εは図2のようにモデル化することができる。 ここに、誤差εは系統誤差ε Sと偶然誤差ε Rの和、すなわち、数1で表され、系統誤差ε Sは母平均x avと真の値νとの差、すなわち、数2で表される。
(系統誤差の除去) 系統誤差は、一定の規則的な関係に従って生じる誤差であり、誤差に再現性があることから、その原因による影響分を評価することにより、測定値を真の値に近い値に修正できる可能性がある。 それ故、測定条件や測定理論からの推定や、測定の条件、装置、方法などを変えた実測を手がかりとして、系統誤差を除去する努力が行われている。 (偶然誤差の除去) 偶然誤差は、不特定多数の原因により、ランダムに、あるいは確率的に発生する誤差であり、測定毎にばらつく誤差であるため、測定後にそれを取り除くことはできない。 しかし、比較的容易にそれを低減させることはできる。 なぜならば、多くの場合、偶然誤差の分布は正規分布とみなしてよく、正負の方向に同じ程度の確からしさでばらつくと考えられるため、同様の測定を何度も行って結果の平均を取れば、誤差がお互いに打ち消しあって小さくなると考えられるからである。 (補正および補正値) 系統誤差を補償するために、測定値に代数的に加えられる値または値を加えることを補正という。 以下、測定値における系統誤差を除去する作業を「補正」と、補正された測定値を「補正値」と称する。 (測定値の誤差と測定値の変換) 測定値に含まれる誤差を適切に処理できなければ、測定値の変換結果の妥当性を担保することができない。 以下、従来の方法論における測定値の誤差の取り扱い方法を示し、それらの問題点について検討する。 (校正による補正) 校正とは、計測器の示す値と標準器や標準試料の示す値(以下、「標準値」との関係を求める作業のことであり、計測器に由来する系統誤差を除去する手段として位置付けることができる。また、校正で得られる、標準値と測定値とを関係づける関係を校正曲線という。図3に、校正曲線の一例を示す。校正曲線11は、標準器等が示す標準値がs i 、校正の対象とする計測器の測定値がy iであるとき、点(s i ,y i )を標準値―測定値空間にプロットし、それらに曲線を当てはめたものである。図3ではy=sを示す直線12も参考のために図示している。 (校正による補正の限界) 校正の作業においては、標準器や標準材料の存在が前提となるので、これらが用意できない状況においては補正は行えないことになる。 また、測定環境が変化すれば、計測器のみならず測定対象もその影響を受けるが、校正は計測器に由来する系統誤差を除去する手段に過ぎない。 校正は、このように、校正曲線を用いて実際に行った測定系(以下、「実測系」)における測定値を校正を行った測定系(以下、「校正系」)における測定値に変換する処理であり、測定値を補正する手段ではない。 (解析的方法による補正) 測定値を補正する手段の一つに解析的方法がある。 たとえば、実験計画法に基づくデータ解析法等がこうしたアプローチに相当する。 図4に、解析的方法に基づく補正の概念図を示す。 解析的方法においては、まず、実測値の変化を有限個の誤差因子α 1 ,α 2・・・α mによる効果と考え、誤差因子とその効果の程度を示す係数の積の線形結合からなる数学モデルをたてる。 そして、実測値のデータ解析により数学モデルを構成する係数を決定することにより、真の値(目的変数)ν 1 ,ν 2・・・ν nと測定値(説明変数)x 1 ,x 2・・・x nとの関係を明示的に関係づけるものである。 (解析的方法による補正の限界) 解析的方法は、「もし状況を完全に記号に置き換えることができ、状況を支配する規則が完全に解明されるならば、全ての現象を完全に説明することができる」とする記号主義の立場に立つ考え方である。 しかしそれ故、解析的方法においては、(i)不特定多数の誤差因子から有限個の誤差因子を選定する根拠が存在しない、(ii)誤差因子の独立性が不明確であるため、数学モデルの妥当性の保証がない、(iii)実験・観察に不確定な要素が多く、ゆえに解が収束する保証がない等の問題が存在する。 解析的方法に基づく補正は、極めて煩雑であるばかりでなく、常に記号処理に伴う不確定性が伴うため、処理結果の信頼性に乏しい方法と言わざるを得ない。 (従来の測定値の補正法の総括) 前述のように、現在の測定学における測定値の補正方法は、「特別な機器等を必要とする方法」、「計測器に由来する系統誤差を対象とする方法」、「特定の測定系でしか機能しない方法」、または「補正結果の信頼性が担保できない方法」等の、限定された方法に過ぎない。 測定値の補正方法が限定的であるということは、測定値は依然として当該測定系に固有の存在として留まることを意味する。 以下の説明では、測定値が特定の測定系に限定された存在であり、測定系を超えた普遍的な存在に成り得ていないことを「測定値における整合性の欠如」と表現する。 測定値において整合性が欠如していれば、異なる測定系における測定値を変換した場合、変換結果の妥当性を保証することができない。 以下の説明では、測定値の変換におけるこうした状態を「測定値の変換結果における妥当性の欠如」と表現する。
本発明は、「測定値における整合性の欠如」によってもたらされる「測定値の変換結果における妥当性の欠如」を解消することを目的としている。 つまり、測定値の補正、測定値の校正、測定値の比較等の「測定値の変換」において、「測定値の変換結果における妥当性を担保する方法論の確立」を目的としている。 本発明に係る測定値変換方法は、複数の測定対象を複数の第1測定系においてそれぞれ測定することにより取得された複数の第1測定値と、複数の測定対象を複数の第2測定系においてそれぞれ測定することにより取得された複数の第2測定値とを準備し、複数の測定対象のそれぞれに対応する第1測定値および第2測定値の組み合わせを標本点として取得する工程と、複数の測定対象の複数の標本点を統計処理することにより、複数の第1測定系から導かれる第1再構成系と複数の第2測定系から導かれる第2再構成系との関係を示す変換関数を求める工程と、変換関数を用いて第2測定値を変換することにより、変換値を取得する工程とを備える。 標本点の統計処理により変換関数を求めることにより、測定値の変換において記号を排除することができ、記号化誤差の発生を防止し、測定値の変換結果における妥当性を担保することができる。 ここで、複数の第1測定系は互いに異なる個別測定系であってもよく、同一の一括測定系であってもよい。 複数の第2測定系も互いに異なる個別測定系であってもよく、同一の一括測定系であってもよい。 複数の第1測定系および第1再構成系は一括測定系の場合同一となり、複数の第2測定系および第2再構成系も一括測定系の場合同一となる。 すなわち、一括測定系の場合の「複数の第1測定系」「複数の第2想定系」という表現は便宜上のものにすぎない。 複数の標本点には歪みや作為性が含まれる場合があり、このような場合は、標本点の選択や標本点の重み付けが行われることが好ましい。 また、典型的には、変換関数は、少なくとも1つの未定係数である未定係数群を含む単調増加関数を相関線として設定しておき、未定係数群の値群が決定された相関線として求められる。 本発明の一の好ましい実施の形態では、複数の測定対象は競争競技の競争者または競争物であり、複数の第1測定値が所定の条件を満たす最良の記録である。 この好ましい実施の形態では、複数の第2測定値のそれぞれを、対応する測定対象の第1測定値と第2測定値との比に置き換えられた上で統計処理されることが好ましい。 また、本発明は、上記測定値変換方法を実行する測定値変換システムにも向けられている。 測定値変換システムでは、コンピュータネットワークを介して利用者端末との間で通信が行われることにより、利用者から送られた測定値を変換して変換結果を利用者に提供するというサービスを実現することができる。 上述の目的および他の目的、特徴、態様および利点は、添付した図面を参照して以下に行うこの発明の詳細な説明により明らかにされる。
測定系の模式図である。 測定値および誤差を示す図である。 校正曲線の一例を示す図である。 解析的方法に基づく補正の概念を示す図である。 ブラックボックスモデルの概念を示す図である。 測定値の補正の原理を示す図である。 変換関数と変換値を示す図である。 変換関数と補正関数を示す図である。 相関ベクトルと相関線を示す図である。 ブラックボックス法の一般的工程を示す図である。 標本点の無作為化の一例を示す図である。 第1測定値−第2測定値空間における同値変換を示す図である。 同値変換値の分布と分布矯正重みの効果を示す図である。 持ちタイム−実走タイム空間における標本点の分布を示す図である。 持ちタイム−達成率空間における標本点の分布を示す図である。 マラソンの記録と月間平均走行距離との関係を示す図である。 持ちタイム−達成率空間における同値変換を示す図である。 マラソンの記録の規格化の流れを示す図である。 測定値変換システムを示す図である。 規格化前の散布図である。 規格化前の散布図である。 規格化前の散布図である。 規格化後の散布図である。 規格化後の散布図である。 規格化後の散布図である。 規格化前の達成率の分布図である。 規格化後の達成率の分布図である。 サブスリー率の変化を示す図である。 持ちタイムの更新率の変化を示す図である。 サブスリー率の変化を示す図である。 持ちタイム更新率の変化を示す図である。 連続出場している選手における記録の推移を示す図である。 規格化前の上位選手の記録の推移を示す図である。 規格化後の上位選手の記録の推移を示す図である。
(ブラックボックスモデル) 「測定値の変換結果における妥当性を担保する方法」は「測定値の変換における一般法」と捉えることができ、具体的には、「特別な機器等を必要とせず、測定系の全ての構成要素に由来する系統誤差を対象とし、全ての測定系において機能し、変換結果の妥当性を担保する方法」と表現することができる。 本発明は、「測定値の変換における新規な一般法」である入出力モデルに基づく情報処理メカニズムにより実現される。 この一般法を「ブラックボックスモデル」と称することとする。 図5に、ブラックボックスモデルの概念図を示す。 ブラックボックスモデルは入出力モデルであり、入出力端部は測定値に、ブラックボックス部2は測定系に対応している。 すなわち、「不特定多数の誤差要因を包含する測定系に真の値が入力されたとき、測定系に応じた誤差を含む測定値が出力される」と考えるモデルである。 ここに、当該モデルに附帯する「測定系の再構成」機能により、測定値の多様な変換を実現することができる。 (ブラックボックス法) 測定という複雑な現象をブラックボックスモデルで表現し、測定値を変換する方法を「ブラックボックス法」と呼ぶものとする。 (入力情報) 図5に示すように、ブラックボックス法においては、その最初の入力情報は、任意の測定対象における任意の測定量についての真の値νとされる。 ここで、標準環境において校正された測定器を使用して標準環境で測定する測定系を「標準系S」と定義する。 標準系Sにおいては系統誤差は発生しないため、測定値には偶然誤差だけが含まれている。 ゆえに、標準系Sおける測定値の数が十分多ければ、それらを統計処理した結果は真の値νとして扱うことができる。 言い換えれば、真の値νは標準系Sにおける測定値と位置付けることができる。 (変換プロセスの構成) ブラックボックス法においては、測定値の変換は「順プロセス」と「逆プロセス」で構成されている。 (順プロセス) 「順プロセス」とは、測定系であるブラックボックス部2に真の値ν i (i=1,2,3・・・n)が入力されたとき、測定値が出力される過程である。 ここに、ブラックボックスで示される測定系が「第1測定系X」である場合の測定値を「第1測定値x i 」と、「第2測定系Y」である場合の測定値を「第2測定値y i 」とする。 (逆プロセス) 「逆プロセス」とは、複数の測定対象を複数の第1測定系Xにおいてそれぞれ測定することにより取得された第1測定値x iと、これらの複数の測定対象を複数の第2測定系Yにおいてそれぞれ測定することにより取得された第2測定値y iとを用いて測定系を再構成(以下、「再構成系」)し、第1測定値x iおよび第2測定値y iを当該再構成系の出力として変換する過程である。 ここに、複数の「第1測定系X」から導かれる再構成系を「第1再構成系X R 」、複数の「第2測定系Y」から導かれる再構成系を「第2再構成系Y R 」、第1測定値x iを第2再構成系Y Rにおける測定値として変換した値を「第1変換値τ x i 」、第2測定値y iを第1再構成系X Rにおける測定値として変換した値を「第2変換値τ y i 」とする。 (測定値の変換と使用する測定値の関係) ブラックボックス法では、第1変換値τ x iおよび第2変換値τ y iのいずれが求められるかは、使用する測定値の性質により決まる。 したがって、第1測定値x iおよび第2測定値y iを適当に選択することにより、これらの測定値のいずれも目的に応じた測定値に変換することができる。 ただし、通常は、第1変換値τ x iおよび第2変換値τ y iのいずれか一方のみが変換される価値を有するため、第2変換値τ y iが取得対象となるように第1測定値x iおよび第2測定値y iを選択するものとする。 特に断らない限り、以下、第1再構成系X Rを「再構成系X R 」と、第2変換値τ y iを「変換値τ i 」と略称する。 (測定値の補正における処理手順) 「測定値の補正」という課題を測定値の変換の例として取り挙げ、ブラックボックス法に基づく測定値の変換の手順を説明する。 (測定値の補正に使用する測定値) ブラックボックス法に基づく測定値の補正においては、第1測定値として「個別測定値」を、第2測定値として「一括測定値」を用いる。 (一括測定値および一括測定系) 「一括測定値」とは、任意の測定対象におけるある測定量について、同じ測定点(同じ場所および同じ時刻)で測定した測定値群のことである。 たとえば、人間という測定対象において、集団検診等で身長・体重・血圧・血糖値等の測定量を測定した場合の測定値などがこれに該当する。 一括測定値では、測定した時間や使用した計測器の特性などにより、取得した測定値の全てについて一定の偏りが生じる可能性が高い。 たとえば、身長は朝と夕方では異なるであろうし、体重、血圧、血糖値などは食事や運動の前後で大きな差が発生する。 それに、計測器の誤差や測定者の癖も存在するからである。 一括測定値は、このように、測定値に当該測定系に固有の系統誤差が含まれている測定値群であって、それらが整合性を具備するためには補正を必要とするものをいう。 また、一括測定値が測定された測定系を「一括測定系」と呼ぶこととする。 (個別測定値および個別測定系) 「個別測定値」とは、一括測定値と同一の測定対象における同一の測定量を他の測定系において個別に測定したときの測定値のことである。 たとえば先の集団検診の例では、その受診者(同一の測定対象)が体重や血圧など(同一の測定量)を自宅や病院等(他の測定系)で個別に測定した場合が該当する。 個別測定値では、測定点だけでなく、それぞれの測定における計測器や測定者、更には測定環境も異なっている。 つまり、一括測定値ではその全てについて測定系(一括測定系)が共通であるのに対し、個別測定値では個々の測定値について測定系が異なる。 こうした特徴を有する個別測定値の測定系を「個別測定系」と呼ぶこととする。 (測定値の補正における順プロセス) 測定値の補正という変換の処理における順プロセスにおいては、入力値である真の値ν iがブラックボックス部2に入力され、個別測定系Xでの測定値として個別測定値x iが、また、一括測定系Yの測定値として一括測定値y iが出力される。 (測定値の補正における逆プロセス) 一方、逆プロセスにおいては、個別測定値x iと一括測定値y iに基づいて個別測定系Xが新たな測定系X Rに再構成され、再構成系X Rにおける測定値として一括測定値y iが変換値τ iに変換される。 (標本点) 今、任意の測定対象におけるある測定量についての個別測定値がx i 、一括測定値がy iであるとき、図6に示すように、それらを組み合わせであるP i (x i ,y i )を「標本点」と定義する。 ブラックボックス法における測定値の変換に係る処理は、全て、この標本点に基づいて行われる。 (標本点に対応する真の値) 個別測定値x iおよび一括測定値y iのいずれについても真の値は共にν iであるから、標本点P i (x i ,y i )に対応する真の値はQ i (ν i ,ν i )と表すことができる。 図6では、個別測定値−一括測定値空間において、3つの標本点P 1 (x 1 ,y 1 )、P 2 (x 2 ,y 2 )およびP 3 (x 3 ,y 3 )と、それらに対応する真の値Q 1 (ν 1 ,ν 1 )、Q 2 (ν 2 ,ν 2 )およびQ 3 (ν 3 ,ν 3 )を示している。 (標本点における誤差の定式的表現) 標本点P i (x i ,y i )とその真の値Q i (ν i ,ν i )の誤差を(ε x i ,ε y i )とし、それらの内で、個別測定値x iにおける系統誤差および偶然誤差をε x Siおよびε x Riと、一括測定値y iにおける系統誤差および偶然誤差をε y Siおよびε y Riとする。 このとき、x軸方向の誤差ε x iおよびy軸方向の誤差ε y iは数3にて表され、個別測定値x iおよび一括測定値y iは、数4にて表される。
(個別測定値における誤差の性質) まず、標本点P i (x i ,y i )における誤差のうちで、x軸方向の誤差ε x i (=ε x Si +ε x Ri )の性質について検討する。 個別測定値x iは、個別測定系Xで測定された測定値であるから、それに含まれる系統誤差ε x Siは系統誤差と言えどもランダムに発生すると考えられる。 そして勿論、偶然誤差ε x Riも確率的に発生する誤差である。 ゆえに、個別測定値x iにおける誤差ε x iは、全体としてもランダムに発生する誤差である。 (一括測定値における誤差の性質) 次に、標本点P i (x i ,y i )における誤差のうちで、y軸方向の誤差ε y i (=ε y Si +ε y Ri )の性質について検討する。 ここに、一括測定値y iは同じ測定系(一括測定系)において測定された測定値群であるから、それらにはその測定系に固有の系統誤差ε y Siが含まれている。 一方、一括測定値y iにおける偶然誤差ε y Riはランダムに発生する誤差である。 (標本点の統計処理) 標本点P i (x i ,y i )に対し、図6に示すように、最小2乗法などの統計的処理により、ある関数31を当てはめたとする。 このとき、個別測定値x iに関する誤差ε x iは、系統誤差ε x Siも偶然誤差ε x Riも共に統計的な扱いが可能な性質を有しているため、標本点P iを統計処理した結果における個別測定値x iの誤差ε x iは概ね0と考えられる。 一方、標本点P i (x i ,y i )を統計処理した結果における一括測定値y iの誤差ε y iでは、偶然誤差ε y Riは概ね0となるが、系統誤差ε y Siに相当する偏差は残存する。 図6ではy=xを示す直線32も参考のために示している。 (準標準系) 以上の検討より、個別測定値x iを統計処理した結果における誤差ε x iは概ね0になることから、個別測定値x iの統計処理により再構成される測定系は極めて標準系Sに近いという性質を有する。 そこで、個別測定値x iの再構成系X Rを「準標準系S'」と定義する。 (補正値) 標本点P i (x i ,y i )は、もともとは、横軸の個別測定値x iと縦軸の一括測定値y iの関係、すなわち個別測定系Xと一括測定系Yとの関係を示している。 一方、標本点の統計処理によって導かれる関数31は、統計処理した結果におけるx軸方向の誤差ε x iは概ね0であり、y軸方向の誤差ε y iは系統誤差分ε y Siだけが残存していることから、準標準系S'と一括測定値系Yの関係を示す関数となっている。 準標準系S'における測定値にはほとんど系統誤差が含まれないことから、準標準系S'を測定系とする測定値は真の値に極めて近い。 ゆえに、一括測定値y iがこの関数で折り返す横軸の値は、一括測定値y iにおける系統誤差ε y Siが除去された値を示している。 以上の検討により、図7に示すように、統計処理によって導出された関数31により、一括測定値y iが変換される値τ iは、一括測定値y iの「補正値」ということになる。 (変換関数) 標本点P i (x i ,y i )の統計処理によって導出される関数31は、一般的には、第2測定系Yにおける第2測定値y iを第1測定系Xの再構成系であるX Rにおける測定値に変換する機能を果たす。 そこで、第1測定値―第2測定値空間における標本点P i (x i ,y i )の統計処理によって導出した関数31を「測定値変換関数」、または単に「変換関数」と呼ぶことにする。 なお、個別測定系である複数の第1測定系Xは互いに異なる測定系であるが、複数の測定対象がそれぞれ測定される複数の第2測定系Yは同一の一括測定系であり、複数の第2測定系Yから導かれる第2再構成系Y Rも第2測定系Yと同一となる。 しかしながら、後述するように第2測定系Yが個別測定系となる応用例も想定されるため、変換関数は一般的には、複数の第1測定系Xから導かれる第1再構成系X Rと複数の第2測定系Yから導かれる第2再構成系Y Rとの関係を示す関数と表現することができる。 すなわち、一括測定系に対する「複数の第2測定系」という表現は、測定系を一般化して表現するための便宜上のものにすぎない。 (合目的的処理) ブラックボックス法では、第1測定値x iおよび第2測定値y iの性質により導出される変換関数の性質が異なる。 具体的には、後述するように測定値を適当に選ぶことにより、目的に応じた変換を実現することができる。 ブラックボックス法は、こうした理由から、合目的的処理が可能な方法論であるということができる。 (変換関数の構造) 変換関数は1つ以上の係数a j (j=1,2,3・・・m)を含む関数として定義する。 また、変換関数は第2測定値y iと変換値τ iとを対応づける関数であるから、数5のように表現することができる。
(変換関数の一例) 少なくとも1つの係数を含む変換関数の一例として、数6に示すものを挙げることができる。 なお、数6において、a jおよびA j (j=1,2,3・・・m)が係数である。
(補正関数) 変換関数に附帯して、補正量に関する関数を定義しておく。 変換関数が補正の機能を果たす場合、補正値τ iと一括測定値y iとの差ξ iは一括測定値y iに加える補正量を示している。 そこで、図8にて符号33を付す補正量を示す関数ξ(τ i )(以下、「補正関数」)を数7にて定義する。
(相関ベクトル) ここで、変換関数を性格づける重要な概念を導入する。 まず、横軸に第1測定値x i 、縦軸に第2測定値y iをとる測定値空間を考える。 この測定値空間においては無限個の標本点が存在すると仮定し、標本点に重み付けしながら得られるx軸方向およびy軸方向の標本点の分散をσ Δx 2 (x,y)およびσ Δy 2 (x,y)とする。 このとき、点P(x,y)を中心とし、任意の点P(x,y)を中心とする微小領域において、中心の点Pが得られた測定系と近傍の標本点が得られた測定系との相関性を示す単ベクトルγ(x,y)(以下、「相関ベクトル」)を数8にて定義する(図9にて矢印にて図示)。
(相関場) また、数8で定義される相関ベクトルγ(x,y)によって構成されるベクトル場を「相関場」と呼ぶ。 (相関線) 相関場が定義された測定値空間において、接線方向が相関場と平行になるように、相関場に沿って引かれた線を「相関線」と定義する(図9において符号41を付す。)。 ここに、任意の2つの相関ベクトルγは、接近すればするほど同一のベクトルになることから、相関線はお互いに交差することはない。 (相関線と変換関数との関係) 測定値空間には無限本の相関線が存在する。 これらの無数の相関線の中で、全標本点に照らして最も確からしい相関線を「変換関数」として位置付ける。 (ブラックボックス法の一般的手続) ブラックボックス法に基づく測定値の変換とは、変換関数を如何に導き、変換値を如何に算出するかという問題に帰着する。 図10は、ブラックボックス法の一般的手続を示す図である。 図10に従って以下、個々の工程の説明を行う。 (標本の抽出) 同一の測定対象における同一の測定量について、互いに異なる第1測定系および第2測定系の測定値である第1測定値x iと第2測定値y iを標本として抽出し、それらの組み合わせから成る標本点P i (x i ,y i )を作成する(ステップS11)。 変換関数は測定値の統計処理により導出されることから、標本点の数は多いほどよい。 なお、第1測定系は個別測定系(すなわち、互いに異なる複数の第1測定系)であっても一括測定系(すなわち、第1測定系が実質的に1つ)であってもよく、第2測定系も個別測定系(すなわち、互いに異なる複数の第2測定系)であっても一括測定系(すなわち、第2測定系が実質的に1つ)であってもよい。 (相関線の構造) 相関線と変換関数は、同一の測定空間における微視的表現の集合か巨視的表現かの違いに過ぎないので、それらの構造は等しくなければならない。 そこで、相関線の構造を少なくとも1つの未定係数である未定係数群を含む関数として数9のように設定する。 ここに、a u j (j=1,2・・m)はa jの未定係数を表すものとする。 相関線をこのように未定係数a u jを含む関数として定義することにより、無数の関数群を表現することができる。 また、数5に示す変換関数と数9に示す相関線は、その係数が定数a jであるか未定係数a u jであるかの違いを有するに過ぎず、両者の構造は同じである。
なお、上述のように相関線は互いに交わらないため、通常、相関線の未定係数は互いに従属関係にあり、未定係数は実質的に1つと捉えることができるが、他の拘束条件を与えてその条件下において相関線が交わらなければ未定係数の数は数9のように複数とされてよい。 (相関線の構造の決定) 変換関数の導出に際し、まず、その微視的表現の集合である相関線の構造を決定する(ステップS12)。 相関線の構造は、測定値空間における標本点の散布図や測定値に関する知見を参考にして決定するが、その前に、その構造が数学的に妥当なものでなければならない。 そこで、相関線の構造上の必要条件について検討しておく。 (原点通過) 図3に示すように、校正曲線11では、原点を通過しない場合もあり得る。 しかし、相関線は原点を通過する構造とする方が合理的である。 なぜならば、ブラックボックス法は同一の測定対象の異なる測定系における測定値の組み合わせを処理対象である標本点として設定しているからである。 原点通過の条件は、第1測定値および第2測定値が零点調整された計測器による測定結果とみなせば当然の結果であるが、こうした拘束条件を設けることにより、方法論がいたずらに繁雑になることを避けるという効果がある。 (単調増加) 測定値空間は、同一の測定対象における同一の測定量に対して定義した空間であるから、第1測定値x iと第2測定値y iとの相関は常に正でなければならない。 ゆえに、相関線は「単調増加関数」でなければならない。 この条件により、第1測定値x iと第2測定値y iとの間で、x i >x kならy i >y kであることが保証される。 つまり、両者の関係において値は逆転することはない。 (補正関数が単調増加または単調減少) また、相関線について補正量を示す関数(以下、「補正関数ζ(x)」)を数10にて定義する。 ここに、補正量は測定値の大きさに比例すると考えられるので、入力値と出力値との差である数10のζ(x)も数7に示すξ(τ i )と同様、入力値に対して「単調増加または単調減少」でなければならない。 以上が相関線の構造に求められる条件となる。
(標本点の歪みに対する対策) ところで、標本点P iは、その全てが適切に母集団から抽出されたものとは限らず、その中には歪みが含まれているものもある。 歪んだ標本点の存在は統計処理における歪みの原因となるから、変換結果における信頼性を確保するために、それらを事前に処理の対象から除外する。 その結果、所定の基準に従って複数の標本点から選択されたもののみが処理の対象とされる(ステップS13)。 (標本点の重み付け) また、個々の標本点P iの重要性は常に等しいとは限らず、それらに差異がある場合も考えられる。 そこで、標本点P iの重要性を情報処理に反映させるために、標本点に対する重み付け(以下、「標本点重みω Si 」)が行われる(ステップS14)。 (標本点の無作為化) 標本点P iの統計処理において妥当性が担保されるためには、それらが確率変数であることが前提となる。 ゆえに、標本点P iが確率変数として扱えるか否かの判断、すなわち標本点P iの無作為性の検証をする必要がある。 そして、もし標本点P iに作為性が認められれば、その対策が講じられる(ステップS15)。 なお、標本点P iの無作為化の処理については、その一例を後述する。 (未定係数の決定) 標本点P iに対し、歪みに対する対策、重み付け、および無作為化を行った後、統計処理により相関線における未定係数を決定し、最尤相関線である変換関数を確定させる(ステップS16)。 未定係数a u jの決定方法は、係数の数に拘わらず確立されている。 たとえば、相関線がn個の未定係数a u jを含む場合、標本点とその相関線について重み付き偏差平方和関数を作り、それを個々の係数で偏微分することにより、n個の方程式を作る。 これらの連立方程式をクラメルの公式等を用いて解くことにより、a u jが確定され、変換関数が決定される。 すなわち、複数の標本点と相関線との残差に基づいて未定係数群の値群が決定され、値群が設定された相関線が変換関数として取得される。 (反復演算) なお、ステップS13において選択される標本点の数がa u jの変化に伴って変動する場合は、相関線の未定係数a u jは反復演算に基づく収束演算により決定される(ステップS17)。 (変換関数の決定) 反復演算が終了し、未定係数a u jが確定した定数a jにより一義に決まる関数が、数5に示す「変換関数」となる(ステップS18)。 (補正値の算出) 補正値は、導出した変換関数の逆関数を用いて算出ればよい。 つまり、測定値y iに対応する補正値τ iは、数11により求められる(ステップS19)。
(標本点の無作為化処理の一例) 図11は、図10中のステップS15における標本点P iの無作為化の処理の一例を示す図である。 以下に、図11に沿ってその手順の説明をする。 (同値変換) 相関線はお互いに交差しない曲線群であるから、任意の標本点P i (x i ,y i )を通るという条件を満足する相関線は1本しか存在しない。 一方、この標本点P iを通る相関線の上の点は無数の点が存在し、それらのいずれもが無数の相関線の中から一つの相関線を確定させる機能を有する。 つまり、特定の相関線上の点は、相関線を特定させるという意味において、同じ情報量を持つと考えられる。 これは、相関線上の点は相関線の上を移動しても、情報量としては変わらないことを意味する。 こうした考え方に基づいて相関線上の標本点P iを移動させる処理を「同値変換」と定義する。 (2次元分布の1次元分布への縮退) 上記の同値変換の考え方を用いれば、2次元分布した標本点を1次元分布に縮退させることができる。 まず、図12に示すように、全ての相関線41と直交する包絡線42を考える。 そして、複数の標本点P iを通る複数の相関線41を求め、この複数の相関線41に沿って標本点P iを複数の相関線41と包絡線(基準線)42との交点P t i (以下、「同値変換点」)に移動させる。 図12では、包絡線が半径rの円弧で近似される例について示している。 ここに、標本点P i (x i ,y i )をP i (r,θ i )と極座標で表示したとき、標本点P iを通る相関線と包絡線との交点P t i (r,θ t i )が同値変換点である。 図11に示す処理では、まず、上記の操作により、2次元空間に分布している標本点P iを1次元の分布P t iに縮退させる工程が行われる(ステップS21)。 (同値変換点分布のピーク算出) もし標本点P iが確率変数であるならば、中心極限定理より、包絡線42上の同値変換点P t iの分布は正規分布となるはずである。 その判定を行うために、まず、包絡線42上の同値変換点P t i (r,θ t i )の分布におけるピーク点P t i (r,θ t p )が求められる(ステップS22)。 この場合、同値変換点P t iは離散値であるから、それにガウシアンフィルタなどによる平滑化処理を行い、連続関数に形成してからピーク値を求めればよい。 なお、この同値変換点のピーク点P t iの算出演算においても、ステップS14の標本点重みω Siが考慮される。 (同値変換点分布の分散の計算) 次に、同値変換点の分布のピーク点P t i (r,θ t p )を境として、分布の上位と下位に分け、標本点重みω Siを考慮して、上位部分の分散σ H 2および下位部分のσ L 2が計算される(ステップS23、図13参照(P t pはピーク点を示す。))。 (標本点の無作為性の判断) 同値変換点の分布において、σ Hがσ Lにほぼ等しいならば正規分布とみなすことができ、ゆえに標本点は確率変数として扱って差し支えない。 しかし、そうした扱いができない場合には、これらは無作為の標本点とは言えないので、何らかの対策を講じる必要がある。 (分布矯正重みの設定) 以下のように、標本点を無作為化させるために、偏ったの分布を実効的に正規分布として取り扱う効果をもたらす重み付けを標本点に導入する。 まず、同値変換点の分布における標準偏差σ Hおよびσ Lを用いて、重みづけに係る標準偏差σ Gを、数12にて定める。
(分布矯正重み) そして、標本点P i (x i ,y i )に対する重み(以下、「分布矯正重み」)ω Diを、数13にて設定する。 すなわち、移動後の複数の標本点の分布に基づいて統計処理時の複数の標本点の重みが求められる。
分布矯正重みω Diは、同値変換点P t iの分布がピーク点P t pの上位と下位で非対称である場合に、それらを数値的に対称な分布として処理するための重み付けである。 これにより、例えば図13の場合、下位の部分の分布51に含まれる標本点の寄与度と上位の分布52に含まれる標本点の寄与度が同じになるように、下位の分布51が破線53にて示す分布に変換される。 (ブラックボックス法のその他の測定値の変換への応用) 以上、測定値の補正を例に挙げ、ブラックボックス法に基づく測定値の変換の原理について解説し、その一般的手続および標本点の無作為化の一例を示した。 ブラックボックス法は、第1測定値x iおよび第2測定値y iを適切に選択することにより、目的に則した変換関数を導出し、それに基づいて測定値の合目的的処理を実現することができる。 ゆえに、「測定値の規格化」や「測定値の比較」などの様々な測定値に関する変換について適用可能である。 なお、これらの測定値の変換への応用については後述する。 (ブラックボックス法の特徴) 解析的方法が有限個の誤差因子を前提とした数学モデルに基づく解析処理で構成されているのに対し、ブラックボックス法は無限個の誤差因子の存在を前提とした入出力モデルに基づく統計処理で構成されている。 視点を変えれば、解析的方法が誤差を誤差因子の効果として説明しようとする記号主義的アプローチであるのに対し、ブラックボックス法は因果関係の説明に記号の介入を必要としないとする排除主義的アプローチと位置付けることもできる。 ブラックボックス法は、測定値の変換において記号を排除したことにより記号化誤差が発生することはなく、ゆえに定量性を担保した情報処理を実現することができる。 ブラックボックス法は、「特別な機器等を必要とせず、測定系の全ての構成要素に由来する系統誤差を対象とし、全ての測定系で機能し、変換結果の妥当性を担保する方法論」である。 こうした機能に加えて、「汎用性があり、簡便で使い勝手のよい方法論」であることから、ブラックボックス方は「測定値の変換の一般法」と位置付けることができる。 ブラックボックス法の具体的応用として、まず、「マラソンの記録の規格化」について詳説し、その後で、他の応用例として「競争競技の記録の評価」、「自動車の燃費の補正」、「選択科目の成績の補正」、「消費者物価の算出」、および「医療行為等の評価について述べる。これらの応用例は、ブラックボックス法の産業上の利用範囲の広さを客観的に裏付けるものであるが、前述したブラックボックス法の一般的手続においては言及していない個別具体的な課題も含まれており、それらへの対応の仕方を明示するという意味においても意義深い事例と考えられる。 (マラソンの記録の変換における課題) 長距離走であるマラソンのように競技時間の長い競技では、その記録は気温、湿度、風などの気象条件やコースの高低差や路面の状態などのコース条件などの環境要因に大きく影響される。 したがって、複数のレースから五輪や世界選手権の代表を選考するような場合には、個々のレースの条件の違いを考慮して記録を評価しなければ、著しい不公正が生じることとなる。 しかし現状においては、記録の評価に関する合理的な方法論が存在しないため、レースにおける記録や順位、または専門的知見に依拠した選考を行わざるを得ないのが実情である。 こうした背景から、マラソンの記録を公平に評価するための方法論は早急に確立されなければならない課題であるといえる。 (マラソンに関するデータの特徴) マラソンに関するデータの特徴として、まず認識しておかなければならないことは、競技の特殊性や開催条件に起因して、データに人為的な歪みが存在する場合があるということである。 例えば、大会運営上の制限により関門を設けざるを得ないとき、出場選手の中には完走する能力と意思があっても関門不通過による途中棄権(DNF)となってしまい、結果的にデータの一部が不自然に欠落することになる。 また、生体に拘わるデータであるという特徴もある。 つまり、生体の運動においては、生体独特のエネルギー代謝メカニズムにより、時間の経過に伴ってエネルギーの枯渇や運動効率の低下等の生理的現象が起こる。 そのため、生体の運動では、自動車のような機械的メカニズムに類推した取り扱いはできない。 さらに、マラソンが知的生物である人間の行為であることにも配慮しなければならない。 つまり、下等生物のように生物学的メカニズムに依拠して運動するだけではなく、たとえば好記録や優勝が望めなくなると集中力を失うなど、記録には常に知的葛藤が伴っているということである。 マラソンのデータの処理については、こうした特殊な事情も存在するが、これらの問題を適切に処理すれば、基本的には前述の一般的手続の枠内で扱うことができる。 (一般的手続とマラソンの事例との対応関係) ブラックボックス法において、測定値の変換に関する一般的手続とマラソンの記録の処理という具体的な事例との対応関係について、まず検討する。 (実走タイムと持ちタイム) 今、N p名の選手が出場し、N f名の選手が完走したマラソン大会(以下、「処理対象大会」)を想定する。 この場合、データの母集団は処理対象大会の全出場選手であり、第1測定値x iには「処理対象大会の出場選手が持つ、他の大会でのマラソンの記録」が、第2測定値y iには「処理対象大会における完走記録」(以下、「実走タイム」)が対応する。 (出場資格記録) ところで、多くのマラソン大会においては、大会の出場条件として「出場資格記録」を要求している。 それは概ね、処理対象大会から遡る2年以内に公認大会で出したという条件を満たす最良の記録となっている。 これらの出場資格記録は、出場選手の力量を反映したものであるばかりでなく、その測定系(出場資格を得た大会の条件)も分散している。 このように、出場資格記録は個別測定値としての要件を備えているばかりでなく、データの入手も容易であることから、マラソンの記録の補正に用いる第1測定値x iとして、処理対象大会における出場資格記録(以下、「持ちタイム」)を使用する。 (標本の抽出) 以上の検討から、マラソンの記録の変換に使用する標本は、持ちタイム(処理対象大会の出場資格記録)x i 、および実走タイム(処理対象大会における完走記録)y iであり、それらの標本の組み合わせが標本点P i (x i ,y i )となる(図10:ステップS11)。 (実走条件と持ちタイム条件) マラソンの記録における計測器や測定者に由来する誤差はせいぜい数秒であり、2時間以上の競技時間に対してごく僅かであるから、マラソンの記録における誤差の大半はレース条件の差異に由来していると考えて差し支えない。 つまり、マラソンの記録の変換においては、測定系の誤差要因としてレース条件を検討すれば十分である。 ここでは、実走タイムが出たときのレース条件(一括測定系である第2測定系)を「実走条件」、持ちタイムが出たときのレース条件(個別測定系である(複数の)第1測定系)を「持ちタイム条件」と呼ぶ。 (マラソンの記録の規格化および規格値) 出場選手が増えれば、個々の出場選手が持ちタイムを出した競技会も分散化する。 ゆえに、持ちタイムの統計処理により仮想的に構築される持ちタイム条件は、ほぼ均一になると考えられる。 一方、持ちタイムは処理対象大会前の過去2年間における自己最高記録であるから、レース条件としては恵まれていたと推察される。 このように、持ちタイム条件は標準的なレース条件よりも良い条件と考えられることから、それを「準標準系S'」(第1再構成系)の一種である規格化された測定系(以下、「規格系S”」)と捉えることができる。 すなわち、標本として持ちタイムx iと実走タイムy iを用いた場合、処理の実体は「マラソンの記録の規格化」であり、実走タイムy iを持ちタイム条件下の記録への変換値τ iは「規格値」と位置付けられる。 (持ちタイム−実走タイム空間における標本点の分布) 図14は、2004年の福岡国際マラソンの結果を持ちタイム−実走タイム空間に散布図で示したものである。 図14から明らかなように、持ちタイムx iと実走タイムy iの間には強い相関が認められる。 基本的には、持ちタイム−実走タイム空間において、実走条件と持ちタイム条件を関係づける変換関数31を標本点の統計処理により求めればよいのである。 (時間制限線による標本点の歪み) ところで、図14に示す散布図では、標本点の分布の一部が削除されている。 図14の上方を横に貫く直線301は大会規定により設けられている関門を示す線(以下、「時間制限線」)であり、数14にて示される。 ここに、y maxは完走した選手の中で最も遅かった選手の記録である。
図14から明らかなように、出場選手の中には完走する意思と能力がありながら、時間制限によりレースの中断を余儀なくされた選手が数多く含まれている。 ゆえに、こうした分布の歪を保留したまま標本点の統計処理を行えば、その処理結果にも歪みが生じてしまうのは明らかであるので、処理に先んじて、歪んだ標本点を処理の対象から除外し、残りの選択された標本点のみが統計処理の対象とされる。 (相関線の構造の決定) 相関線の構造は、事例の性質に照らして妥当なものでなければならない。 しかし、それを決定することは容易ではない。 そこで、以下の工程を経由することにより、妥当性を担保する相関線の構造を決定する。 (達成率) まず,持ちタイムx iと実走タイムy iを用いて、個人のパフォーマンスを表す指標(以下、「達成率」)η iを、数15にて定義する。
(比率関数) なお、数15のように、第1測定値x iと第2測定値y iとの比η i (=x i /y i )について定義する関数を「比率関数」と呼ぶこととする。 (持ちタイム−達成率空間における標本点の分布) 図15は、図14に示したものと同じ標本点を、持ちタイム−達成率空間に表示したものである。 この空間においては、先の時間制限線(符号601を付す。)は、数16にて表される。
(達成率関数) まず、持ちタイムと達成率の関係を示す関数を数17のように定義し、それを「達成率関数」と名づける。 達成率関数は、持ちタイムと達成率の関係を示す相関線と位置付けることができる。
(達成率関数の数学的要件) 達成率関数の数学的要件は以下の通りである。 まず、数15の定義から数18が満たされる。
一方、xが無限大における収束性の要求により、数19が満たされる。
また、競技時間が短ければ環境の影響を受けないはずであるから数20も満たされることが好ましい。
更に、x=0付近では達成率はなだらかに変化することが求められることから数21が満たされる必要がある。
加えて、持ちタイムと達成率はおよそ線形に対応すべきであるから、単調増加または単調減少であることが求められる。 よって、定義域において数22が満たされる。
(達成率関数の構造) 上記の5つの要件を全て満足する関数で、少なくとも1つの未定係数である未定係数群を含む達成率関数(相関線)として様々なものが考えられ、例えば、数23にて示されるもの(a u j ,A u jが未知係数)が提示できるが、既述のように、未知係数が複数の場合は、同値変換を行うために未知係数を互いに従属関係としたり、他の拘束条件を導入する必要があるため、ここでは、数24にて示すものが設定されるものとする(ステップS12)。 なお、同値変換を伴う無作為化が行われない場合は、達成率関数には複数の独立した未定係数が含まれてよい。
(環境指数) 数24における未定係数a uは,処理対象大会における実走条件を定量的に規定する値であり、これを「環境指数」と呼ぶ。 環境指数a uとレース条件との関係は表2の通りである。
(達成率関数を経由して導いた相関線) 達成率η iは、持ちタイムx iと実走タイムy iの比であり、一般的には数25と表現される。
ゆえに、数24および数25より数26が得られる。
数26が、達成率関数(一般的には比率関数)を経由して導いた(すなわち、変更された)相関線の構造である。 こうした手順で相関線を導く方法により、相関線がおよそ横方向に伸びることとなり、相関線の構造を直感的に捉えやすくすることができる。 (相関線の実用性) ところで、数26に示す関数は、a u >0のときは単調増加関数とはならず、先に示した数学的要件を満足しない。 しかし、変換関数における係数aは通常、負の値をとり、正の場合であっても極めて小さい値をとる。 また、数27の範囲では単調増加関数であることから、マラソンの記録の規格化という用途において、実用上の問題はない。
(標準達成率関数) 達成率関数の中で、標本点の統計処理によって決まり、標本点に照らして標準的な達成率を示す関数η 0を定義し、「標準達成率関数」と呼ぶ。 標準達成率関数η 0は補正タイムτと標準達成率とを関係づける変換関数であり、数28にて表される。 また、標準達成率関数は、間接的に第1再構成系(複数の持ちタイム条件(個別測定系)から導かれる再構成系)と第2再構成系(実走条件は一括測定系であるため、第2測定系と同一である)との関係を示す関数である。
(標準環境指数) 数28における係数aは、達成率関数ηが標準達成率関数η 0である場合の環境指数(すなわち、未定係数a uに対して決定された値)であり、これを「標準環境指数」と呼ぶ。 (標準環境指数の導出手順) 標準環境指数aは、一般的には持ちタイム−実走タイム空間における標本点の統計処理から求められるが、持ちタイム−達成率空間における処理から求める方が計算が簡単なので、後者の場合を以下に示す。 なお、持ちタイム−実走タイム空間で標準環境指数aを求める、すなわち、変換関数を求めることと、持ちタイム−達成率空間で標準環境指数aを求めることとは実質的に同等である。 (準備処理) 標準環境指数aを求める際には、まず、準備処理として全標本点に対して同値変換が行われる。 持ちタイム−達成率空間での同値変換の詳細については図17を参照して後述するが、概要を説明すると、図17に示すように変換基準値x sを適当に決定し、各標本点を通るように係数aが決定された相関線64に沿ってこの標本点を直線x=x s (以下、「変換基準線」)63上へと移動される。 そして、直線63上における標本点の分布のピークよりも上位の部分の分散σ Hおよび下位の部分の分散σ Lが求められて準備される。 なお、分散σ H ,σ Lの初期値は適当に操作者により設定されてもよい。 (標本の歪みに対する対策) 図15に示す時間制限線601は人為的要因により発生するものであり、こうした人為的な効果により歪んだデータをそのままにして処理したのでは結果の信頼性が損なわれる。 そこで、処理に先んじて、以下の方法で標本点P iの分布における歪んだ部分が排除される(ステップS13)。 まず、達成率関数ηにおいて、適当な値が環境指数a uの初期値として設定される。 次に、数28を決定するに際して使用する標本点の存在範囲を保証する線(図15中に符号602を付す。以下、「データ保証線」)を数29に従って定める。
ここに、η Lは達成率分布の存在保証範囲を示している。 データ保証線η Lにおける係数a Lは、前述の準備作業にて求めた標準偏差σ Hを用いて数30により求められる。 もちろん、他の演算によりa Lが求められてもよい。
こうして定めたデータ保証線602と時間制限線601との交点x max (以下、「標本分離値」)を求め、x i ≦x maxである標本点(すなわち、図15中の直線603よりも左側の標本点)が統計処理の対象として選択された有効な標本点とされる。 数30を利用することにより95%強の歪のない標本点の存在が保証される。 (標本の重み付け) 競技能力が異なる選手のデータを全て同等に扱うのはかえって不公平である。 そこで、出場選手の競技能力、すなわち持ちタイムxに応じて標本点に重みが付けられる。 複数のランナーに聞き取り調査をした結果、マラソンの持ちタイムxと月間平均走行距離Lとの間には、数31にて示す関係が近似的に成り立っていることを見出した。 ここに、指数nは3.5〜4.0程度の値をとると推察される。
図16は、男性選手における月間平均走行距離と持ちタイムとの関係の一例である。 ここに、2時間10分の持ちタイムの選手の月間平均走行距離を1000km/月として表示している。 図16から、「持ちタイムのいい選手は月間平均走行距離も長い」ということがいえる。 一方、「練習量の多い選手ほどレース結果の安定性・信頼性が高い」と考えられるので、「持ちタイムのいい選手のレース結果ほど安定性・信頼性が高い」ということになる。 以上の検討を踏まえ、標本点重みω Siを数32にて定めることとする(ステップS14)。 なお、標本点重みω Siは、比のみが意味を持つのであるから、数32の係数kは正の実数なら何でもよい。
(標本点の無作為化) 標本の無作為化も簡単に行うために、図17に示す持ちタイム−達成率空間上で行われる(ステップS15)。 まず、相関線64はx軸にほぼ平行であるから、相関線64の包絡線をx軸に垂直な線である変換基準線63で近似する。 次に、処理対象の標本点を通る相関線64を求め、各標本点が相関線64に沿って変換基準線63上へと移動される(ステップS21)。 そして、移動後の点である同値変換点η t iの分布においてピークとなる値η t pを求め、前述の準備処理と同様に、η t pを境として、その上位の分散σ H 2と下位の分散σ L 2を個別に計算する(ステップS22,S23)。 マラソンの標本の場合、変換基準線63上の同値変換点η t i (以下、「基準達成率」)の分布は例外なくσ H <σ Lである(ステップS24)。 その理由は、持ちタイムを出した大会時に比べて処理対象大会時における身体の仕上がりが悪かった選手が多いためと考えられる。 個人のコンディショニングの問題は作為の事由に該当するので、統計処理においては、達成率の低い選手の寄与度を下げる必要がある。 そこで、基準達成率η t iに対する無作為化のための分布矯正重みω Diを、数13に基づき、数33にて設定する(ステップS25)。 すなわち、変換基準線63上における複数の標本点の分布に基づいて統計処理時の複数の標本点の重み(の一部)が求められる。
この分布矯正重みω Diの導入によりより、途中棄権(DNF)した選手が統計処理の結果に及ぼす影響は0となる。 すなわち、途中棄権した選手やつぶれた選手の結果を除外値として処理の対象から外すのではなく、基本的な統計処理の枠組みの中にこうした標本点を組み込むことができる。 (標本点の統計処理) 以上の処理を踏まえ、達成率関数における標準環境指数aの決定が行われる。 まず、標本点と環境指数a uの仮の値が設定された達成率関数との残差δ iは、数34にて表される。
したがって、持ちタイム重みω Siおよび分布矯正重みω Diを考慮した残差δ ωiは、数35にて示す通りとなり、重み付き偏差平方和関数ξは数36で得られる。
数36をa uで偏微分して数37のように0とおき、これを整理すると数38となる。
数38の左辺は一定値であり、右辺の値はa uに関して単調増加する。 ゆえに数38を満足するa uの値が一義に決まる。 これが、標準環境指数aである(ステップS16)。 以上のように、複数の標本点と相関線との残差に基づいて未定係数群(環境指数)の値群が決定され、この値群が設定された相関線が変換関数(標準達成率関数)として取得される。 (反復演算) マラソンのデータのように標本値に歪みが含まれている場合には、処理対象となる標本点の数が歪み対策の処理の際に環境指数a uによって変動する。 そのため、標準環境指数aを求める演算は反復演算とされ、a uが収束したときの値が標準環境指数aとされる(ステップS17,18)。 (補正タイムの算出) 標準達成率指数aが決まれば、実走タイムyと補正タイムτを関係づける変換関数は、数39と定まり、補正タイムτは、数39をτについて解くことにより求めることができる(ステップS19)。
(ニュートン法) ただし、数39はτについて解析的には解くことができないので、ニュートン法による収束演算で数値的に解く。 まず、関数f(τ)を数40にて定め、f(τ)は任意の位置で数41にて示すように微分可能である。
f(τ)上の点(τ j ,y j )における接線は数42で示され、数42のτ切片τ j+1は、数43で示される。
一方、数44が前提となることから、数43は数45となる。
このように、実走タイムがy iである場合の補正タイムτ iは、数45に示す漸化式に基づく収束演算により求めることができる。 (マラソンの記録の規格化アルゴリズム) 図18は、以上に説明したマラソンの記録の規格化の処理を、マラソン特有の工程を含めて示す図である。 この処理は多重ループで構成される収束演算であり、以下にその内容を簡潔に説明する。 なお、図10では標本点の重み付け処理が反復演算の中に含まれているが、マラソンの記録の規格化ではこの重み付けは1回求められるだけでよいため、図18に示す実際の演算では標本点の重み付けが反復処理の前に行われる。 また、上記マラソンの記録の規格化の説明では、標本点の無作為化で同値変換について言及したが、変換基準線x=x sが変更されない場合は同値変換は1回行われるのみでよいため、図18に示す実際の演算では同値変換による基準達成率の算出も反復処理の前に行われる。 また、以下の説明では図10および図11における対応する工程の符号も付している。 ・競技会の固有値の入力(ステップS31) 処理の対象となる競技会に固有値で、当該処理に関係するものがコンピュータである測定値変換システムに入力される。 固有値は具体的には、出場選手数N p 、完走選手数N f 、最終完走タイムy max等である。 ・出場選手のデータの入力(ステップS32,S11) 当該大会に出場したN pの選手の持ちタイムx iおよび完走した選手の実走タイムy iが演算装置に入力される。 また、標本点P i (x i ,y i )の抽出も行われる。 ・処理パラメータの設定(ステップS33,S12) 当該アルゴリズムにおいては、あらかじめ幾つかのパラメータを設定する必要がある。 具体的には、未定係数群を含む相関線(変換関数)の構造、変換基準値x s 、数32の標本点重みω Siを決定するための指数n、同値変換点を連続関数に形成するための平滑化フィルタに附帯する係数σ Fなどである。 これらの構造やパラメータは、学術的知見により決定し得るものもあるが、実務的要請により決定されるものもある。 ・初期値の設定(ステップS34) 演算の開始に必要な初期値が設定される。 初期値を必要とする値は、環境係数a、基準達成率η t iの分布における標準偏差σ Hおよびσ Lなどである。 初期値は処理ループに適合するものならば何でもよい。 ・達成率の算出(ステップS35) 有効な標本点P i (x i ,y i )について、達成率η iが数15に基づいて測定値変換システムにより計算される。 これにより、複数の実走タイム(第2測定値)のそれぞれが、対応する参加者(測定対象)の持ちタイム(第1測定値)と実走タイム(第2測定値)との比に置き換えられる。 ・基準達成率の算出(ステップS36,S21) 2次元空間に分布した標本点を1次元空間上に変換するために同値変換を行い、基準達成率η t iが求められる。 なお、数24にx iを代入したものが達成率関数η iであり、x sを代入したものがη t iであることから、基準達成率η t iは数46により得られる。
・標本点重みω Siの算出(ステップS37,S14) 標本点重みω Siが数32に基づいて算出される。 ・処理対象とする標本点の限定(ステップS38,S13) 図15に示すデータ保証線602と時間制限線601の交点から標本分離値x maxを求め、x i <x maxを満足する標本点を選択して処理対象とすることにより、標本点の歪みに対する対策が施される。 ・変換点の統計量の算出(ステップS39,S22,S23) 上記の方法で限定した処理データ、すなわち、限定された標本点の全てについて、基準達成率η t iの分布の統計量、分布のピークη t p 、上位および下位の分散σ H 、σ Lが計算される。 図15ではピークを通過する達成率関数61を参考のために示している。 ・分布矯正重みω Diの算出(ステップS40,S25) 数33に基づき、分布矯正重みω Diが算出される。 ・環境指数の算出(ステップS41,S16) 持ちタイムxと補正タイムτとの相関が最大となるように、複数の標本点と相関線との残差に基づいて環境指数a uの値が決定される。 相関の評価には重み付き誤差2乗和関数が用いられる。 ・収束の判定(ステップS42,S17,S18) 計算の基礎とした環境係数a uと、新たに求めた環境係数a u 'を比較し、a u =a u 'なら演算が終了する。 a uの収束値が標準環境係数aとされる。 ・反復演算におけるデータ更新(ステップS43) 環境係数がa uとa u 'との差が所定値以上であれば、a uの値をa u 'に更新し、ステップS38〜ステップS42が反復される。 ・補正タイムの算出(ステップS44,S19) 求められた標準環境係数aから導かれる変換関数から、実走タイムy iに対応する補正タイムτ iが求められる。 ただし、数39はτについては解析的に逆関数を求めることができないので、数45に示すニュートン法に基づく漸化式よる収束演算で数値的に解かれる。 (変換結果提供サービス) マラソンの記録は環境やレース条件に大きく左右されるため、環境の要因を差し引いた真の記録を知りたいという希望は、エリートランナーのみならず、市民ランナーにも根強いものがある。 そこで、ブラックボックス法に基づいて記録を規格化し、選手および関係者に発信するというサービスが考えられる。 図19は規格化された記録を提供する測定値変換システム7を示す図である。 測定値変換システム7には、コンピュータネットワークであるインターネット90を介して利用者端末92からマラソン大会での利用者自身の記録である実走タイムが入力され、変換されて規格化された補正タイムがインターネット90を介して利用者端末92へと送信される。 一方、ブラックボックス法により変換関数を求めるために必要となる各選手の持ちタイムx iおよび実走タイムy iは、マラソンの主催者側の情報提供者端末91からインターネット90を介して測定値変換システム7に入力される。 なお、既述のように、複数の持ちタイムはブラックボックス法における複数の第1測定値に対応し、個別測定値である。 複数の実走タイムは複数の第2測定値に対応し、一括測定値である。 そして、複数の第1測定値は測定対象である複数の参加者を持ちタイムが得られた互いに異なる複数の第1測定系でそれぞれ測定した結果であり、複数の第2測定値は複数の参加者を処理対象大会という同一の第2測定系にてそれぞれ測定した結果である。 また、マラソンの記録の規格化では複数の参加者に対応する複数の第2測定系は同一であることから、標本点の統計処理により導かれる第2再構成系は第2測定系と同一となる。 測定値変換システム7は、通常のコンピュータと同様の構造を有する演算装置であり、CPUがプログラムに従って演算処理を行うことにより、CPU、ROM、RAM、固定ディスク装置、各種インターフェイスなどが図19中に示す通信部71、入力部72、データベース管理部73、変換関数取得部74および変換部75として示される機能を実現する。 測定値変換システム7では、まず、情報提供者端末91からインターネット90および通信部71を介して、処理対象大会に参加した選手の持ちタイムx i 、実走タイムy i等が入力部72にて受け付けられ、データベース管理部73に記憶される(ステップS31,S32)。 そして、変換関数取得部74による既述の処理により、変換関数が求められる。 すなわち、複数の参加者のそれぞれに対応する持ちタイムおよび実走タイムの組み合わせを標本点として取得し、複数の標本点を統計処理することにより、複数の第1測定系から導かれる第1再構成系と第2測定系と同一である第2再構成系との関係を示す変換関数が求められる(ステップS33〜S43)。 求められた変換関数は変換部75に設定される。 変換関数が求められると、処理対象大会に参加した利用者が、利用者端末92から自己の実走タイムをインターネット90および通信部71を介して入力部72に入力することにより、変換部75が変換関数を用いて実走タイムを変換することにより、変換値である補正タイムが求められる(ステップS44)。 補正タイムは通信部71およびインターネット90を介して利用者端末92へと送信され、利用者が自己の規格化された記録を確認することができる。 なお、エリートマラソン大会においては、大会のプログラム等に持ちタイムが公表されているが、市民マラソン大会では公表されていない。 そこで、大会主催者との協力体制を確立し、持ちタイムと実走タイムの提供を受けて補正タイムを算出し、出場選手等に情報を提供するシステムとして運用するのが実務的と考えられる。 (マラソンの記録の規格化への適用における特徴) ブラックボックス法は、マラソンの記録の規格化への適用において、次の特徴を有する。 ・環境要因を観測する必要がない(簡便性)、 ・公開された情報により処理することができる(透明性)、 ・補正タイムが画一的に決まる(一意性)、 ・完走タイムを適正に評価することができる(公平性)、 ・時間的および空間的整合性がある(普遍性)、 ・性別、出場選手の能力差、出場選手数、制限時間等にかかわりなく使用できる(汎用性) (マラソンの事例における補正の効果の検証) マラソンの記録の規格化における、ブラックボックス法の効果を検証した結果を以下に示す。 効果の検証は2つの側面から行った。 一つは、ほぼ等しい時期に開催された、異なる競技会での記録の整合性(以下、「空間的整合性」)の検証であり、もう一つは、同一の競技会における異なる年度の記録における整合性(以下、「時間的整合性」)である。 (空間的整合性の検証) まず、アテネ五輪女子マラソン選考に係る3レース(2003年の東京国際女子マラソン(以下、「東京」)、2004年の大阪国際女子マラソン(以下、「大阪」)、2004年の名古屋国際女子マラソン(以下、「名古屋」))についての処理結果から空間的整合性を検証する。 ここに、東京、大阪および名古屋の国内3大会への出場資格は、「フルマラソンで3時間15分以下」など、ほぼ同じであることから、3大会の出場選手の競技能力にも大差はないと考えられる。 (散布図の変化) 図20. A〜図20. Fは、マラソンの記録の規格化の効果を散布図で示したものである。 図20. A〜図20. Cは記録を規格化する前の東京、大阪、名古屋のデータであり、横軸が持ちタイムx、縦軸が実走タイムyに対応している。 これによれば、大阪と名古屋では直線y=x(すなわち達成率で考察した場合のη=1)の周りに分布しているが、東京だけは持ちタイムxに比べて実走タイムyが極端に悪く、ほとんどの選手が直線y=xの上(すなわちη<1)の領域に分布していることがわかる。 一方、図20. D〜図20. Fは、持ちタイムxと補正タイムτの関係で示している。 ここに、大阪と名古屋に関しては補正前の散布図に対して大きな変化は認められないが、東京がy=τ(すなわちη=1)を中心とした分布に変換されており、レース条件の差異に対する規格化の効果が確認できる。 (達成率の分布の変化) 図21. Aは記録を規格化する前の達成率ηの分布であり、図21. Bは規格化後の分布である。 ここに、離散値である達成率の分布をガウシアンフィルタを用いて平滑化処理し、ピーク値を1として規格化して表示している。 図21. Aでは、達成率ηの分布のピーク(東京:0.950、大阪:0.986、名古屋:0.991)は、東京のピークが大阪や名古屋に比べて約4ポイント悪かったことがわかる。 これは、2時間30分の選手なら6分に相当する大差である。 一方、記録の規格化後の図21. Bでは、3大会の達成率の分布はピーク(東京:0.998、大阪:0.998、名古屋:1.00)は1.0付近に集中しており、記録を規格化する前に東京と他の2大会との間に存在した約4ポイントあった差が解消されている。 つまり、規格化処理が適切に機能していることがわかる。 (サブスリー率) 図22は、サブスリー(マラソンを3時間未満で走ること)の選手の割合(以下、「サブスリー率」)における比較である。 サブスリー率における比較は、全出場選手という切り口での記録の規格化の検証といえる。 記録を規格化する前、すなわち持ちタイムxと実走タイムyとに基づく比較においては、持ちタイムでのサブスリー率(東京:41.7%,大阪:30.2%,名古屋:40.6%)に対し,実走タイムでのサブスリー率(東京:13.3%,大阪:28.2%,名古屋:34.3%)において、東京での低さが際立っている。 しかし規格化処理により,補正タイムτによるサブスリーの割合(東京:34.7%,大阪:32.1%,名古屋:37.7%)では、東京も大阪や名古屋とほぼ同一のレベルになっている。 相関度の比較においても、持ちタイムxと実走タイムyとの相関係数(r=0.564)に比べ,補正タイムτと実走タイムyとの相関係数(r=0.995)は強い正の相関を示し、補正タイムτが出場選手の実力に見合った評価であることを裏付けている。 (持ちタイム更新率) 図23は、持ちタイムxを更新した選手の割合(以下、「持ちタイム更新率」)による比較である。 ここに、大会の条件が等しいなら持ちタイムxを更新した選手の割合もほぼ等しくなると予想できるから、持ちタイム更新率は個人レベルでのパフォーマンスの評価という切り口における記録の規格化の効果の検証ということができる。 ここに、記録の規格化前においては、持ちタイムxと実走タイムyの比較においては、持ちタイム更新率(東京:4.4%,大阪:25.2%,名古屋:25.1%)に大会間で大差があり、レース条件の差異により記録が大きく左右されることが顕著に示されている。 一方、記録を規格化した後において持ちタイムxと補正タイムτを比較した場合では、持ちタイム更新率(東京:35.8%,大阪:38.2%,名古屋:39.43%)は3大会でほぼ等しくなっている。 このように、持ちタイムの良し悪し、すなわち選手の能力の如何に拘わらず、記録の規格化が適切に行われていることが伺える。 (上位選手での比較) 表3は、アテネ五輪選考に係る国内3大会のおける上位選手の成績の比較である。 表3によれば、実走タイムでは、東京国際女子マラソンで2位の選手(高橋尚子選手)は3人の五輪候補選手の中で3番目であるが、補正タイムでみると、3名のアテネ五輪候補選手の中では一番良い成績であったことが示されている。
(アテネ五輪との整合性) 表4は、アテネ五輪参加選手のアテネ五輪の結果とアテネ五輪選考に係る国内3大会の記録とを比較したものである。 表4によると、実走タイムと五輪の成績との間に有意な関係は見られないが、補正タイムと五輪の成績との比較においては、選考レースにおける補正タイムの順位がそのままアテネ五輪の順位になっている。 また、実走タイムと五輪での結果との相関(r=0.776)に比べ、補正タイムと五輪の結果との相関(r=0.833)の方が強い正の相関を示している。 つまり、補正タイムは実力を的確に評価する指標であり、五輪の選手選考等においては実走タイムより遥かに重要視しなければならない情報であることが裏付けられている。
(時間的整合性の検証) 次に、1995年から2004年までの10年間の東京国際女子マラソンの解析結果に基づき、記録の規格化における時間的整合性の検証を行う。 (サブスリー率) 図24は、東京国際女子マラソンにおけるサブスリー率の過去10年間に亘る解析結果である。 この結果においても、持ちタイムxと実走タイムyとの相関係数(r=-0.577)に対し、持ちタイムxと補正タイムτとの相関係数(r=0.652)はかなり高い値である。 この結果からも、補正タイムτは実力が的確に反映された指標であると言うことができる。 (持ちタイム更新率) 図25は、東京国際女子マラソンにおける持ちタイムを更新率を、実走タイムxと補正タイムτに分けて示してある。 まず、記録を規格化する前の比較、すなわち持ちタイムxと実走タイムyの比較においては、持ちタイムxの更新率に最高(34.82%)から最低(4.43%)まで8倍近い開きがある。 この結果は、異なる競技会の記録を実走タイムyで比較することは極めて不公平な手続きであることを如実に示している。 一方、持ちタイムxと補正タイムτとの比較においては、持ちタイムxの更新率は35%〜45%の間で安定している。 コースも出場資格も同一の大会での解析結果であるから、結果における安定性が記録の規格化の信頼性を裏付けている。 要するに、レース条件によって大きな変動を来たす実走タイムyは異なる競技会での記録の比較には適さず、そうした用途には補正タイムτを用いるべきであるといえる。 (個人記録の推移) 図26は、東京国際女子マラソン大会において最多出場を誇る選手の10年間の記録の動向である。 この解析結果によれば、実走タイムyでの評価では年度毎にばらつきが大きく、個人記録が大会の条件に大きく左右されていることがわかる。 しかし補正タイムτで見れば、レース条件が規格化されているため、個人的条件に基づく変化だけを浮かび上がらせることができる。 このように、記録の規格化処理により提供される補正タイムτは、個々の選手が自己の状態を定量的・客観的に把握することを可能にし、練習内容の評価や計画に重要な情報を提供するものである。 (上位選手の記録の推移) 図27. Aおよび図27. Bは、東京国際女子マラソンにおける上位選手の記録の推移を示す興味深いデータである。 図27. Aは、実走タイムyによる記録の変化である。 女子マラソンの記録は、近年、めざましい進歩をしているものの、上位選手の記録の推移を実走タイムyで見る限り、レース条件の変動というノイズに隠されて系統的なトレンドを見出すことは難しい。 一方、図27. Bは補正タイムτでの変化を示すものである。 補正タイムτは規格化されたレース条件下での記録であるため、記録の短縮のトレンドが見事に浮かび上がってくる。 また、1979年の第1回大会から2004年の第26回大会までの東京国際女子マラソンの歴史において、2003年のA(アレム選手)の優勝タイムは当該マラソン大会史上3番目の記録であり、B(高橋尚子選手)の記録に至っては22番目という、いかにも平凡な記録である。 しかし、補正タイムτで見ると、A(アレム選手)の記録は大会新記録であり、B(高橋尚子選手)の記録も1999年のC(山口衛里選手)の大会記録に次ぐ大会史上3番目の好タイムであったことがわかる。 補正タイムτは、このように、記録短縮の傾向やA、B両選手の国際的な実績に照らして、妥当な評価結果だと思われる。 (マラソンの記録の規格化のまとめ) 以上、マラソンの記録の規格化の効果を、空間的整合性と時間的整合性について検証した。 この結果、異なる競技会の記録の比較において、全出場選手、個人、上位選手、いずれの切り口においても、補正タイムτを用いる方が実走タイムyで比べるよりも遥かに優れていることが裏付けられる。 また、補正タイムτを用いれば、競走競技の記録の時空を越えた比較が可能となることが証明された。 (競走競技における記録の評価) マラソンにおける記録の補正を先の例では取り挙げたが、陸上の長距離競技、スキー、スケート、競馬、競艇、カーレース、オートレース等の競走競技全般においても、気象条件やコースの特性などの多様な誤差要因(以下、「環境要因」)の影響を受ける。 そのため、競走競技に参加した競争者や競争物(例えば、カーレーシングのマシン)の実力を正しく評価するためには、こうした環境要因による影響分を考慮する必要がある。 ブラックボックス法を利用した測定値の変換方法においては、環境要因の観測という解析的手法において必要とされる煩雑な手続きを必要とせず、また、変換結果に定量性が見込めることから、競争競技における記録の評価という課題に対して有効に機能すると考えられる。 競走競技においても、第1測定値x iとしては他の競技会での「参照記録」(個別測定値)を、第2測定値y iとしては変換の対象とする競技会での「競技記録」(一括測定値)を使用する。 そして、変換値には実力を適正に評価した値、具体的には、所定の条件を満たす最良の記録(以下、「評価記録」)が対応する。 例えば、競馬の記録は馬場の状態で大きく変動する。 ゆえに馬体を把握するための基礎情報としては、公表されている競技記録をそのまま使うより評価記録を使う方が遥かに適している。 また、評価記録を用いた方が合理的な馬の調教や管理ができることは疑いの余地がない。 もちろん、競艇やオートレースなどにおいても同様のサービスの提供が可能であると考えられる。 また、マシンの能力の評価やドライバーの技量の把握や、チームの弱点を見極める上でも評価記録は有益な情報である。 つまり、競争競技全般において記録の補正のニーズは大きく、それゆえに情報を規格化してユーザーに提供するサービスは産業上の利用可能性が極めて高いと考えられる。 (自動車の燃費の補正) 工業分野における応用例として、自動車の燃費の補正の問題を取り挙げることができる。 燃費は車の経済性能を表す指数であり、日本では、自動車メーカーが同一条件下でテストした結果(以下、「公称燃費」)として、60km/h定地走行燃費や10・15モード燃費などが用いられる。 60km/h定地走行燃費とは、平坦、無風の舗装路を車両総重量の状態で60km/hの定速で走った際の燃料消費量である。 また、10・15モード燃費とは、市街地走行をサンプリングした10モード走行を3回繰り返した後、高速道路走行をサンプリングした15モード走行を1回行って測定する燃費である。 メーカーが提供するこうした公称燃費は、ユーザーの使用感覚からずれたものであるという声も多いが、このずれこそが系統誤差である。 もしブラックボックス法をこうした公称燃費の補正に適用するならば、メーカーが提供するこうしたデータを使用実態に則した値に補正することができる。 この事例においては、第1測定値は各ユーザーが実際に実走した場合の燃費(以下、「実燃費」)(個別測定値)であり、それをx i [km/L]とする。 一方、第2測定値は公称燃費(一括測定値)であり、それをy i [km/L]であるとする。 このとき、x iとy iの間に高いは相関があるものの、両者の値は大きく食い違っている。 しかし、ブラックボックス法により実燃費x iと公称燃費y iを用いて補正した燃費(以下、「補正燃費τ i [km/L]では、ユーザーの使用感覚に近い値に補正される。これは、ユーザーが車の購入する場合だけでなく、経済的で安全な運転を行う上でも、極めて有益な情報となる。なお、燃費の事例は工業分野での応用におけるほんの一例に過ぎず、製造、流通、販売等のあらゆる局面において、ブラックボックス法の適用が可能である。 (選択科目の成績の補正) 教育分野への応用例として、大学入試等における選択科目の成績の取り扱いに関する問題を取り挙げることができる。 大学入試においては、試験には選択科目制が導入されている。 例えば、大学入試センター試験の場合には、受験者は地理・歴史という出題科目では9科目の内から1科目を、外国語では5科目から1科目を選択して受験することになっている。 同様に各大学においても、入試科目の中に選択科目が含まれている。 しかし、難易度に差があるため、選択科目間の得点格差が問題となっている。 従来は、こうした受験における不平等を是正する有効な手段が存在しなかったが、ブラックボックス法の適用により、明瞭な解決を図ることができる。 この事例においては、第1測定値x iとしてセンター試験における「全受験科目の平均点」(総合点/総配点×100)(一括測定値)を、第2測定値y iとして「選択科目の得点」(一括測定値)を採用する。 ここに、選択科目の得点y iには出題科目の難易度差に依拠する偏差が伴っているため、素点で入試の判断を行うと不公平が生じる。 全受験科目の平均点x iの場合においても、入学試験は一括測定値であることから、年度毎に問題の差異に伴う偏差が附帯している。 しかし、受験生の学力と平均点との間には強い相関があることから、全受験科目の平均点は受験者の実力に近い評価値となる。 ブラックボックス法により、出題によって変動の激しい選択科目の点数を合理的に補正することができるため、選択科目の難易度の差に基づく不公平を問題を解決することができる。 (消費者物価指数の算出) 測定値によっては、個別測定値を用意することができない場合があるが、こうした場合であっても、測定値の比較を目的としてブラックボックス法を適用することができる。 測定値の比較の用途としては、消費者物価などのように「時間的に変化する測定系における測定値の動向の検証」や、生産者物価と消費者物価のように「性質の異なる測定系における測定値の比較」が考えられるが、ここでは消費者物価指数の計算に適用した例を示す。 消費者物価指数(以下「CPI」)は厚生年金や国民年金などの公的年金の支給額算定の根拠となるほか、民間企業の賃金決定に影響を与える等の重要な役割を担っている。 CPIは、個々の財、サービスの価格をそれぞれのウェイトを用いて加重平均することによって算出される。 すなわち、基準時価格をP o 、比較時価格をP t 、ウェイトをω oとすれば、比較時の指数I tを求める式は、各品目を示すiを添え字として、数47で与えられる。
しかし、1996年12月に出されたボスキンレポートを待つまでもなく、CPIと実感との乖離が問題となっている。 また、卸売物価指数(以下、「WPI」)との比較においても、CPIは高めの値を示すことが指摘されている。 CPIが実感やWPIより高めになる原因としては、指標を上方に押し上げる品物(以下、「上方バイアス」)の存在が指摘されている。 大きな価格変動を生じた商品においては、代替品の購入や買い控え等により、消費者は自主的な防衛策を講じるからである。 この乖離こそがまさに系統誤差であり、ゆえにCPIの算出においてもブラックボックス法が有効に機能する。 消費者物価指数の計算では、第1測定値として「基準時価格P o 」を、第2測定値として「比較時価格P t 」を用いる。 第1測定値が得られる第1測定系および第2測定値が得られる第2測定系はいずれも一括測定系であり、測定時刻が異なるだけである。 まず、標本を基準時価格−比較時価格空間にプロットし、それらの分布を総括的に表現する変換関数を導入する。 通常は、数48にて示す関数が導入される。
標本の歪みに対する対策を行い、標本の重み付けω Siおよび標本の無作為化のための分布矯正重みω Diが設定される。 ここに、標本の重み付けω Siとしては、総価格(=単価×数量)等が考えられる。 そして、最小2乗法等によって変換関数を決定すれば、変換関数の係数aが消費者物価指数となる。 ブラックボックス法を消費者物価指数の算定に用いる最大の利点は、標本における作為性を除去できることである。 すなわち、従来の方法においては、ウェイトω oの設定の仕方において、こうした消費者の防衛的消費という作為的性を排除できないため、実感と乖離した数値が算出されることとなる。 しかしブラックボックス法によれば、作為性を排除する分布矯正重みω Diの効果により、信頼性が高く、より実感に即したCPI値を算出することができる。 (医療行為等の評価) 人体は、性差・年齢差・個人差等が存在するため、医療行為等に対しては個人により効果が異なる。 こうした状況を測定の問題として捉えると、医療行為に対する効果の差異は、個人という異なる測定系に依拠した系統誤差と位置付けることができる。 ゆえに、投薬やリハビリ等の医療行為の効果を評価する手段として、ブラックボックス法を適用することができる。 投薬の効果の検証を例に、その具体的方法を解説する。 まず、第1測定値x iとして、投薬がない場合の医療データ(例えば、血圧・血糖値等、以下、「基準測定値」)を、第2測定値y iとして、投薬後に一定期間経過した後の医療データ(以下、「比較測定値」)をとる。 これらの組み合わせから成る標本点P i (x i ,y i )の重みとしては、単位体重当りの投薬量等を用いる。 この事例においては、人体は全て異なる測定系であるから、第1測定値x iも第2測定値y iも個別測定値であり、これらの医療データに基づく第1再構成系X Rおよび第2再構成系Y Rはいずれも準標準系となる。 すなわち、基準測定値および比較測定値の処理によって導出される変換関数は、投薬前の準標準系S x 'と投薬後の準標準系S y 'との関係を示す関数であり、それはまさに投薬の効果を示す関数に他ならない。 このように、ブラックボックス法を医療行為等に適用することにより、その効果を正確に、また定量的に把握することができる。 これは、医療関係者および患者の双方にとって大きな福音となるばかりでなく、効率的な医療という観点においても、また新薬の開発という課題に関しても合理的な根拠を提供する手段となる。 また、リハビリやトレーニングの効果の検証等にも広く応用することができる。 (測定値の変換におけるブラックボックス法の応用例のまとめ) 様々な測定値の変換におけるブラックボックス法の応用例を表5にまとめる。
表5のようにブラックボックス法は様々な分野に応用することができ、これらの応用に際しては図19に示す測定値変換システム7の構成をそのまま利用することができる。 すなわち、測定値変換システム7はブラックボックス法を利用する様々な分野での測定値の変換において利用することができる。 以上、本発明を詳細に描写して説明したが、既述の説明は例示的であって限定的なものではない。 したがって、この発明の範囲を逸脱しない限り、多数の変形や態様が可能である。
本発明に係るブラックボックス法は、多変量の複雑な現象を、記号を介さない簡潔な入出力モデルで表現し、処理することにより、処理結果における定量性と妥当性を担保する方法である。 処理結果は測定値における整合性を備えることとなるため、測定値の変換における平等性・公平性を実現する方法論と位置付けることができる。 本発明は、学術的にも意義深い発明であるばかりでなく、様々な産業への利用可能性があり、具体的には、マラソンを含む競争競技、自動車の燃費、選択科目の成績、消費者物価、医療行為などへの応用を例示したが、その他、様々な種類の測定値を様々な目的に応じて変換する技術に利用することができる。 また、このような測定値の変換は、情報提供サービスへと発展させることができる。 すなわち、本発明によって変換される測定値は全て商品としての情報とすることができる。 |