これからのデータ分析の基礎はデータベースを理解する事であり。
データベースというのは今日、実際的にはデータテーブルを意味する場合が多い。
厳密に言うと、データー手ブルの集まりで、その意味で、データベースを実際的に理解する為の近道はデータテーブルを理解する事だと言える。
データテーブルの構成や作成する際の規則を理解する事である。
データベースは、データテーブルをどう構成するかにある。
そして、データ手ブルを理化する事は、データの作り方、見方、読み方、癖の見極め方を修得する事だ。
なぜ、要件定義をする必要があるのか。
それは、データ手ブルをどのように構築するかであり。
実務的な経験に基づく。
なぜなら、データテーブルがデータベースの基礎だからである。
例えば、入力規則をテーブル上に持たせないと不規則な入力を防げない。
又、コードに意味を持たせないのは、コードに意味をもたせる、例えば、正社員は一千番台で、嘱託は、二千番台とすると正社員数が千人を越えると、コード体系が壊れてしまう。
データテーブルには、マスターとトランザクションの二種類がある。
基本的にマスターテーブルとトランザクションテーブルの違いは、一定か、不定かにある。
マスターは、時間的な変化がなくて、同じ属性を持つ情報。
トランザクションは、時間的な変化がある情報。属性に囚われない。
マスターテーブルとトランザクションテーブルを見分ける一つのヒントは、入力作業の頻度にある。
入力作業頻度、マスターは、登録時、更新時。
トランザクションは、毎日。
また、手入力する情報と自動的に入力される情報がある。
自動的に入力される情報の多くは、方程式に基づく。
マスターは、基本的に、名簿やリストのようなものを指し。
トランザクションは、筆法のような日々の取引を記録した情報のようなものを指す。
では、マスターは、まったく変化しないかというとそうとは限らない。
例えば、住所録や電話帳、名簿は、典型的なマスターテーブルではあるが、住所は、転居によって変わるし。
電話番号は、一つとは限らず、変化もする。
また、年齢は周期的に変化する。
これらの事を考えてテーブルを設計する。それを一覧表に整理し、まとめる事を要件定義とする。
かつては、大きな一つのテーブルにまとめようめよ湯とした。例えば住所は、上書きしたり、複数の蘭を儲けたり。
ただ、上書きすると履歴がとれなくなり、蘭を儲けても情報量に限界がある。
それで、新しくレコードを追加する事で処理するのが今の考え方。
年齢は、毎年更新するのではなく生年月日から求めるようにするのが現在の考え方。