データベースというのは、データ、情報の集合、塊。
データベースとは、データを収めた器。格納庫のような場所。
情報を一定の基準、尺度によって収納した表を言う。
データベースは、体系立っていなければならない。
体系には系統がなければならない。
体系は、行列として納められる。
データベースば、行と列から構成される。
行は複数の項目から構成される。列は、一つの項目と複数の情報から構成される。
個々の項目は、任意の共通した要素を持つ情報から成り立つ。
データベースは、集合である。
データベースは、一般に、いくつかの項目とデータから構成される単位の集まりである。
その様な、単位をどのように連結し、どのように管理するかよって、第一に階層型、第二に、ネットワーク型、第三に、リレーショナル型、第四に、NOSQL型の四種類がある。
リレーショナルが今日主流となているか、リレーショナル型を例にデータベースについて語りたい。
先ず、データベースというのは、立体的だと言う事。
立体的というのは、多次元だと言う事である。
データベースは、「フィールド」、「レコード」、「カラム」、「テーブル」から構成される。
「フィールド」とは。情報を収納する場所、箱や部屋みたいなところを想像してもらえばいい。
「フィールド」には、必ず情報が入っているとは限らない。
空白な「フィールド」もある。
0の入っている「フィールド」と空白の「フィールド」とは別である。
「レコード」は。知識としての最小単位である。知識を構成する一連の情報である。
例えば、「住所」、「氏名」、「電話番号」と言った個々の情報を納めるところが「フィールド」で「住所」、「氏名」、「電話番号」と言った特定の個人を表す一連の情報の集合を「レコード」で、住所とか特定の項目だけを集めた集合を「カラム」とする。
そして、「レコード」を集積したものが、「テーブル」。
「テーブル」は、視点を変えると「カラム」を結び合わせたものであり。また、「フィールド」の集合ともいえる。
そして、「カラム」は、「レコード」を構成する要素の共通項を意味している。
一つひとつの情報は、項目と働きからなる。
項目と働きが組み合わさって一つの「フィールド」を構成する。
例えば、「商品と売上金額」、「商品と売上個数」、「商品と品名」、「商品と売上日」などである。
任意の「カラム」を他の「カラム」をどのような要素によって結びつけるかが鍵。
「レコード」も「カラム」一定の規則で並んでいる複数の「フィールド」によって構成されている。
その「カラム」は他の「カラム」との相関関係によって定まる。
各々の「カラム」を構成する要素は。一対一の関係にある。
一番典型的な例は、時系列である。
一対一と言っても、「空白」や、「NULL」、「欠損」も含まれる。
それらも含めて一対一の関係にある。
幾つかの「カラム」を寄り集まってテーブルを形成する。
または、いくつかの「レコード」が集積されて「テーブル」は、構成される。
「カラム」と「レコード」は。相関関係にある。
「テーブル」は「カラム」と「レコード」の組み合わせとみる事もできる。
「テーブル」には、固有の働きと特性がある。
「テーブル」に収納されているデータの性格によって「テーブル」の性格や働きが定まる。
「フィールド」に収められるデータにはいくつかの型がある。
その型をデータ型とする。
データ型には、定量的データと定性的データがある。
定量的データは、基本的に数値情報である。
定性的データは、以前は、文字や記号に限られていたが、今日は、音声、画像、映像、動画なども含まれるようになってきた。
定量的なデータは基本的に数列である。
数値情報には、固定値と変動値があり。
固定値を納めた「テーブル」を一般に「マスターテーブル」とし、変数を納めた「テーブル」を「トランザクションテーブル」と呼ぶ。
ただし、この区分は確定的なものではない。
なぜなら、固定値か、変動値かは相対的だからである。
データベースは、いくつかの「テーブル」が組み合わされることで形成される。
このテーブルの組み合わせ方の違いによって階層型、ネットワーク型、リレーショナル型、NOSQLの違いが生じる。
この様なデータベースの構成は、「テーブル」の構成の前提を制約する。
つまり、「テーブル」の構成は、横に「レコード」、縦に「カラム」のクロス表形式、行列になる。
データの項目の集まりを表しているのが見出しである。
一般に、「テーブル」には以下の三つの原則がある。
見出しが一行。
一行一データ。
一列同一種類データ。
テーブルの形は、「テーブル」の機能によって決まる。
そして、「テーブル」は「テーブル」間の共通項によって連結(リレーション)される。
「テーブル」の結び方が鍵なのである。
数値情報において一般に「カラム」は基準軸を構成する。
「カラム」の数は次元を表す。
要素の並び方が重要な意味を持つ。
「カラム」のこのような性格は、「テーブル」の構造に決定的な影響を及ぼしている。
カラムの構成する要素の並び方が重要な働きをもう。
データベースはデータの格納庫である。
格納庫だから、データを素早く選別、抽出、並び替え、整理などが求められる。
故に、データベースの活用には並び替え、検索、演算がある。