USCPA試験で知っておく Database

Database 、データベース。Data を管理する Software 。

大量の Data を保管し、検索・更新されやすいように Organize できる。


会社の複数部門で別々の Application を使用していても、Data は一括して Database で保存でき、
 Application の用途に従いただちに Retrieve される。

Database がない環境では、Application が個別に Data を保存することになり、Data の Redundancy(冗長性)が発生する。


たとえば、「AKAHIGE」という顧客名が、Application によっては、「akahige」や「あかひげ」などと別々の表記で保存されており、検索や更新に手間がかかってしまう。

POINT

・Data mining の Critical success factor は Pattern recognition

Benefit

Database の利点、目的。

  • Data Reduncancy(データ冗長化) を最小化
  • Data accessibility の Increase

Database hierarchy

Computer は、Data を以下のような Hierarchy(階層)にて組織している。

  • Database
  • File
  • Record
  • Field
  • Byte
  • Bit

Database structure

Database における データ構造。いくつかの種類が存在する。

  • Tree structure
  • Network structure
  • Relational structure

Relational structure は、関連性のあるデータの集合体。エクセルのように Table(表)で構成されている。

ほとんどの Database は、この Relational structure による Relational database(関係データベース) となっている。

Relational database では、Data が Table(表)に格納されている。Table は、Record(行)Column(列)Field(セル)で構成されれいる

複数の Tables を Combine することを、Joining という。
Database structure を含む Structure file(Collection of data)  はデータベース作成時に作られる。

Key

Relational database では、Data は Excel のように Table(表)で管理されており、Column(列)に項目が付されている。そこに Record(行)が Input されていく。

Key は、その Record(行) を識別する重要な項目をさす。

Primary key

主キー。ある Table の Record を識別するための主となるキー。ひとつだけであり、必ず必要となる Key。

A primary key is the main means to locate records within the file.

たとえば社員簿の Database ならば、社員番号が Primary key に使われやすい。

Secondary key

Alternative key。Primary key の代わりとなる Key。複数あり。

A secondary key may be used to locate a record when the primary key is unknown.

Foreign key

外部キー。他の Table と関連づけるキー。

Language

Database で使用する Language

  • Data definition language (DDL)
  • Data control language (DCL)
  • Data manipulation language (DML)
  • Database query language (DQL)

Data definition language (DDL)

Data の構造を Definition する。Tables の Establish などで Database administrator が使用する。ほかにも Table の Creating、Altering、Deleting などで使用する。

DDL で Define する Data elements

  • Names
  • Characteristics
  • Relationship

Data control language (DCL)

Data への Access を Control する言語。

Data manipulation language (DML)

Data を操作する言語。Data の検索、更新、削除などができる。Query でも使用する。

Database query language (DQL)

Query で使用する。

Data dictionary

Data の Definition を管理するツール。Field の Name や Size などを設定する。

Command

Database で行う指示。

Query

データベースからTable や Data を抽出する指示。抽出条件を指定する。抽出するだけなので変更はできない。

Query by Example (QBE)は照会言語。インターネットでの検索など。かんたん。

Manipulation

データ操作。

Schema

Database の全般的な仕様、ルールが記述されたもの。Subschema はその一部分が記述されたもの。

Internal control

Users の Database への Access control を整備する必要がある。

Computer ベースの Database environment は、紙ベースと違って、User のアクセス権を管理して情報漏えい防止に努めなければならない。

Unauthorized alteration of online records can be prevented by employing database access controls.

Database administrator

Database の Design や Mainteinance の責任者。
Database の Access control を行う。User の Logical view への Access を Restrict。

Database management system

データベースマネージメントシステム、DBMS。Database の Create、Renew、Modify、Delete などの管理や操作をする Software。MySQLやOracleなどが有名。

Primary function of a database management system is capability to create and modify the database.

Relational database の DBMS は、RDBMS。ほとんどの Database が Relational database なので、ほとんどの DBMS は RDBMS であるといえる。

DBMSは、Data 更新の整合性がとれる Exclusive control(排他処理)をもつ。

  • DBMS maintain data and programs separately except during processing.
  • DBMS include a set of data definitions that help describe the logical structure of the database.

Structured Query Language (SQL)

Relational database management database を管理、操作する最も代表的な Database language である。

MySQLでも Oracle でも Access でも使用できる。

Data validation

データの有効性。Data field への入力ミスを減らし Data の Validation を保つためのツール。

Input mask

指定した入力の Format でないと受け付けない。日付や電話番号など。

Default value

Data の Default を設定しておく。

Validation rule

範囲や計算式などで有効となるルールを定める。

Distribution

  • Snapshot
  • Replication
  • Fragmentation

Snapshot

Database のある時点での Data をCopy する。ある時点の Copy なので、元の Data と同期はしていない。Data が壊れたときの復旧に使える。

Replication

Database の Data とまったく同じ Replication を作る。

Replication は元の Data と同期をし、同じ System 内で同時に動作できるので、止まると困難を引き起こすシステムでの障害対策や負荷分散になる。

Fragmentation

断片化。Data を分割して保存し領域を活用する。

更新により Fragmentation がたくさん行われると、格納状態が悪くなり Databese の応答性能が落ちる。

Generetor

データやプログラムを生成する。

  • Report generetor
  • Program generetor
  • Application generetor

Report generetor

データベース内の Information を使って Report を作成する。

Ad hoc report、アドホックレポート。定型なレポートではなく、特別な状況時に発行するレポート。

Data mining

Database で大量の Data を Analysis するツール。前もって Knowledge がなくても、Trends や Rules を見つけ出すことができる。

Data mining is analysis of data in a database using tools which look for trends or anomalies without knowledge in advance of the meaning of the data.

Data mining の Critical success factor は Pattern recognition(パターン認識)。Data relationships の Confirmation と Exploration を行うことができる。

Distributed database

分散型の Data base。DBMSが複数のCPUにつながっている。Network により Location が異なる場合もある。