一般に情報システムではプログラムとデータを分離するためにデータベース管理システム(DataBase Management System: DBMS)を使用することが多くなっています。DBMSを利用するメリットとしては、重複するデータをまとめることができる、すばやくデータにアクセスできるようになる、整合の取れたデータ更新が可能になる、等が挙げられます。ただし、例えば地理情報システムにおける航空写真の画像データなど、必ずしもDBMSの形式にあわせることが最善ではないものもあります。データベース構築とは、データの特質にあわせて利用に最適な形式を決め、その形式でデータを統一的に整備することを言います。提供されたオリジナルのデータが異なる形式である場合は、変換/加工を行うことになります。
例えば、商品の在庫情報は整然と並んだ数値・テキスト群で、これに適した格納方法はリレーショナルデータベース(Relational DataBase Management System: RDBMS)が一般的です。航空写真の画像データは、一定期間更新が発生せず、地理情報システムに対して関心のあるエリアのデータのみを提供する必要があるため、メッシュ状に分割されたファイルとするのが一般的です。
DBMSは利用方法を十分検討した上で格納データの構造を設計することが重要です。データの更新頻度や参照頻度によって最適な構造は異なります。例えば、重複するデータをまとめることを「正規化」と呼びますが、正規化を行うことで整合の取れたデータ更新が可能になる反面、過度に正規化を行うとデータを参照する際の速度が低下してしまうこともあります。
(2015年12月02日 初稿)