วันพุธที่ 16 ธันวาคม พ.ศ. 2558

บทที่4 เรื่อง การพัฒนาฐานข้อมูล


แนวคิดข้อมูลพื้นฐาน ( Foundation Data Concepts)
แนวคิดพื้นฐานว่าข้อมูลถูกจัดระเบียนในระบบสารสนเทศได้อย่างไร ระดับของข้อมูลมีความแตกต่างกันระหว่างกลุ่มหรือส่วนย่อยของข้อมูล ดังนั้นข้อมูลอาจถูกจัดระเบียบเชิงตรรกะในรูปตัวอักขระ เขตข้อมูล ระเบียน แฟ้ม และฐานข้อมูล แบบเดียวกับการเขียนที่สามารถจัดระเบียบเป็นตัวอักษร คำ ประโยค และย่อหน้า
- ตัวอักขระ (Character) ส่วนย่อยของข้อมูลเชิงตรรกะขั้นต้น ซึ่งประกอบด้วยตัวอักษร ตัวเลข หรือสัญลักษณ์ 1 ตัว อาจมีข้อโต้แย้งว่า Bit หรือ Byte น่าจะเป็นส่วนย่อยของข้อมูลขั้นต้นมากกว่า แต่ในนิยามนี้อ้างถึงส่วนย่อยของการจัดเก็บทางด้านกายภาพ (Physical Storage)
- เขตข้อมูล (Field) ระดับถัดไปเป็นเขตข้อมูลหรือหน่วยข้อมูล (Data Item) เขตข้อมูลประกอบด้วยกลุ่มของอักขระ เช่น กลุ่มของตัวอักขระที่เป็นตัวอักษรของชื่อบุคคลอยู่ในรูปแบบของเขตข้อมูลชื่อ และกลุ่มของตัวเลขยอดขายอยู่ในรูปแบบของเขตข้อมูลยอดขาย เป็นต้น
- ระเบียน (Record) เขตข้อมูลที่สัมพันธ์กันถูกจัดเป็นกลุ่มในรูปแบบระเบียน แสดงการรวบรวมคุณสมบัติที่ใช้อธิบายเอนทิตี (Entity) เช่น ระเบียนเงินเดือน ซึ่งประกอบด้วยเขตข้อมูลที่อธิบายถึงคุณสมบัติเช่น ชื่อคน หมายเลขประกันสังคม และอัตราค่าจ้าง ระเบียนที่มีความยาวคงที่ (Fixed-length) จะบรรจุเขตข้อมูลจำนวนคงที่และมีความยาวเป็นตัวเลขที่คงที่ ส่วนระเบียนที่มีความยาวไม่คงที่ (Variable-length) จะบรรจุเขตข้อมูลที่มีจำนวนและความยาวที่ไม่คงที่
- แฟ้ม (File) กลุ่มของระเบียนที่สัมพันธ์กัน เรียกว่า แฟ้ม (File) หรือตาราง (Table) เช่น แฟ้มพนักงานจะประกอบด้วยระเบียนพนักงาน แฟ้มอาจจำแนกได้ตามความถี่ของการใช้งาน เช่น แฟ้มเงินเดือน (Payroll File) หรือแฟ้มสินค้าคงคลัง (Inventory File) หรือตามประเภทของเอกสารที่เก็บ เช่น แฟ้มเอกสาร (Document File) หรือแฟ้มภาพกราฟิก (Graphical Image File) หรือตามระยะเวลาที่เก็บ เช่น แฟ้มหลัก (Master File) กับแฟ้มรายการเปลี่ยนแปลง (Transaction File) แฟ้มรายการเปลี่ยนแปลงประกอบด้วยระเบียนของรายการเปลี่ยนแปลงที่เกิดขึ้นระหว่างงวดและอาจนำมาใช้เป็นระยะๆ เพื่อการปรับปรุงระเบียนในแฟ้มหลัก แฟ้มประวัติรายการเปลี่ยนแปลงที่ล้าสมัย (History File) หรือแฟ้มหลักที่ยังคงเก็บไว้เพื่อสำรองหรือสำหรับการเก็บประวัติในระยะยาว จะเรียกว่า หน่วยเก็บจดหมายเหตุ (Archival Storage)
- ฐานข้อมูล (Database) เป็นการรวบรวมแบบบูรณาการของระเบียนหรือออบเจ็กต์ (Objects) ในเชิงตรรกะที่สัมพันธ์กัน อันประกอบด้วยข้อมูลที่ใช้อธิบายถึงเอนทิตี รวมถึงการปฏิบัติงานกับข้อมูลนั้น
ฐานข้อมูลเป็นที่รวบรวมระเบียนที่เก็บในรูปแฟ้ม ให้เป็นระเบียนส่วนกลาง เพื่อเป็นข้อมูลสำหรับการใช้งาน ข้อมูลที่เก็บในฐานข้อมูลจะเป็นอิสระไม่ขึ้นกับโปรแกรมประยุกต์ที่ใช้งาน และเป็นอิสระจากอุปกรณ์ที่จัดเก็บ




รูปที่ 7.2 ตัวอย่างของส่วนย่อยของข้อมูลเชิงตรรกะในระบบสารสนเทศ หมายเหตุ ตัวอย่างของความเกี่ยวพันระหว่างเขตข้อมูล ระเบียน ข้อมูล แฟ้ม และฐานข้อมูล

แนวคิดเชิงการจัดการฐานข้อมูล
การพัฒนาฐานข้อมูล และซอฟต์แวร์จัดการฐานข้อมูล เป็นวิธีการพื้นฐานสมัยใหม่ของการจัดระเบียบ ข้อมูล แนวคิดเชิงการจัดการฐานข้อมูล (Data Management Approach) นั้นรวบรวมระเบียนและออบเจ็กต์ให้เป็นฐานข้อมูลที่สามารถเข้าถึงได้โดยโปรแกรมประยุกต์ (Application Programs) นอกจากนี้ซอฟต์แวร์สำเร็จรูปสำคัญที่เรียกว่า ระบบจัดการฐานข้อมูล (Database Management System : DBMS) ทำหน้าที่เป็นส่วนติดต่อระหว่างผู้ใช้กับฐานข้อมูล ที่ช่วยผู้ใช้ให้เข้าถึงระเบียนในฐานข้อมูลได้อย่างง่ายดาย ดังนั้นการจัดการฐานข้อมูลจึงเกี่ยวข้องกับการใช้ซอฟต์แวร์จัดการฐานข้อมูลเพื่อควบคุมวิธีการสร้างฐานข้อมูล การค้นหา และการบำรุงรักษา เพื่อให้ได้สารสนเทศที่ต้องการสำหรับผู้ใช้และองค์กร
ดังนั้น แนวคิดการจัดการฐานข้อมูลเกี่ยวข้องกับ 3 กิจกรรมเบื้องต้น คือ
           การปรับปรุงและบำรุงรักษาฐานข้อมูล เป็นผลมาจากรายการเปลี่ยนแปลงที่เกิดใหม่และเหตุการณ์อื่นๆ ที่จำเป็นสำหรับการเปลี่ยนแปลงระเบียนข้อมูล
           การเตรียมสารสนเทศที่จำเป็นสำหรับการใช้งาน โดยการแบ่งปันข้อมูล (Sharing of Data) ในฐานข้อมูลเดียวกัน โดยได้รับการสนับสนุนจากส่วนต่อประสานของโปรแกรมสำเร็จรูประบบจัดการฐานข้อมูล ดังนั้น ผู้ใช้และโปรแกรมเมอร์จึงไม่จำเป็นต้องทราบว่าข้อมูลมีการจัดเก็บทางกายภาพอยู่ที่ใดและด้วยวิธีการอย่างไร
           การเตรียมความสามารถในการโต้ตอบ ค้นหา และจัดทำรายงาน โดยโปรแกรมระบบจัดการฐานข้อมูลสำเร็จรูป ดังนั้น ผู้ใช้สามารถค้นหาฐานข้อมูล สร้างรายงาน และรับการตอบกลับจากคำร้องขอสารสนเทศตามความต้องการเฉพาะ ได้อย่างรวดเร็ว และโดยง่าย


  

รูปที่ 7.4 ตัวอย่างการจัดการฐานข้อมูลในระบบสารสนเทศธนาคาร หมายเหตุ โปรแกรมบัญชีออมทรัพย์ บัญชีเดินสะพัด และเงินกู้ ใช้ระบบการจัดการฐานข้อมูลเพื่อให้ใช้ฐานข้อมูลลูกค้าร่วมกัน นอกจากนี้ระบบจัดการฐานข้อมูลยังอนุญาตให้ผู้ใช้ค้นหาสิ่งที่ต้องการเฉพาะกับฐานข้อมูลได้โดยตรง

การใช้ซอฟต์แวร์จัดการฐานข้อมูล ( Using Database Management Software)
ซอฟต์แวร์จัดการฐานข้อมูล เป็นกลุ่มของโปรแกรมคอมพิวเตอร์ที่มีความสามารถใน การควบคุม การสร้าง การบำรุงรักษา และการใช้ฐานข้อมูลขององค์กรและของผู้ใช้ ทั้งในระดับไมโครคอมพิวเตอร์ คอมพิวเตอร์ระดับกลาง และเมนเฟรม การใช้ระบบจัดการฐานข้อมูลมี 4 แบบหลักๆ ดังรูปที่ 7.5 ซึ่งมีรายละเอียดดังนี้
1) การพัฒนาฐานข้อมูล (Database Development)โปรแกรมสำเร็จรูปจัดการฐานข้อมูล เช่น Microsoft Access หรือ Lotus Approach อนุญาตให้ผู้ใช้พัฒนาฐานข้อมูลตามที่ต้องการได้โดยง่าย อย่างไรก็ตามระบบผู้รับบริการและผู้ให้บริการ (Client-Server) ขององค์กรใหญ่ๆ หรือระบบเมนเฟรมปกติแล้วจะมอบการควบคุมการพัฒนาฐานข้อมูลขององค์กรให้อยู่ในมือของผู้บริหารระบบ (Database Administrators : DBAs) หรือผู้เชี่ยวชาญฐานข้อมูล (Database Specialists) การทำเช่นนี้เป็นการปรับปรุงความถูกต้องและความปลอดภัยในฐานข้อมูลขององค์กร การพัฒนาฐานข้อมูลใช้ภาษานิยามข้อมูล (Data Definition Language : DDL) สำหรับระบบจัดการฐานข้อมูล เช่น Oracle8 หรือ DB2 ของ IBM เพื่อพัฒนาและกำหนดเนื้อหาของข้อมูล ความสัมพันธ์ โครงสร้างของแต่ละฐานข้อมูล และปรับเปลี่ยนคุณลักษณะเฉพาะของฐานข้อมูลเมื่อจำเป็น สารสนเทศเหล่านั้นถูกจัดทำสารบัญแฟ้ม (Catalog) และเก็บลงในฐานข้อมูลของนิยามข้อมูลและคุณลักษณะเฉพาะที่เรียกว่า พจนานุกรมข้อมูล (Data Dictionary)
พจนานุกรมข้อมูล เป็นอีกเครื่องมือหนึ่งของการบริหารฐานข้อมูล พจนานุกรมข้อมูลเป็นสารบัญแฟ้มเชิงคอมพิวเตอร์หรือที่บรรจุ เมตาเดตา (Metadata) ซึ่งถือเป็นข้อมูลของข้อมูล (Data about Data) รวมทั้งส่วนประกอบซอฟต์แวร์เพื่อจัดการฐานข้อมูลของนิยามข้อมูล   
  2 ) การสืบค้นฐานข้อมูล ( Data Interrogation)
ความสามารถในการสืบค้นฐานข้อมูลเป็นผลประโยชน์หลักของระบบจัดการฐานข้อมูล ผู้ใช้สามารถใช้ระบบจัดการฐานข้อมูลสำหรับการขอสารสนเทศจากฐานข้อมูล โดยการใช้ภาษาสอบถาม (Query Language) หรือตัวสร้างรายงาน (Report Generator) ซึ่งทำให้สามารถรับคำตอบทันทีในรูปแบบของการแสดงทางจอภาพหรือรายงาน SQL และ QBE SQL หรือภาษาสอบถามเชิงโครงสร้าง (Structured Query Language) เป็นภาษาสอบถามที่พบในหลายโปรแกรมสำเร็จรูปจัดการฐานข้อมูล รูปแบบพื้นฐานของการสอบถามของ SQL คือ SELECT………..FROM………..WHERE……….. ภาษาสอบถามอื่นในโปรแกรมสำเร็จรูปจัดการฐานข้อมูล คือ QBE (Query by Example) หรือการสอบถามจากตัวอย่าง ความสามารถของ QBE ในเรื่องการชี้และคลิกทำให้ผู้ใช้ใช้งาน QBE ได้ง่ายกว่า SQL
     คำถามภาพและธรรมชาติ (Graphical and Natural Queries) ผู้ใช้ ( และผู้เชี่ยวชาญสารสนเทศ) หลายรายลำบากที่จะแก้ไขวลีของ SQL และคำถามภาษาฐานข้อมูลอื่นๆ ดังนั้นโปรแกรมสำเร็จรูปฐานข้อมูลส่วนใหญ่จึงเสนอวิธีการชี้และคลิกส่วนต่อประสานกราฟิกกับผู้ใช้ (Graphical User Interface : GUI) ซึ่งง่ายต่อการใช้และใช้ซอฟต์แวร์แปลให้เป็นคำสั่ง SQL หรือโปรแกรมสำเร็จรูปอื่นที่อาจใช้ภาษาธรรมชาติ (Natural Language) ที่คล้ายกับการสนทนาภาษาอังกฤษหรือภาษาอื่นๆ




รูปที่ 7.5 การใช้โปรแกรมสำเร็จรูปจัดการฐานข้อมูล 4 ประเภทหลัก คือ การพัฒนาฐานข้อมูล การสืบค้นฐานข้อมูล การบำรุงรักษาฐานข้อมูล และการพัฒนาระบบงาน

3) การบำรุงรักษาฐานข้อมูล ( Database Maintenance)
ฐานข้อมูลขององค์กรต้องการการปรับปรุงให้ทันสมัยอย่างต่อเนื่อง ซึ่งมีผลมาจากรายการเปลี่ยนแปลงใหม่หรือเหตุการณ์อื่นๆและการเปลี่ยนแปลงเบ็ดเตล็ดอื่นๆ ทั้งนี้ต้องทำให้แน่ใจในความถูกต้องของข้อมูลในฐานข้อมูล กระบวนการบำรุงรักษาฐานข้อมูลนี้ทำได้โดยโปรแกรมประมวลผลรายการเปลี่ยนแปลงและโปรแกรมสำเร็จรูปของผู้ใช้อื่นๆ ที่สนับสนุนระบบจัดการฐานข้อมูล
4) การพัฒนาโปรแกรมประยุกต์ ( Application Development)
โปรแกรมสำเร็จรูประบบจัดการฐานข้อมูลมีบทบาทหลักในการพัฒนาโปรแกรมประยุกต์ การพัฒนาโปรแกรมประยุกต์สามารถใช้ภาษาโปรแกรมยุคที่สี่ (4GL Programming Language) และสร้างเครื่องมือพัฒนาซอฟต์แวร์จากโปรแกรมสำเร็จรูประบบจัดการฐานข้อมูล เช่น การใช้ระบบจัดการฐานข้อมูลเพื่อสร้างหน้าจอภาพสำหรับป้อนข้อมูล แบบฟอร์ม รายงาน หรือหน้าเว็บ (Web Page) ของโปรแกรมธุรกิจได้โดยง่าย ระบบจัดการฐานข้อมูลทำให้งานของโปรแกรมเมอร์ง่ายขึ้น เพราะไม่จำเป็นต้องพัฒนากระบวนคำสั่งเพื่อจัดการรายละเอียดข้อมูลด้วยภาษาโปรแกรมตามแบบเดิมทุกครั้งที่เขียนโปรแกรม โดยสามารถใช้ภาษาจัดดำเนินการข้อมูล (Data Manipulation Language : DML) เพื่อให้ระบบจัดการฐานข้อมูลทำงานที่จำเป็นในส่วนนี้แทน

ประเภทของฐานข้อมูล ( Types of Databases)
การพัฒนาในเรื่องของเทคโนโลยีสารสนเทศและโปรแกรมประยุกต์ทางธุรกิจมีผลให้เกิดฐานข้อมูลหลายประเภท รูปที่ 7. 11 แสดง 6 ประเภทหลักเชิงความคิดของฐานข้อมูลที่พบในองค์กรธุรกิจ
           ฐานข้อมูลเชิงปฏิบัติการ (Operational Database) เก็บรายละเอียดของข้อมูลที่ต้องการเพื่อสนับสนุนการดำเนินกิจการของทั้งองค์กร อาจเรียกว่า ฐานข้อมูลซับเจ็กแอเรีย (Subject Area Database : SADB) ฐานข้อมูลรายการเปลี่ยนแปลง (Transaction Databases) หรือฐานข้อมูลผลผลิต (Production database) เช่น ฐานข้อมูลลูกค้า ฐานข้อมูลบุคคล ฐานข้อมูลสินค้าคงคลัง และฐานข้อมูลอื่นๆที่บรรจุข้อมูลที่เกิดจากการดำเนินธุรกิจ
ฐานข้อมูลเชิงวิเคราะห์ (Analytical Database) เก็บข้อมูลและสารสนเทศที่ดึงมาจากฐานข้อมูลเชิงปฏิบัติการและฐานข้อมูลภายนอก ประกอบด้วยข้อมูลสรุปและสารสนเทศที่จำเป็นต่อผู้จัดการองค์กรและผู้ใช้ อาจเรียกว่า ฐานข้อมูลเชิงจัดการ (Management Database) ฐานข้อมูลสารสนเทศ (Information Database) หรือฐานข้อมูลหลายมิติ (Multidimensional Database) ซึ่งเป็นฐานข้อมูลที่เข้าถึงโดยระบบประมวลผลเชิงวิเคราะห์แบบต่อตรง (Online Analytical Processing : OLAP)




รูปที่ 7.11 ตัวอย่างประเภทหลักๆ ของฐานข้อมูลที่ใช้โดยองค์กรและผู้ใช้ โดยใช้ฐานข้อมูลแบบกระจายบนอินทราเน็ต ผ่านเครือข่ายเพื่อเข้าถึงฐานข้อมูลผู้ใช้ คลังข้อมูล ฐานข้อมูลภายนอกบนอินทราเน็ตและบริการต่อตรงหรือออนไลน์ ฐานข้อมูลเชิงปฏิบัติการขององค์กร และฐานข้อมูลเชิงวิเคราะห์ของข้อมูลองค์กรที่วิกฤต

           คลังข้อมูล (Data Warehouses) เก็บข้อมูลปัจจุบันและปีก่อนๆ โดยดึงจากฐานข้อมูลเชิงปฏิบัติการต่างๆ ขององค์กร เป็นแหล่งข้อมูลส่วนกลางที่ได้ถูกคัดเลือก แก้ไข จัดมาตรฐาน และรวบรวมเพื่อใช้สำหรับการวิเคราะห์ธุรกิจ การวิจัยตลาด และสนับสนุนการตัดสินใจ คลังข้อมูลอาจแบ่งออกเป็นตลาดข้อมูล (Data Mart) ซึ่งเก็บส่วนย่อยของข้อมูลเฉพาะอย่างจากคลัง การใช้ฐานข้อมูลคลังข้อมูลหลักคือการทำเหมืองข้อมูล (Data mining) ซึ่งข้อมูลในคลังข้อมูลจะถูกประมวลผลเพื่อกำหนดปัจจัยหลักและแนวโน้มจากอดีตของกิจกรรมทางธุรกิจ
           ฐานข้อมูลแบบกระจาย (Distributed Databases) หลายๆ องค์กรทำซ้ำ (Replicate) และกระจายสำเนา (Copies) หรือบางส่วนของฐานข้อมูลไปยังแม่ข่ายเครือข่ายหลายๆ สถานที่ ฐานข้อมูลแบบกระจายนี้สามารถติดตั้งอยู่บนเครื่องแม่ข่ายเครือข่าย World Wide Web บนอินทราเน็ตขององค์กร หรือเอ็กซ์ทราเน็ต ฐานข้อมูลแบบกระจายอาจจะสำเนาจากฐานข้อมูลเชิงปฏิบัติการหรือฐานข้อมูลเชิงวิเคราะห์ ฐานข้อมูลสื่อหลายมิติ หรือฐานข้อมูลประเภทอื่นๆ เพื่อปรับปรุงการทำงานของฐานข้อมูลและเพื่อความปลอดภัย ทั้งนี้ต้องแน่ใจว่าข้อมูลทั้งหมดในฐานข้อมูลแบบกระจายขององค์กรได้รับการปรับปรุงตรงกัน (Consistently) และให้ทันสมัยพร้อมกัน (Concurrently Updated)
           ฐานข้อมูลผู้ใช้ (End User Databases) ประกอบด้วยแฟ้มข้อมูลต่างๆ ที่พัฒนาโดยผู้ใช้ที่สถานีปลายทาง เช่น ผู้ใช้อาจจะมีเอกสารอิเล็กทรอนิกส์หลายๆ สำเนาที่ได้ดาวน์โหลดจาก World Wide Web จากโปรแกรมสำเร็จรูปประมวลผลคำ หรือรับจากไปรษณีย์อิเล็กทรอนิกส์ หรืออาจจะเป็นแฟ้มข้อมูลที่เกิดจากการใช้แผ่นตารางทำการ (Spreadsheet) และโปรแกรมประยุกต์ระบบจัดการฐานข้อมูล

ไม่มีความคิดเห็น:

แสดงความคิดเห็น