บทที่
14
การจัดระเบียบและการจัดการข้อมูลในฐานข้อมูล
ความหมายของฐานข้อมูล
ฐานข้อมูล
หมายถึงกลุ่มของแฟ้มข้อมูลที่มีความสัมพันธ์กันและถูกนำมารวมกัน เช่น ฐานข้อมูลในบริษัทแห่งหนึ่ง อาจประกอบไปด้วยแฟ้มข้อมูลหลายแฟ้ม
ซึ่งแต่ละแฟ้มต่างก็มีความสัมพันธ์กัน ได้แก่ แฟ้มข้อมูลพนักงาน แฟ้มข้อมูล
แผนกในบริษัทแฟ้มข้อมูลขายสินค้า แฟ้มข้อมูลสินค้า เป็นต้น
ข้อมูลต่างๆที่ถูกจัดเก็บเป็นฐานข้อมูล นอกจากจะต้องเป็นข้อมูลที่มีความสัมพันธ์กันแล้วยังจะต้องเป็นข้อมูลที่ใช้สนับสนุนการดำเนินงานอย่างใดอย่างหนึ่งขององค์กร
ดังนั้น จึงอาจกล่าวได้ว่าแต่ละฐานข้อมูลจะเทียบเท่ากับระบบแฟ้มข้อมูล 1 ระบบ
และจะเรียกฐานข้อมูลที่จัดทำขึ้นเพื่อสนับสนุนการดำเนินงาน อย่างใดอย่างหนึ่งนั้นว่า “ระบบฐานข้อมูล (Database System)" เช่น
ระบบฐานข้อมูลเงินเดือนซึ่งเป็นฐานข้อมูลที่จัดเก็บข้อมูลต่างๆที่สนับสนุนการ คำนวณเงินเดือนหรือระบบฐานข้อมูลประชากรซึ่งเป็นฐานข้อมูลที่จัดเก็บข้อมูลต่างๆ
ที่สนับสนุนการจัดทำสำมะโนประชากร เป็นต้น
Normalization
เป็นทฤษฎีที่ผู้ออกแบบฐานข้อมูลจะต้องนำมาใช้ในการแปลงข้อมูลที่อยู่ในรูปแบบที่ซับซ้อน
ให้อยู่ในรูปแบบที่ง่ายต่อการนำไปใช้งานและก่อให้เกิดปัญหาน้อยที่สุด
วัตถุประสงค์ของ Normalization
Øลดความซ้ำซ้อนของข้อมูลเมื่อลดความซ้ำซ้อนก็ทำให้ลดเนื้อหาที่ใช้
Øลดปัญหาความไม่ถูกต้องของข้อมูลเมื่อข้อมูลไม่เกิดความซ้ำซ้อนทำให้การปรับปรุงข้อมูลสามารถทำได้จากแหล่งข้อมูลเพียงแหล่งเดียว
Øลดความผิดพลาดที่อาจเกิดจากการปรับปรุงข้อมูล(update
anomalies) ซึ่งประกอบด้วยแนวคิดหลักอันสำคัญของการออกแบบฐานข้อมูลเชิงสัมพันธ์
คือการออกแบบให้มีการเก็บข้อมูลซับซ้อนน้อยที่สุด
การทำ normalization จะประกอบด้วยนอร์มัลฟอร์ม (Normal Form) แบบต่างๆที่มีเงื่อนไขของการทำให้อยู่ในรูปของนอร์มัลฟอร์มที่แตกต่างกันไปขึ้นอยู่กับผู้ออกแบบฐานข้อมูลว่าต้องการลดความซ้ำซ้อนในฐานข้อมูลให้อยู่ในระดับใด ซึ่งประกอบด้วยนอร์มัลฟอร์มแบบต่าง ๆ ดังต่อไปนี้
☻
นอร์มัลฟอร์มที่ 1 (First Normal
Form : 1NF)
คุณสมบัติของรีเลชันของแบบจำลองข้อมูลเชิงสัมพันธ์ ก็คือข้อมูลในแต่ละทัปเพิลจะต้องไม่ซ้ำกันและค่าในแต่ละแอตทริบิวต์จะต้องไม่สามารถถูกแบ่งแยกย่อยลงไปได้อีกหรือมีความเป็นอะตอมมิค(Atomic)รวมถึงจะต้องมีค่าเพียงค่าเดียวที่อยู่ในแต่ละแอตทริบิวต์หรือมีความเป็นซิงเกิลแวลู (Single Value)ซึ่งในการทำนอร์มัลไลเซชันให้อยู่ในนอร์มัลฟอร์ที่ 1 ก็อาศัยคุณสมบัติดังที่กล่าวไว้ข้างต้น
☻
นอร์มัลฟอร์มที่ 2 (Second
Normal Form : 2NF)
ในหนึ่งรีเลชันจะประกอบด้วยแอตทริบิวต์ต่างๆ ที่มีความสัมพันธ์ที่ขึ้นต่อกัน
ซึ่งความสัมพันธ์ดังกล่าวจะเป็นตัวกำหนดว่าแอตทริบิวต์ใดเป็นตัวกำหนดข้อมูล หรือคีย์แอตทริบิวต์ (Key Attribute) และแอตทริบิวต์ใดเป็นข้อมูลที่ถูกกำหนดหรือนอนคีย์แอตทริบิวต์
(Nonkey Attribute)
รีเลชันจะอยู่ในรูปของนอร์มัลฟอร์มที่
2 ก็ต่อเมื่อมีคุณสมบัติตามเงื่อนไขดังต่อไปนี้
1. รีเลชันนั้นเป็นนอร์มัลฟอร์มที่ 1 อยู่แล้ว
2. รีเลชันนั้นไม่มีพาร์เชียลดีเพนเดนซี
☻
นอร์มัลฟอร์มที่ 3 (Third Normal
Form : 3NF)
ในหนึ่งรีเลชันจะประกอบคีย์แอตทริบิวต์และนอนคีย์แอตทริบิวต์คีย์แอตทริบิวต์จะต้องเป็นตัวกำหนดความหมายหรือการมีอยู่ของแอตทริบิวต์อื่น ๆ ที่อยู่ในรีเลชันเสมอ
รีเลชันจะอยู่ในรูปของนอร์มัลฟอร์มที่
3 ก็ต่อเมื่อมีคุณสมบัติตามเงื่อนไขดังต่อไปนี้
1. รีเลชันนั้นเป็นนอร์มัลฟอร์มที่ 2
อยู่แล้ว
2. รีเลชันนั้นไม่มีทรานซิทีฟดีเพนเดนซี
ไม่มีความคิดเห็น:
แสดงความคิดเห็น