บทที่ 14
การจัดระเบียบและการจัดการข้อมูลในฐานข้อมูล
การจัดการฐานข้อมูล
ในการทำงานด้วยคอมพิวเตอร์
ถึงแม้จะมีเครื่องคอมพิวเตอร์ที่มีประสิทธิภาพดีแล้วยังต้องมีชุดคำสั่ง (Software) ที่จะควบคุมการทำงานของเครื่องอีกด้วย
การทำงานโดยวิธีการจัดแฟ้มซึ่งเรียกวิธีนี้ว่า ระบบการจัดการกระทำแฟ้มข้อมูล (file
handing system) อาจใช้โปรแกรมสำเร็จซึ่งทำหน้าที่ในการเก็บรวบรวมข้อมูลให้เป็นแฟ้มที่มีระเบียบง่ายต่อการใช้งาน
และช่วยทำให้ผู้ใช้ประมวลผลข้อมูลต่างๆ ตามความต้องการได้อย่างรวดเร็ว
โปรแกรมเหล่านี้จะใช้ระบบการจัดการฐานข้อมูล หรือที่เรียกว่า ดีบีเอ็มเอส (Data
Base Management System : DBMS ระบบฐานข้อมูลเป็นสิ่งที่จำเป็นและเกี่ยวข้องกับการใช้งานประจำวัน
การตัดสินใจของผู้บริหารจะกระทำได้รวดเร็ว ถ้ามีข้อมูลที่ถูกต้องและเพียงพอ จึงมีการใช้คอมพิวเตอร์ช่วยประมวลผลเพื่อให้ได้สารสนเทศดังกล่าว
แต่การประมวลผลด้วยคอมพิวเตอร์จำเป็นต้องมีหลักการและวิธีการที่ทำให้ระบบมีระเบียบแบบแผนที่ดี
ลักษณะการจัดการฐานข้อมูลที่ดี
เทคโนโลยีด้านคอมพิวเตอร์ได้เปลี่ยนแปลงไปตามกาลเวลา
วิธีการฐานข้อมูลได้พัฒนาให้ก้าวหน้าขึ้นจากการออกแบบและเก็บข้อมูลในฐานข้อมูลที่เดียว
การจัดการฐานข้อมูลจึงมีหลักการที่สำคัญ คือ
1. ลดความซ้ำซ้อนของข้อมูล
2. กำหนดมาตรฐานข้อมูล
3. มีระบบป้องกันความปลอดภัยของข้อมูล
4. มีความเป็นอิสระจากโปรแกรม
5. รวมข้อมูลเป็นฐานข้อมูลกลาง
โปรแกรมจัดการข้อมูล (Data Management Software)
โปรแกรมจัดการข้อมูล คือ
โปรแกรมสำหรับการสร้าง จัดการ และรวบรวมข้อมูลจากไฟล์ต่างๆ
โดยมีเครื่องมืออำนวยความสะดวกในการสร้างระบบสารสนเทศต่างๆ ได้
เพื่อให้ข้อมูลถูกจัดเก็บในรูปแฟ้มข้อมูลปัจจุบัน ความต้องการใช้ข้อมูลเพิ่มขึ้นอย่างรวดเร็ว
และเพื่อให้ได้ข้อมูลที่ทันต่อสถานการณ์ปัจจุบันมากที่สุด
จึงทำให้มีการนำฐานข้อมูลมาประยุกต์ใช้ในส่วนงานต่างๆ เพิ่มมากขึ้น
องค์ประกอบของระบบฐานข้อมูล
องค์ประกอบของระบบฐานข้อมูล
ระบบฐานข้อมูลส่วนใหญ่เป็นระบบที่มีการนำคอมพิวเตอร์เข้ามาช่วยในการจัดเก็บข้อมูลโดยมีซอฟแวร์หรือโปรแกรมช่วยในการจัดการข้อมูลเหล่านี้เพื่อให้ได้ข้อมูลตามผู้ใช้ต้องการองค์ประกอบของระบบฐานข้อมูล
แบ่งออกเป็น 5 ประเภท คือ
1. ฮาร์ดแวร์ (Hardware)
ในระบบฐานข้อมูลที่มีประสิทธิภาพควรมีฮาร์ดแวร์ต่างๆ
ที่พร้อมจะอำนวยความสะดวกในการบริหารระบบงานฐานข้อมูลได้อย่างมีประสิทธิภาพไม่ว่าจะเป็นขนาดของหน่วยความจำความเร็วของหน่วยประมวลผลกลาง
อุปกรณ์นำเข้าและออกรายงานรวมถึงหน่วยความจำสำรองที่รองรับการประมวลผลข้อมูลในระบบได้อย่างมีประสิทธิภาพ
2. โปรแกรม (Program)
ในการประมวลผลฐานข้อมูลอาจจะใช้โปรแกรมที่แตกต่างกันทั้งนี้ขึ้นอยู่กับระบบคอมพิวเตอร์ที่ใช้ว่าเป็นแบบใด
โปรแกรมที่ทำหน้าที่การสร้างการเรียกใช้ข้อมูลการจัดทำรายงานการปรับเปลี่ยนแก้ไขโครงสร้าง
การควบคุม หรือกล่าวได้อีกอย่างหนึ่งว่า ระบบจัดการฐานข้อมูล ( Database Management System ) คือโปรแกรมหรือซอฟท์แวร์ที่ทำหน้าที่ในการจัดการฐานข้อมูลโดยจะเป็นสื่อกลางระหว่างผู้ใช้
และโปรแกรมประยุกต์ต่าง ๆ ที่มีอยู่ในฐานข้อมูล
3. ข้อมูล (Data)
ฐานข้อมูลเป็นการจัดเก็บรวบรวมข้อมูลให้เป็นศูนย์กลางข้อมูลอย่างเป็นระบบ
ซึ่งข้อมูลเหล่านี้สามารถใช้ร่วมกันได้ ผู้ใช้ข้อมูลในระบบฐานข้อมูล
จะมองภาพข้อมูลในลักษณะที่แตกต่างกัน เช่น
ผู้ใช้บางคนมองภาพของข้อมูลที่ถูกจัดเก็บไว้ในสื่อเก็บข้อมูลจริง ( Physical Level ) ในขณะที่ผู้ใช้บางคนมองภาพข้อมูลจากการใช้งานของผู้ใช้
( External Level )
4. บุคลากร (People)
ผู้ใช้ทั่วไป
เป็นบุคลากรที่ใช้ข้อมูลจากระบบฐานข้อมูล เพื่อให้งานสำเร็จลุล่วงได้ เช่น
ในระบบข้อมูลการจองตั๋วเครื่องบิน ผู้ใช้ทั่วไป คือ
พนักงานจองตั๋วพนักงานปฏิบัติงาน ( Operating
) เป็นผู้ปฏิบัติการด้านการประมวลผล
การป้อนข้อมูลลงเครื่องคอมพิวเตอร์ นักวิเคราะห์และออกแบบระบบ ( System
Analyst ) เป็นบุคลากรที่ทำหน้าที่วิเคราะห์ระบบฐานข้อมูล
และออกแบบระบบงานที่จะนำมาใช้ ผู้เขียนโปรแกรมประยุกต์ใช้งาน ( Programmer ) เป็นผู้ทำหน้าที่เขียนโปรแกรมประยุกต์ใช้งานต่าง ๆ
เพื่อให้การจัดเก็บการเรียกใช้ข้อมูลเป็นไปตามความต้องการของผู้ใช้ ผู้บริหารงานฐานข้อมูล(Database
Administrator :DBA ) เป็นบุคคลที่ทำหน้าที่บริหารและควบคุมการบริหารงานของระบบฐานข้อมูลทั้งหมด
เป็นผู้ที่จะต้องตัดสินใจว่าจะรวบรวมข้อมูลอะไรเข้าสู่ระบบ จัดเก็บโดยวิธีใด
เทคนิคการเรียกใช้ข้อมูล กำหนดระบบการรักษาความปลอดภัยของข้อมูลการสร้างระบบข้อมูลสำรอง
การกู้ และประสานงานกับผู้ใช้ว่าต้องการใช้ข้อมูลอย่างไร
รวมถึงนักวิเคราะห์และออกแบบระบบ และโปรแกรมเมอร์ประยุกต์ใช้งาน
เพื่อให้การบริหารการใช้งานเป็นไปอย่างมีประสิทธิภาพ
5. ขั้นตอนการปฏิบัติงาน (Procedures)
ในระบบฐานข้อมูลควรมีการจัดทำเอกสารที่ระบุขั้นตอนการทำงานของหน้าที่การงานต่างๆในระบบฐานข้อมูล
ในสภาวะปกติและในสภาวะที่ระบบเกิดปัญหา( Failure) ซึ่งเป็นขั้นตอนการปฏิบัติงานสำหรับบุคลากรทุกระดับขององค์กร
ผู้จัดการฐานข้อมูล (Database Administrator)
ผู้จัดการฐานข้อมูล (Database Administrator) : เป็นผู้ดูแลทั้งฐานข้อมูลและระบบจัดการฐานข้อมูล
มีหน้าที่รับผิดชอบด้านความปลอดภัยของข้อมูล ประสานงานและตรวจสอบการใช้งาน
รวมทั้งจัดหาและดูแลรักษาอุปกรณ์ทั้งทางด้านฮาร์ดแวร์และซอฟต์แวร์
ประโยชน์ของระบบจัดการฐานข้อมูล
1. ในกรณีที่ต้องการจะปรับปรุงฐานข้อมูลสามารถทำได้สะดวกและรวดเร็ว
2. การจัดเรียงข้อมูลจะเป็นระเบียบ ไม่ซ้ำซ้อน
ลดขั้นตอนของการทำงาน
3. เมื่อมีการใช้จัดการฐานข้องมูลอย่างเป็นระบบจึงทำให้สามารถเข้าไปใช้งานได้ทุกคน
4. เมื่อข้อมูลมีการจัดการอย่างเป็นระเบียบแล้ว
จึงทำให้สามารถรักษาความปลอดภัยได้ง่าย และมีประสิทธิภาพ
5. สามารถที่จะปรับปรุงข้อมูลได้ง่าย
ประโยชน์ของการจัดเก็บข้อมูลแบบรวมศูนย์
ในปัจจุบันองค์กรส่วนใหญ่หันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก
เนื่องจากระบบฐานข้อมูลมีประโยชน์ดังต่อไปนี้
1. ลดความซ้ำซ้อนของข้อมูล
เนื่องจากการใช้งานระบบฐานข้อมูลนั้นต้องมีการออกแบบฐานข้อมูลเพื่อให้มีความซ้ำซ้อนของข้อมูลน้อยที่สุด
จุดประสงค์หลักของการออกแบบฐานข้อมูลเพื่อการลดความซ้ำซ้อน
สาเหตุที่ต้องลดความซ้ำซ้อน เนื่องจากความยากในการปรับปรุงข้อมูล
กล่าวคือถ้าเก็บข้อมูลซ้ำซ้อนกันหลายแห่ง
เมื่อมีการปรับปรุงข้อมูลแล้วปรับปรุงข้อมูลไม่ครบทำให้ข้อมูลเกิดความขัดแย้งกันของข้อมูลตามมา
และยังเปลืองเนื้อที่การจัดเก็บข้อมูลด้วย
เนื่องจากข้อมูลชุดเดียวกันจัดเก็บซ้ำกันหลายแห่งนั่นเอง
ถึงแม้ว่าความซ้ำซ้อนช่วยให้ออกรายงานและตอบคำถามได้เร็วขึ้น
แต่ข้อมูลจะเกิดความขัดแย้งกัน ในกรณีที่ต้องมีการปรับปรุงข้อมูลหลายแห่ง
การออกรายงานจะทำได้เร็วเท่าใดนั้นจึงไม่มีความหมายแต่อย่างใด
และเหตุผลที่สำคัญอีกประการหนึ่งคือปัญหาเรื่องความขัดแย้งกันของข้อมูลแก้ไขไม่ได้ด้วยฮาร์ดแวร์
ขณะที่การออกรายงานช้านั้นใช้ความสามารถของฮาร์ดแวร์ช่วยได้
2. รักษาความถูกต้องของข้อมูล
เนื่องจากระบบจัดการฐานข้อมูลสามารถตรวจสอบกฎบังคับความถูกต้องของข้อมูลให้ได้
โดยนำกฎเหล่านั้นมาไว้ที่ฐานข้อมูล
ซึ่งถือเป็นหน้าที่ของระบบจัดการฐานข้อมูลที่จะจัดการเรื่องความถูกต้องของข้อมูลให้แทน
แต่ถ้าเป็นระบบแฟ้มข้อมูลผู้พัฒนาโปรแกรมต้องเขียนโปรแกรมเพื่อควบคุมกฎระเบียบต่างๆ(data integrity) เองทั้งหมด
ถ้าเขียนโปรแกรมครอบคลุมกฎระเบียบใดไม่ครบหรือขาดหายไปบางกฎอาจทำให้ข้อมูลผิดพลาดได้
และยังช่วยลดค่าใช้จ่ายในการบำรุงรักษาและพัฒนาโปรแกรมด้วย เนื่องจากระบบจัดการฐานข้อมูลจัดการให้นั่นเอง
เนื่องจากระบบจัดการฐานข้อมูลสามารถรองรับการใช้งานของผู้ใช้หลายคนพร้อมกันได้
ดังนั้นความคงสภาพและความถูกต้องของข้อมูลจึงมีความสำคัญมากและต้องควบคุมให้ดีเนื่องจากผู้ใช้อาจเปลี่ยนแปลงแก้ไขข้อมูลได้
ซึ่งจะทำให้เกิดความผิดพลาดกระทบต่อการใช้ข้อมูลของผู้ใช้อื่นทั้งหมดได้
ดังนั้นประโยชน์ของระบบฐานข้อมูลในเรื่องนี้จึงมีความสำคัญมาก
3. มีความเป็นอิสระของข้อมูล
เนื่องจากมีแนวคิดที่ว่าทำอย่างไรให้โปรแกรมเป็นอิสระจากการเปลี่ยนแปลงโครงสร้างข้อมูล
ในปัจจุบันนี้ถ้าไม่ใช้ระบบฐานข้อมูลการแก้ไขโครงสร้างข้อมูลจะกระทบถึงโปรแกรมด้วย
เนื่องจากในการเรียกใช้ข้อมูลที่เก็บอยู่ในระบบแฟ้มข้อมูลนั้น
ต้องใช้โปรแกรมที่เขียนขึ้นเพื่อเรียกใช้ข้อมูลในแฟ้มข้อมูลนั้นโดยเฉพาะ เช่น
เมื่อต้องการรายชื่อพนักงานที่มีเงินเดือนมากกว่า 100,000
บาทต่อเดือน โปรแกรมเมอร์ต้องเขียนโปรแกรมเพื่ออ่านข้อมูลจากแฟ้มข้อมูลพนักงานและพิมพ์รายงานที่แสดงเฉพาะข้อมูลที่ตรงตามเงื่อนไขที่กำหนด
กรณีที่มีการเปลี่ยนแปลงโครงสร้างของแฟ้มข้อมูลข้อมูลเช่น ให้มีดัชนี (index) ตามชื่อพนักงานแทนรหัสพนักงาน ส่งผลให้รายงานที่แสดงรายชื่อพนักงานที่มีเงินเดือนมากกว่า
100,000 บาทต่อเดือนซึ่งแต่เดิมกำหนดให้เรียงตามรหัสพนักงานนั้นไม่สามารถพิมพ์ได้
ทำให้ต้องมีการแก้ไขโปรแกรมตามโครงสร้างดัชนี (index) ที่เปลี่ยนแปลงไป
ลักษณะแบบนี้เรียกว่าข้อมูลและโปรแกรมไม่เป็นอิสระต่อกัน
สำหรับระบบฐานข้อมูลนั้นข้อมูลภายในฐานข้อมูลจะเป็นอิสระจากโปรแกรมที่เรียกใช้(dataindependence) สามารถแก้ไขโครงสร้างทางกายภาพของข้อมูลได้
โดยไม่กระทบต่อโปรแกรมที่เรียกใช้ข้อมูลจากฐานข้อมูล
เนื่องจากระบบฐานข้อมูลมีระบบจัดการฐานข้อมูลทำหน้าที่แปลงรูป (mapping) ให้เป็นไปตามรูปแบบที่ผู้ใช้ต้องการ
เนื่องจากในระบบแฟ้มข้อมูลนั้นไม่มีความเป็นอิสระของข้อมูล
ดังนั้นระบบฐานข้อมูลได้ถูกพัฒนาขึ้นมาเพื่อแก้ปัญหาด้านความเป็นอิสระของข้อมูล
นั่นคือระบบฐานข้อมูลมีการทำงานไม่ขึ้นกับรูปแบบของฮาร์ดแวร์ที่นำมาใช้กับระบบฐานข้อมูลและไม่ขึ้นกับโครงสร้างทางกายภาพของข้อมูล
และมีการใช้ภาษาสอบถามในการติดต่อกับข้อมูลภายในฐานข้อมูลแทนคำสั่งของภาษาคอมพิวเตอร์ในยุคที่
3 ทำให้ผู้ใช้เรียกใช้ข้อมูลจากฐานข้อมูลโดยไม่จำเป็นต้องทราบรูปแบบการจัดเก็บข้อมูล
ประเภทหรือขนาดของข้อมูลนั้นๆ
4. มีความปลอดภัยของข้อมูลสูง
ถ้าหากทุกคนสามารถเรียกดูและเปลี่ยนแปลงข้อมูลในฐานข้อมูลทั้งหมดได้
อาจก่อให้เกิดความเสียหายต่อข้อมูลได้
และข้อมูลบางส่วนอาจเป็นข้อมูลที่ไม่อาจเปิดเผยได้หรือเป็นข้อมูลเฉพาะของผู้บริหาร
หากไม่มีการจัดการด้านความปลอดภัยของข้อมูล
ฐานข้อมูลก็จะไม่สามารถใช้เก็บข้อมูลบางส่วนได้
ระบบฐานข้อมูลส่วนใหญ่จะมีการรักษาความปลอดภัยของข้อมูล ดังนี้
1. มีรหัสผู้ใช้ (user) และรหัสผ่าน (password) ในการเข้าใช้งานฐานข้อมูลสำหรับผู้ใช้แต่ละคน
ระบบฐานข้อมูลมีระบบการสอบถามชื่อพร้อมรหัสผ่านของผู้เข้ามาใช้ระบบงานเพื่อให้ทำงานในส่วนที่เกี่ยวข้องเท่านั้น
โดยป้องกันไม่ให้ผู้ที่ไม่ได้รับอนุญาตเข้ามาเห็นหรือแก้ไขข้อมูลในส่วนที่ต้องการปกป้องไว้
2. ในระบบฐานข้อมูลสามารถสร้างและจัดการตารางข้อมูลทั้งหมดในฐานข้อมูล
ทั้งการเพิ่มผู้ใช้
ระงับการใช้งานของผู้ใช้ อนุญาตให้ผู้ใช้สามารถเรียกดู
เพิ่มเติม ลบและแก้ไขข้อมูล หรือบางส่วนของข้อมูลได้ในตารางที่ได้รับอนุญาต)
ระบบฐานข้อมูลสามารถกำหนดสิทธิการมองเห็นและการใช้งานของผู้ใช้ต่างๆ
ตามระดับสิทธิและอำนาจการใช้งานข้อมูลนั้นๆ
3. ในระบบฐานข้อมูล (DBA) สามารถใช้วิว (view) เพื่อประโยชน์ในการรักษาความปลอดภัย
ของข้อมูลได้เป็นอย่างดี
โดยการสร้างวิวที่เสมือนเป็นตารางของผู้ใช้จริงๆ
และข้อมูลที่ปรากฏในวิวจะเป็นข้อมูลที่เกี่ยวข้องกับงานของผู้ใช้เท่านั้น
ซึ่งจะไม่กระทบกับข้อมูลจริงในฐานข้อมูล
4. ระบบฐานข้อมูลจะไม่ยอมให้โปรแกรมใดๆ
เข้าถึงข้อมูลในระดับกายภาพ (physical)
โดยไม่ผ่าน ระบบการจัดการฐานข้อมูล
และถ้าระบบเกิดความเสียหายขึ้นระบบจัดการฐานข้อมูลรับรองได้ว่าข้อมูลที่ยืนยันการทำงานสำเร็จ
(commit) แล้วจะไม่สูญหาย
และถ้ากลุ่มงานที่ยังไม่สำเร็จ (rollback) นั้นระบบจัดการฐานข้อมูลรับรองได้ว่าข้อมูลเดิมก่อนการทำงานของกลุ่มงานยังไม่สูญหาย
5. มีการเข้ารหัสและถอดรหัส (encryption/decryption) เพื่อปกปิดข้อมูลแก่ผู้ที่ไม่เกี่ยวข้อง
เช่น มีการเข้ารหัสข้อมูลรหัสผ่าน
6. ใช้ข้อมูลร่วมกันโดยมีการควบคุมจากศูนย์กลาง
มีการควบคุมการใช้ข้อมูลในฐานข้อมูลจากศูนย์กลาง
ระบบฐานข้อมูลสามารถรองรับการทำงานของผู้ใช้หลายคนได้
กล่าวคือระบบฐานข้อมูลจะต้องควบคุมลำดับการทำงานให้เป็นไปอย่างถูกต้อง
เช่นขณะที่ผู้ใช้คนหนึ่งกำลังแก้ไขข้อมูลส่วนหนึ่งยังไม่เสร็จ
ก็จะไม่อนุญาตให้ผู้ใช้คนอื่นเข้ามาเปลี่ยนแปลงแก้ไขข้อมูลนั้นได้ เนื่องจากข้อมูลที่เข้ามายังระบบฐานข้อมูลจะถูกนำเข้าโดยระบบงานระดับปฏิบัติการตามหน่วยงานย่อยขององค์กร
ซึ่งในแต่ละหน่วยงานจะมีสิทธิในการจัดการข้อมูลไม่เท่ากัน
ระบบฐานข้อมูลจะทำการจัดการว่าหน่วยงานใดใช้ระบบจัดการฐานข้อมูลในระดับใดบ้าง
ใครเป็นผู้นำข้อมูลเข้า ใครมีสิทธิแก้ไขข้อมูล และใครมีสิทธิเพียงเรียกใช้ข้อมูล
เพื่อที่จะให้สิทธิที่ถูกต้องบนตารางที่สมควรให้ใช้
กระบวนการจัดการข้อมูลและสารสนเทศ
การทำข้อมูลให้เป็นสารสนเทศที่จะเป็นประโยชน์ต่อการใช้งาน
จำเป็นต้องอาศัยเทคโนโลยีเข้ามาช่วยในการดำเนินการ เริ่มตั้งแต่การรวบรวมและตรวจสอบข้อมูล
การดำเนินการประมวลผลข้อมูลให้กลายเป็นสารสนเทศ และการดูแลรักษาสารสนเทศ
เพื่อการใช้งาน
1. การรวบรวมและตรวจสอบข้อมูล
ควรประกอบด้วย
1.1 การรวบรวมข้อมูล
เป็นเรื่องของการเก็บรวบรวมข้อมูลซึ่งมีจำนวนมาก และต้องเก็บให้ได้อย่างทันเวลา
เช่น ข้อมูลการลงทะเบียนเรียนของนักเรียน ข้อมูลประวัติบุคลากร
ปัจจุบันมีเทคโนโลยีช่วยในการจัดเก็บอยู่เป็นจำนวนมาก เช่น
การป้อนข้อมูลเข้าเครื่องคอมพิวเตอร์ การอ่านข้อมูลจากรหัสแท่ง
การตรวจใบลงทะเบียนที่มีการฝนดินสอดำในตำแหน่งต่าง ๆ
เป็นวิธีการเก็บรวบรวมข้อมูลเช่นกัน
1.2 การตรวจสอบข้อมูล
เมื่อมีการเก็บรวบรวมข้อมูลแล้วจำเป็นต้องมีการตรวจสอบข้อมูล
เพื่อตรวจสอบความถูกต้อง ข้อมูลที่เก็บเข้าในระบบจะต้องมีความน่าเชื่อถือ
หากพบที่ผิดพลาดต้องแก้ไข การตรวจสอบข้อมูลมีหลายวิธี เช่น
การใช้ผู้ป้อนข้อมูลสองคนป้อนข้อมูลชุดเดียวกัน
เข้าเครื่องคอมพิวเตอร์แล้วเปรียบเทียบกัน หรือตั้งกฎเกณฑ์ให้คอมพิวเตอร์ตรวจสอบ
2. การประมวลผลข้อมูล
ประกอบด้วยกิจกรรมดังต่อไปนี้
2.1 การจัดกลุ่มข้อมูล
ข้อมูลที่จัดเก็บจะต้องมีการแบ่งแยกกลุ่ม เพื่อเตรียมไว้สำหรับการใช้งาน
การแบ่งแยกกลุ่มมีวิธีการที่ชัดเจน เช่น
ข้อมูลในโรงเรียนมีการแบ่งเป็นแฟ้มประวัตินักเรียน และแฟ้มลงทะเบียน
เพื่อความสะดวกในการค้นหา
2.2 การจัดเรียงข้อมูล
เมื่อจัดแบ่งกลุ่มเป็นแฟ้มแล้ว ควรมีการจัดเรียงข้อมูลตามลำดับ ตัวเลข
หรือตัวอักษร หรือเพื่อให้เรียกใช้งานได้ง่าย ประหยัดเวลา ตัวอย่างการจัดเรียงข้อมูล
เช่น การจัดเรียงบัตรข้อมูลผู้แต่งหนังสือ
ในตู้บัตรรายการของห้องสมุดตามลำดับตัวอักษร
การจัดเรียงชื่อคนในสมุดรายนามผู้ใช้โทรศัพท์ตามลำดับตัวอักษร
2.3 การสรุปผล
บางครั้งข้อมูลที่จัดเก็บมีจำนวนมาก จำเป็นต้องมีการสรุปผลหรือสรุปรายงาน
เพื่อนำไปใช้ประโยชน์ ข้อมูลที่สรุปได้นี้อาจสื่อความหมายได้ดีกว่า เช่น
สถิติจำนวนนักเรียนแยกตามชั้นเรียนแต่ละชั้น
2.4 การคำนวณข้อมูลที่เก็บรวบรวมมีเป็นจำนวนมากข้อมูลบางส่วน
เป็นข้อมูลตัวเลขที่สามารถนำไปคำนวณ เพื่อหาผลลัพธ์บางอย่างได้
ดังนั้นการสร้างสารสนเทศจากข้อมูลจึงอาศัยการคำนวณข้อมูลที่เก็บไว้ด้วย เช่น
การคำนวณเกรดเฉลี่ยของนักเรียนแต่ละคน
3. การดูแลรักษาข้อมูล
ประกอบด้วยกิจกรรมต่อไปนี้
3.1 การเก็บรักษาข้อมูล
การเก็บรักษาข้อมูล หมายถึง การนำข้อมูลมาบันทึกเก็บไว้ในสื่อบันทึกต่าง ๆ เช่น
แผ่นบันทึกข้อมูล นอกจากนี้ยังรวมถึงการดูแล และทำสำเนาข้อมูล
เพื่อให้ใช้งานต่อไปในอนาคตได้
3.2 การทำสำเนาข้อมูล
การทำสำเนาเพื่อที่จะนำข้อมูลเก็บรักษาไว้ หรือนำไปแจกจ่ายในภายหลัง
จึงควรคำนึงถึงความจุและความทนทานของสื่อบันทึกข้อมูล
3.3 การสื่อสารและเผยแพร่ข้อมูล
ข้อมูลต้องกระจายหรือส่งต่อไปยังผู้ใช้งานที่ห่างไกลได้ง่าย
การสื่อสารข้อมูลจึงเป็นเรื่องสำคัญและมีบทบาทที่สำคัญยิ่งที่จะทำให้การส่งข่าวสารไปยังผู้ใช้
ทำได้รวดเร็วและทันเวลา
3.4 การปรับปรุงข้อมูล
ข้อมูลที่จัดเก็บไว้มีจุดประสงค์ที่จะเรียกใช้งานได้ต่อไป
ดังนั้นข้อมูลจึงต้องมีการปรับปรุงให้ทันสมัยอยู่ตลอดเวลาและจัดเก็บอย่างเป็นระบบเพื่อการค้นหาได้อย่างรวดเร็ว
ฐานข้อมูล และคลังข้อมูล
โครงสร้างข้อมูล
มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต(Bit) ไบต์(Byte) เขตข้อมูล(Field) ระเบียนข้อมูล(Record) และไฟล์(File) ตามลำดับ
·
บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์
เป็นเลขฐานสอง 0 กับ 1
·
ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต
มาเรียงต่อกันเป็น 1 ไบท์
สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 = 256 ตัว
·
เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย
·
ระเบียนข้อมูล (Record) กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน
·
ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน
ปัญหาเกี่ยวกับแฟ้มข้อมูล
1. ความซ้ำซ้อนของข้อมูล (Data Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง
ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล
2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม
หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง จะมีผลกระทบต่อโปรแกรม
ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง
ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม
3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก
ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได
4. การขาดความร่วมมือ (Lack of Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่
ๆ
5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล
มีขอบเขตความสามารถจำกัด
แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
1.
ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
2.
มีความเป็นอิสระต่อกัน (Data Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
3.
สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้
โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
4.
มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน
มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน
และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
5.
มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น
องค์ประกอบของระบบฐานข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบ 4 ส่วน คือ
1.
ข้อมูล (Data) คือ ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
2.
ฮาร์ดแวร์ (Hardware) คือ เครื่องคอมพิวเตอร์ และอุปกรณ์รอบข้าง
3.
ซอฟต์แวร์ (Software) คือ ระบบปฏิบัติการ และระบบจัดการข้อมูล รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
4.
ผู้ใช้ (Users) คือ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล ผู้เขียนโปรแกรม และผู้ใช้งาน
รูปแบบของฐานข้อมูล (Database Model)
แบบจำลองฐานข้อมูลอธิบายถึงโครงสร้างและความสัมพันธ์ระหว่างข้อมูล
แบบจำลองมีหลายรูปแบบ คือ
1.
แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายต้นไม้
ข้อมูลมีความสัมพันธ์เรียกว่า One-to-Many หนึ่งต่อกลุ่ม
ข้อมูลจัดเก็บในรูปของ Segment ที่อยู่บนสุด
เรียกว่า Root Node ถัดลงมาเรียกว่า Child
Node ข้อดีคือมีความซับซ้อนน้อย มีโครงสร้างเข้าใจง่าย
เรียงลำดับอย่างต่อเนื่อง ข้อจำกัด คือ การเข้าถึงข้อมูลมีความคล่องตัวน้อย
เพราะต้องเริ่มจาก Root Segment เสมอ
2.
แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model) โครงสร้างเป็นลักษณะ Multi-list Structure มีความสัมพันธ์ของข้อมูลแบบ Many
to Many แต่ละชั้นมี Segment สามารถมี Parent ได้มากกว่าหนึ่ง เรียก Parent ว่า Owner ส่วน Child เรียกว่า Member ความซ้ำซ้อนของข้อมูลมีน้อย
สามารถเชื่อมโยงข้อมูลแบบไป กลับได้ แต่จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์
มีความยุ่งบากในการเปลี่ยนแปลงโครงสร้างข้อมูล
3.
แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model) โครงสร้างข้อมูลอยู่ในรูปแบบตาราง
เรียกตารางว่า รีเลชั้น แต่ละรีเลชั่น ประกอบด้วย แถวหรือทัพเพิล และคอลัมน์
เรียกว่า แอตทริบิวต์ แต่ละรีเลชั่นจะมีแอตทริบิวต์ เรียกว่า คีย์
บอกถึงความแตกต่างของแต่ละทัพเพิล เป็นโครงสร้างที่เข้าใจง่าย
ข้อมูลมีความเป็นอิสระจากโปรแกรม
ระบบฐานข้อมูลแบบกระจาย (Distributed Database)
ฐานข้อมูลแบบกระจาย อาศัยซอฟต์แวร์ในการจัดการข้อมูล ซึ่งอำนวยความสะดวกให้แก่ผู้ใช้งานบนฐานข้อมูลแบบกระจาย
การจัดเก็บข้อมูลสอดคล้องกับลักษณะการใช้งานจริง เรียกข้อมูลได้เร็ว
ฐานข้อมูลแบบออบเจ็กต์ (Object-Oriented
Database)
ฐานข้อมูลเชิงวัตถุเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ
เพื่อการจัดเก็บข้อมูลที่มีความซับซ้อน ขนาดใหญ่ หลากหลาย จัดเก็บข้อมูลที่ประกอบด้วยแอตทริบิวต์
ซึ่งแสดงคุณสมบัติ รายละเอียดของข้อมูล และเมธอด
ซึ่งแสดงฟังก์ชั่นพื้นฐานที่ประมวลผลกับข้อมูลภายนอกออบเจ็กต์นั้น
กลุ่มของออบเจ็กต์มีคุณสมบัติ และพฤติกรรมที่เหมือนกันจะจัดอยู่ในคลาสเดียวกัน
ระบบจัดการฐานข้อมูลแบบออบเจ็กต์สามารถเก็บข้อมูลพื้นฐานทั่วไป
ข้อมูลวัตถุ ข้อมูลมัลติมีเดียได้ง่าย
แต่ไม่รวดเร็วเท่าระบบฐานข้อมูลแบบเชิงสัมพันธ์
ปัจจุบันจึงพัฒนาฐานข้อมูลแบบออบเจ็กต์และฐานข้อมูลเชิงสัมพันธ์มาใช้ร่วมกัน
คลังข้อมูล (Data Warehouse)
คลังข้อมูล เรียกว่า ดาต้าแวร์เฮาส์
คือที่เก็บรวบรวมข้อมูลจากหลายแหล่ง หลายชนิดเข้าด้วยกัน
เป็นฐานข้อมูลขนาดใหญ่ขององค์การ ข้อมูลได้มาจากในองค์การ ภายนอกองค์การ ซึ่งได้รับการเลือก กลั่นกรอง
การปรับแก้ไข ทำให้เป็นมาตรฐานเดียวกัน
เพื่อให้ผู้ใช้สามารถเข้าถึงข้อมูลได้อย่างสะดวกรวดเร็ว
ลักษณะของข้อมูล
·
การแบ่งโครงสร้างตามเนื้อหา (Subject Oriented) โดยการจัดเก็บข้อมูลที่สนใจและเป็นประโยชน์มาประมวลผลเพื่อสนับสนุนการตัดสินใจ
·
การรวบรวมเป็นหนึ่งเดียว (Integration) รวบรวมข้อมูลให้อยู่ในรูปแบบมาตรฐานเดียวกัน
·
ความสัมพันธ์กับเวลา (Time Variant) ข้อมูลที่จัดเก็บในคลังต้องกำหนดช่วงเวลา
·
ความเสถียรของข้อมูล (Nonvolatile) ข้อมูลที่ถูกบันทึกไว้ในคลังข้อมูลไม่มีการเปลี่ยนแปลงค่าข้อมูลที่มีอยู่
ดาต้ามาร์ท (Data Mart)
การจัดทำดาต้ามาร์ท คือ
คลังข้อมูลขนาดเล็กที่มีลักษณะเฉพาะสำหรับใช้ในองค์การธุรกิจ
ดาต้ามาร์ทมีขนาดของข้อมูล และค่าใช้จ่ายที่ต่ำกว่า การจัดทำข้อมูลใช้เวลาสั้นกว่า การนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงานสะดวกว่าใช้คลังข้อมูลกลางขององค์การ
ธุรกิจอัจฉริยะ (Business Intelligence: BI)
เป็นการใช้ข้อมูลขององค์การที่มีคุณค่าช่วยสนับสนุนการตัดสินใจการดำเนินงานของธุรกิจ
เกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล การค้นพบโอกาสใหม่ ๆ
ในการดำเนินการธุรกิจ กระบวนการของธุรกิจอัฉริยะ คือ การสนับสนุนการตัดสินใจ
การคิวรี การรายงาน การประมวลผลเชิงวิเคราะห์แบบออนไลน์ การวิเคราะห์ทางสถิติ
การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล
มี 2 ประเภท
คือ
1.
การประมวลผลเชิงวิเคราะห์แบบออนไลน์
(OLAP) OLAP เป็นเครื่องมือที่มีความสามารถการค้นหา
และการวิเคราะห์ข้อมูลจากคลังข้อมูล ในลักษณะต่าง ๆ เช่น
– การหมุนมิติ (Rotation) การวิเคราะห์ ดูข้อมูลหลายมิติ หลายมุมมอง
– การเลือกช่วงข้อมูล (Ranging) สามารถเลือกดูข้อมูลเฉพาะส่วนที่สนใจ และนำมาวิเคราะห์ได้โดยไม่ใช้ข้อมูลทั้งหมด
– การเลือกระดับชั้นของข้อมูล (Hierarchy) สามารถจัดแบ่งข้อมูลเป็นลำดับชั้น เพื่อให้เรียกดูข้อมูลจากระดับบนแล้วไประดับล่าง ดูรายละเอียดได้
– การหมุนมิติ (Rotation) การวิเคราะห์ ดูข้อมูลหลายมิติ หลายมุมมอง
– การเลือกช่วงข้อมูล (Ranging) สามารถเลือกดูข้อมูลเฉพาะส่วนที่สนใจ และนำมาวิเคราะห์ได้โดยไม่ใช้ข้อมูลทั้งหมด
– การเลือกระดับชั้นของข้อมูล (Hierarchy) สามารถจัดแบ่งข้อมูลเป็นลำดับชั้น เพื่อให้เรียกดูข้อมูลจากระดับบนแล้วไประดับล่าง ดูรายละเอียดได้
2.
ดาต้าไมนิ่ง
(Data Mining) เป็นเครื่องมือและเทคนิคในการสกัดข้อมูล
และประมวลผลข้อมูลเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลใหญ่ สามารถค้นหารูปแบบ แนวโน้ม
พฤติกรรม ความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลเพื่อให้ได้ความรู้ใหม่
ความแตกต่างระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ
ฐานข้อมูลปฏิบัติการ (Operational Database) เป็นระบบที่ช่วยรวบรวม
และจัดเก็บข้อมูล ซึ่งข้อมูลเพิ่มมากขึ้นเรื่อย ๆ ในแต่ละวัน
การประมวลผลข้อมูลที่มีปริมาณมากจะใช้เวลานาน กระทบต่อการดำเนินงานได้
การเรียกดูข้อมูลต่าง ๆ ทำได้ไม่ง่าย ต้องอาศัยเวลาในการประมวลผล
ไม่สามารถวิเคราะห์ข้อมูลในรูปแบบต่างๆ
จึงมีการจัดทำคลังข้อมูลเพ่อเป็นแหล่งเก็บข้อมูลรวมขององค์การ
ให้มีความเรียบง่ายต่อการค้นหา และเรียกใช้ได้อย่างรวดเร็ว
สามารถรองรับการวิเคราะห์ข้อมูลที่มีปริมาณมาก
ข้อมูลมีลักษณะจัดเก็บในลักษณะที่รวบรวม เป็นระเบียบตามเนื้อหา และแปรผันตามเวลา
ข้อมูลซ้ำซ้อนได้ เหมาะกับการประมวลผลเชิงวิเคราะห์ที่เป็นประโยชน์
รูปแบบการประยุกต์คลังข้อมูลในธุรกิจ
ระบบคลังข้อมูลนี้ เรียกว่า GWIS (Glaxo Wellcome Information system) เป็นระบบที่ได้รับการพัฒนาด้วยเทคโนโลยีการวิเคราะห์ข้อมูลเชิงสัมพันธ์แบบออนไลน์ (Relational Online Analytical Processing :ROLAP) ช่วยสนับสนุนการตัดสินใจโดย GWIS ทำงานร่วมกับข้อมูลที่จัดเก็บในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์
และบูรณาการเข้ากันกับข้อมูลจากแหล่งภายใน และแหล่
สรุป
การจัดการข้อมูล หมายถึง การจัดเก็บข้อมูล การเรียกใช้ข้อมูล
รวมถึงการวิเคราะห์ข้อมูลเพื่อการใช้งานที่รวดเร็วจึงจัดเก็บในลักษณะของฐานข้อมูล
หน่วยของข้อมูล
หน่วยของข้อมูลคอมพิวเตอร์สามารถจัดเรียงเป็นลำดับชั้น จากขนาดเล็กไปขนาดใหญ่ได้ดังนี้
– บิต (bit) เลขฐานสองหนึ่งหลักซึ่งมีค่าเป็น 0 หรือ 1
– ตัวอักษร (character) กลุ่มข้อบิตสามารถแทนค่าตัวอักษรได้ ในชุดอักขระASCII 1 ไบต์ (8 บิต) แทน 1 ตัวอักษร
– เขตข้อมูล (field) เขตข้อมูลซึ่งประกอบด้วยกลุ่มตัวอักษรที่แทนข้อเท็จจริง
– ระเบียน (record) คือโครงสร้างข้อมูลที่แทนตัววัตถุชิ้นหนึ่ง เช่น ระเบียนนักเรียน
– แฟ้ม (file) ตารางที่เป็นกลุ่มของระเบียนที่มีโครงสร้างเดียวกัน
– ฐานข้อมูล (database) กลุ่มของตารางที่มีความสัมพันธ์กัน
– บิต (bit) เลขฐานสองหนึ่งหลักซึ่งมีค่าเป็น 0 หรือ 1
– ตัวอักษร (character) กลุ่มข้อบิตสามารถแทนค่าตัวอักษรได้ ในชุดอักขระASCII 1 ไบต์ (8 บิต) แทน 1 ตัวอักษร
– เขตข้อมูล (field) เขตข้อมูลซึ่งประกอบด้วยกลุ่มตัวอักษรที่แทนข้อเท็จจริง
– ระเบียน (record) คือโครงสร้างข้อมูลที่แทนตัววัตถุชิ้นหนึ่ง เช่น ระเบียนนักเรียน
– แฟ้ม (file) ตารางที่เป็นกลุ่มของระเบียนที่มีโครงสร้างเดียวกัน
– ฐานข้อมูล (database) กลุ่มของตารางที่มีความสัมพันธ์กัน
วัตถุประสงค์ในการจัดการข้อมูล
–
การเก็บข้อมูลเพื่อให้สามารถนำกลับมาใช้ได้ในภายหลัง
–
การจัดข้อมูลให้อยู่ในรูปแบบที่สามารถเรียกใช้ได้อย่างมีประสิทธิภาพ
–
การปรับปรุงข้อมูลให้มีความถูกต้องสมบูรณ์อยู่เสมอ
–
การปกป้องข้อมูล
จากการทำลาย ลักลอบใช้ หรือแก้ไขโดยมิชอบ
รวมทั้งปกป้องข้อมูลจากอุบัติเหตุที่อาจเกิดจากวินาศภัยหรือความบกพร่องภายในระบบคอมพิวเตอร์
โครงสร้างข้อมูล
การใช้คอมพิวเตอร์จัดการระบบฐานข้อมูลนั้น ข้อมูลของเอนทิตีต่างๆ
จะได้รับการนำไปเก็บไว้ในหน่วยความจำของคอมพิวเตอร์
ข้อมูลที่เก็บไว้อาจได้รับการเปลี่ยนแปลงเพิ่มเติมหรือตัดออกได้
การเก็บข้อมูลจะทำการเก็บข้อมูลไว้หลายๆ เอนทิตี
และเมื่อมีการเรียกใช้อาจนำเอาข้อมูลจากหลายๆ
เอนทิตีนั้นมาสัมพันธ์กันเพื่อให้ได้ผลลัพธ์ที่ต้องการ
การจัดเก็บข้อมูลด้วยระบบคอมพิวเตอร์ที่ถือว่ามีประสิทธิภาพคือการใช้เนื้อที่ในการจัดเก็บข้อมูลน้อยที่สุดและจะต้องเรียกค้นข้อมูลได้ง่าย
ดังนั้นจึงมีการแบ่งเอนทิตีออกเป็นส่วนย่อยๆ เพื่อใช้เรียกข้อมูลย่อยซึ่งเรียกว่า
เขตข้อมูล (Field) เมื่อนำเขตข้อมูลทั้งหมดของแฟ้มมาวางเรียงกัน
จะเกิดรูปแบบที่ทางคอมพิวเตอร์มองเห็นเรียกว่า ระเบียน (Record) ซึ่งสามารถใช้เป็นเครื่องบ่งบอกถึงโครงสร้างงาของแฟ้มนั้นได้รวมกันในระบบฐานข้อมูลจึงประกอบด้วยแฟ้มข้อมูลจำนวนหลายๆ
แฟ้มที่มีความสัมพันธ์กัน
การจัดโครงสร้างแฟ้มข้อมูล
การจัดโครงสร้างแฟ้มข้อมูลแบบต่างๆ
มีลักษณะเฉพาะตัวในการเข้าถึงข้อมูล ดังนี้
–
แฟ้มลำดับ
(Sequential file) เป็นการจัดโครงสร้างแฟ้มที่ง่ายที่สุด
คือ ระเบียนถูกเก็บเรียงต่อเนื่องกันไปตามลำดับของเขตข้อมูลคีย์
–
แฟ้มสุ่ม
(Direct file) ใช้แก้ปัญหาความล่าช้าในการเข้าถึงข้อมูลของแฟ้มลำดับ
โดยใช้ฟังก์ชันสุ่มในเขตข้อมูลคีย์เป็นข้อมูลนำเข้าและให้ผลลัพธ์เป็นตำแหน่งที่อยู่ของระเบียน
–
แฟ้มดรรชนี
(Indexed file) คล้ายกับดรรชนีคำศัพท์ที่อยู่ท้ายเล่มหนังสือ
ที่ประกอบด้วยคำต่างๆ เรียงตามตัวอักษร โดยจะเก็บค่าของเขตข้อมูลคีย์ทั้งหมดพร้อมด้วยตำแหน่งของระเบียนที่มีค่าเขตข้อมูลคีย์นั้น
–
แฟ้มลำดับดรรชนี
(Indexed sequential file) เป็นการจัดโครงสร้างแฟ้มข้อมูลที่แตกต่างจากแฟ้มดรรชนี
ซึ่งตัวระเบียนในแฟ้มข้อมูลไม่เรียงตามลำดับ แต่เรียงเฉพาะคีย์ในดรรชนี
แฟ้มลำดับดรรชนี มีระเบียนที่เรียงลำดับตามเขตคีย์ข้อมูล และมีดรรชนีบางส่วน
การจัดการฐานข้อมูล
ในการทำงานด้วยคอมพิวเตอร์
ถึงแม้จะมีเครื่องคอมพิวเตอร์ที่มีประสิทธิภาพดีแล้วยังต้องมีชุดคำสั่ง (Software) ที่จะควบคุมการทำงานของเครื่องอีกด้วย
การทำงานโดยวิธีการจัดแฟ้มซึ่งเรียกวิธีนี้ว่า ระบบการจัดการกระทำแฟ้มข้อมูล (file
handing system) อาจใช้โปรแกรมสำเร็จซึ่งทำหน้าที่ในการเก็บรวบรวมข้อมูลให้เป็นแฟ้มที่มีระเบียบง่ายต่อการใช้งาน
และช่วยทำให้ผู้ใช้ประมวลผลข้อมูลต่างๆ ตามความต้องการได้อย่างรวดเร็ว
โปรแกรมเหล่านี้จะใช้ระบบการจัดการฐานข้อมูล หรือที่เรียกว่า ดีบีเอ็มเอส (Data
Base Management System : DBMS)
ระบบฐานข้อมูลเป็นสิ่งที่จำเป็นและเกี่ยวข้องกับการใช้งานประจำวัน
การตัดสินใจของผู้บริหารจะกระทำได้รวดเร็ว ถ้ามีข้อมูลที่ถูกต้องและเพียงพอ
จึงมีการใช้คอมพิวเตอร์ช่วยประมวลผลเพื่อให้ได้สารสนเทศดังกล่าว แต่การประมวลผลด้วยคอมพิวเตอร์จำเป็นต้องมีหลักการและวิธีการที่ทำให้ระบบมีระเบียบแบบแผนที่ดี
การแบ่งประเภทแฟ้ม
ลักษณะการจัดการฐานข้อมูลที่ดี
เทคโนโลยีด้านคอมพิวเตอร์ได้เปลี่ยนแปลงไปตามกาลเวลา
วิธีการฐานข้อมูลได้พัฒนาให้ก้าวหน้าขึ้นจากการออกแบบและเก็บข้อมูลในฐานข้อมูลที่เดียว
การจัดการฐานข้อมูลจึงมีหลักการที่สำคัญ คือ
1. ลดความซ้ำซ้อนของข้อมูล
2. กำหนดมาตรฐานข้อมูล
3. มีระบบป้องกันความปลอดภัยของข้อมูล
4. มีความเป็นอิสระจากโปรแกรม
5. รวมข้อมูลเป็นฐานข้อมูลกลาง
1. ลดความซ้ำซ้อนของข้อมูล
2. กำหนดมาตรฐานข้อมูล
3. มีระบบป้องกันความปลอดภัยของข้อมูล
4. มีความเป็นอิสระจากโปรแกรม
5. รวมข้อมูลเป็นฐานข้อมูลกลาง
อรนุช ชุดชลามาศ.
การจัดระเบียบและการจัดการข้อมูลในฐานข้อมูล. สืบค้นเมื่อวันที่ 3
กุมภาพันธ์ พ.ศ.2563 (ออนไลน์). แหล่งที่มา : http://www.satrinon.ac.th/emmy/lesson/lesson02/ls0205.html
ooy_Pimpan Panananda. ฐานข้อมูลและคลังข้อมูล. สืบค้นเมื่อวันที่ 7 กุมภาพันธ์ พ.ศ.2563 (ออนไลน์). แหล่งที่มา : https://pimpanp.wordpress.com/2008/04/26
ครูโอ้. การจัดการข้อมูล.
สืบค้นเมื่อวันที่ 7 กุมภาพันธ์ พ.ศ.2563 (ออนไลน์). แหล่งที่มา : https://chalad.wordpress.com/subject/31241-2/31241-lesson-4/