วันศุกร์ที่ 5 ตุลาคม พ.ศ. 2561

บทที่ 4 เทคโนโลยีสารสนเทศ โครงสร้างพื้นฐาน ฐานข้อมูลและระบบข้อมูล

ปัญหาที่เกิดขึ้นในการจัดการข้อมูลแหล่งข้อมูลในไฟล์ที่เป็นทางการสิ่งแวดล้อม?
•ระบบข้อมูลที่มีประสิทธิภาพให้ผู้ใช้
ถูกต้องทันเวลาและข้อมูลที่เกี่ยวข้อง
•ข้อมูลที่ถูกต้องปราศจากข้อผิดพลาด
•ข้อมูลที่เป็นประโยชน์สำหรับผู้มีอำนาจตัดสินใจ
เมื่อจำเป็น
•ข้อมูลที่เกี่ยวข้องมีความเกี่ยวข้องเมื่อเป็นประโยชน์และ
เหมาะสมกับประเภทของงานและการตัดสินใจที่
ต้องการมัน
•คุณอาจจะประหลาดใจที่ได้รู้ว่าหลายธุรกิจ
ไม่มีข้อมูลที่ทันเวลาถูกต้องหรือมีความเกี่ยวข้อง
เนื่องจากข้อมูลในระบบสารสนเทศของพวกเขาได้รับการจัดระเบียบและบำรุงรักษาอย่างไม่ดี

FILE ORGANIZATIONEMENTMSAND

แนวคิด
•ระบบคอมพิวเตอร์จัดข้อมูลในลำดับชั้นที่เริ่มต้นด้วยบิตและไบต์และดำเนินไปยังเขตข้อมูล,ระเบียน, ไฟล์และฐานข้อมูล (ดูรูปที่ 6.1)บิตแสดงถึงหน่วยข้อมูลที่เล็กที่สุดที่คอมพิวเตอร์สามารถทำได้handle กลุ่มของบิตที่เรียกว่า byte หมายถึง singleตัวอักษรซึ่งอาจเป็นตัวอักษรตัวเลขหรืออีกตัวก็ได้สัญลักษณ์. การจัดกลุ่มตัวอักษรเป็นคำกลุ่มหนึ่งคำหรือหมายเลขที่สมบูรณ์ (เช่นชื่อบุคคลหรืออายุ) เรียกว่าเขตข้อมูลกลุ่มของฟิลด์ที่เกี่ยวข้องเช่นชื่อนักเรียน, หลักสูตร, วันที่, และเกรดประกอบด้วยบันทึก; กลุ่มของระเบียนเดียวกัน
type เรียกว่าไฟล์
รูปที่ 6.1
•ระบบคอมพิวเตอร์
จัดข้อมูลในลำดับชั้นที่เริ่มต้นกับบิตซึ่งหมายถึง 0 หรือ1. อาจเป็นได้จัดกลุ่มเป็นไบต์เพื่อเป็นตัวแทนตัวอักษรตัวเลขหรือสัญลักษณ์ไบต์สามารถได้จัดกลุ่มเป็น ฟิลด์และฟิลด์ที่เกี่ยวข้องสามารถจัดกลุ่มเป็น
สร้างบันทึก ฟอร์ม ไฟล์และไฟล์ที่เกี่ยวข้องสามารถจัดเป็นฐานข้อมูล

PROBLEMS WITHTHETRADITIONAL

FILE ENVIRONMENT
•ข้อมูลซ้ำซ้อนและไม่สอดคล้องกันความซ้ำซ้อนของข้อมูลคือการมีข้อมูลซ้ำในระบบไฟล์ข้อมูลหลายชุดเพื่อเก็บข้อมูลเดียวกันมากกว่าหนึ่งสถานที่หรือสถานที่ซึ่งนำไปสู่ของเสียทรัพยากรการจัดเก็บ
•ข้อมูลไม่สอดคล้องกันคือแอตทริบิวต์เดียวกันอาจมีค่าที่แตกต่างกันและยังนำโดยข้อมูลซ้ำซ้อน
•การใช้วิธีการแบบดั้งเดิมในการประมวลผลไฟล์ส่งเสริมพื้นที่ทำงานใน บริษัท เพื่อพัฒนาแอพพลิเคชั่นพิเศษ แต่ละแอ็พพลิเคชันต้องการไฟล์ข้อมูลที่ไม่ซ้ำกันซึ่งจะนำไปสู่ข้อมูลซ้ำซ้อนและไม่สอดคล้องกันการประมวลผลความไม่ยืดหยุ่นและการสูญเสียทรัพยากรที่จัดเก็บ
รูปที่ 6.2
•การพึ่งพาข้อมูลของโปรแกรม
•การพึ่งพาข้อมูลโปรแกรมหมายถึงการมีเพศสัมพันธ์ของข้อมูล
เก็บไว้ในไฟล์และโปรแกรมเฉพาะที่ต้องการอัปเดตและบำรุงรักษาไฟล์เหล่านั้นซึ่งจะมีการเปลี่ยนแปลงโปรแกรมต้องมีการเปลี่ยนแปลงข้อมูล ในไฟล์แบบดั้งเดิมสภาพแวดล้อมการเปลี่ยนแปลงใด ๆ ในโปรแกรมซอฟต์แวร์ได้ต้องการการเปลี่ยนแปลงข้อมูลที่เข้าถึงโดยโปรแกรมนั้นขาดความยืดหยุ่น
•ระบบไฟล์แบบดั้งเดิมสามารถจัดกำหนดการตามกำหนดเวลาได้
รายงานหลังจากความพยายามในการเขียนโปรแกรมที่กว้างขวาง แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความต้องการข้อมูลที่ไม่คาดคิดได้ทันเวลา
•การรักษาความปลอดภัยที่ไม่ดี
•การจัดการข้อมูลอาจไม่มีทางรู้ว่าใครกำลังเข้าถึงหรือเปลี่ยนแปลงองค์กรของคุณ ข้อมูลขาดการแบ่งปันข้อมูลและการใช้งาน
•หากผู้ใช้พบค่าที่แตกต่างกันของชิ้นส่วนเดียวกันข้อมูลในสองระบบที่แตกต่างกันพวกเขาอาจไม่ต้องการใช้ระบบเหล่านี้เนื่องจากไม่สามารถเชื่อถือความถูกต้องของข้อมูลได้

ฐานข้อมูลและฐานข้อมูลคืออะไร ระบบการจัดการ (DBMS)?
ฐานข้อมูลคือชุดของข้อมูลที่จัดให้บริการแอพพลิเคชันหลายอย่างได้ผลโดยรวมข้อมูลและการควบคุมข้อมูลที่ซ้ำซ้อน แทนที่จะเก็บข้อมูลไว้ในไฟล์แยกต่างหากสำหรับแต่ละแอ็พพลิเคชันข้อมูลจะปรากฏต่อผู้ใช้เป็นฐานข้อมูลเดียวที่เก็บไว้ในฐานข้อมูลเดียวบริการหลายโปรแกรม
•ระบบจัดการฐานข้อมูล (DBMS) เป็นซอฟต์แวร์ที่อนุญาตให้องค์กรสามารถรวมศูนย์ข้อมูลจัดการได้พวกเขาได้อย่างมีประสิทธิภาพและให้การเข้าถึงข้อมูลที่เก็บไว้โดยโปรแกรมประยุกต์ DBMS ทำหน้าที่เป็นอินเทอร์เฟซระหว่างโปรแกรมประยุกต์กับไฟล์ข้อมูลทางกายภาพ

DBMS แก้ปัญหาของสภาพแวดล้อมของไฟล์แบบดั้งเดิม?
• DBMS ช่วยลดความซ้ำซ้อนของข้อมูลและความไม่สอดคล้องกันโดยการเปิดใช้งานองค์กรการจัดการข้อมูลการใช้และความปลอดภัยจากส่วนกลาง ตลอดองค์กรได้ง่ายขึ้นเนื่องจากข้อมูลถูกนำเสนอต่อผู้ใช้ว่าอยู่ในโสดสถานที่มากกว่าการแยกส่วนในระบบและไฟล์ที่แตกต่างกัน ที่แสดงนี่คือมุมมองที่เป็นไปได้ 2 ข้อซึ่งเป็นประโยชน์สำหรับผู้เชี่ยวชาญด้านประโยชน์และหนึ่งในดอกเบี้ยให้กับสมาชิกของแผนกบัญชีเงินเดือนของ บริษัท
รูปที่ 6.3


ทำไม DBMS เชิงสัมพันธ์จึงเป็นเช่นนั้นที่มีประสิทธิภาพ?
ประเภท DBMS ที่เป็นที่นิยมที่สุดในปัจจุบันสำหรับเครื่องพีซีเช่นเดียวกับสำหรับคอมพิวเตอร์ขนาดใหญ่และเมนเฟรมเป็นเรื่องเกี่ยวกับ
DBMSฐานข้อมูลเชิงสัมพันธ์แสดงข้อมูลเป็นแบบสองมิติตาราง (เรียกว่าความสัมพันธ์)
•ตารางหรือความสัมพันธ์อาจเรียกว่าไฟล์ แต่ละตารางมีข้อมูลเกี่ยวกับเอนทิตีและแอตทริบิวต์
• Microsoft Access เป็น DBMS เชิงสัมพันธ์สำหรับเดสก์ท็อปในขณะที่ DB2, Oracle Database และ Microsoft SQL Server เป็น DBMS เชิงสัมพันธ์สำหรับเมนเฟรมขนาดใหญ่และคอมพิวเตอร์ขนาดกลาง MySQL เป็นโอเพนซอร์สที่ได้รับความนิยม DBMS
•ฐานข้อมูลเชิงสัมพันธ์จัดการข้อมูลในรูปแบบ 2 ตารางมิติ ภาพประกอบที่นี่คือตารางสำหรับเอนทิตี SUPPLIER และ PART แสดงให้เห็นว่าพวกเขาเป็นตัวแทนของแต่ละองค์กรอย่างไรและคุณลักษณะของมัน Supplier Number เป็นคีย์หลักสำหรับตาราง SUPPLER และคีย์ต่างประเทศสำหรับตาราง PART

รูปที่ 6.4


ฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์และฐานข้อมูลในระบบคลาวด์
•กว่า 30 ปีเทคโนโลยีฐานข้อมูลเชิงสัมพันธ์ได้เป็นมาตรฐานทองคำ
• Cloud computing ปริมาณข้อมูลเป็นประวัติการณ์มหาศาลปริมาณงานสำหรับบริการเว็บ บริษัท หันมา "NoSQL" ไม่ใช่ฐานข้อมูลเชิงสัมพันธ์สำหรับเทคโนโลยีนี้วัตถุประสงค์.
•ใช้ระบบการจัดการฐานข้อมูลเชิงสัมพันธ์แบบจำลองข้อมูลมีความยืดหยุ่นมากขึ้นและได้รับการออกแบบสำหรับการจัดการชุดข้อมูลขนาดใหญ่ในเครื่องกระจายหลายเครื่องและสำหรับปรับขนาดได้ง่ายขึ้นหรือลงพวกเขามีประโยชน์สำหรับการเร่งแบบสอบถามง่ายๆกับไดรฟ์ข้อมูลขนาดใหญ่ที่มีโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง, includingWeb, สื่อสังคมออนไลน์, กราฟิก,และข้อมูลอื่น ๆ ที่ยากต่อการวิเคราะห์ด้วยเครื่องมือ SQL แบบดั้งเดิม
•มีฐานข้อมูล NoSQL หลายแบบ
แต่ละคนมีคุณสมบัติและพฤติกรรมทางเทคนิคของตัวเอง คำพยากรณ์ฐานข้อมูล NoSQL เป็นตัวอย่างหนึ่งเช่นเดียวกับของ Amazon SimpleDB หนึ่งในบริการแอมซาโมไซต์ที่ทำงานอยู่เมฆSimpleDB ให้บริการเว็บแบบง่ายๆ อินเทอร์เฟซเพื่อสร้างและเก็บข้อมูลหลายชุดแบบสอบถามข้อมูลได้อย่างง่ายดายและส่งกลับผลลัพธ์ไม่จำเป็นต้องมีก่อนกำหนดโครงสร้างฐานข้อมูลที่เป็นทางการหรือเปลี่ยนที่หากมีการเพิ่มข้อมูลใหม่ในภายหลัง
•บริการจัดการข้อมูลบนระบบคลาวด์มีความพิเศษอุทธรณ์สำหรับ Web-based เริ่มต้นหรือขนาดเล็กหรือขนาดกลาง -ธุรกิจขนาดใหญ่ที่ต้องการความสามารถด้านฐานข้อมูลที่ต่ำกว่าราคากว่าผลิตภัณฑ์ฐานข้อมูลในบ้าน

ความสามารถของฐานข้อมูล 
ระบบการจัดการ
• DBMS มีความสามารถและเครื่องมือในการจัดการ,การจัดการและการเข้าถึงข้อมูลในฐานข้อมูลที่สำคัญที่สุดคือข้อมูลภาษาข้อมูลของข้อมูลพจนานุกรมและข้อมูลการจัดการภาษา
•การสืบค้นและการรายงาน
DBMS มีเครื่องมือสำหรับการเข้าถึงและจัดการข้อมูลในฐานข้อมูลภาษาจัดการข้อมูลใช้เพื่อเพิ่มเปลี่ยนแปลงลบและดึงข้อมูลเข้าฐานข้อมูล

รูปที่ 6.7


Normalization and Entity Relationship Diagrams
•การออกแบบฐานข้อมูลฐานข้อมูลต้องการทั้งการออกแบบแนวความคิดและทางกายภาพdesign.The การออกแบบแนวความคิดหรือตรรกะของฐานข้อมูลคือรูปแบบนามธรรมของฐานข้อมูลจากมุมมองทางธุรกิจ,ขณะที่การออกแบบทางกายภาพแสดงให้เห็นว่าฐานข้อมูลเป็นอย่างไร จริงๆจัดในอุปกรณ์จัดเก็บข้อมูลเข้าถึงโดยตรงการสร้างมาตรฐานเป็นกระบวนการที่มีขนาดเล็กและมีเสถียรภาพโครงสร้างข้อมูลที่ยืดหยุ่นและปรับตัวได้จากกลุ่มที่ซับซ้อนของข้อมูลเรียกว่า
•แผนภาพความสัมพันธ์เอนทิตี (ERD) เป็นรูปแบบข้อมูลที่นักออกแบบฐานข้อมูลจัดทำเอกสารแบบข้อมูลของตน ERแผนผังแสดงความสัมพันธ์ระหว่างหน่วยงานต่างๆในระบบฐานข้อมูล

รูปที่ 6.9,6.10

สิ่งที่เป็นเครื่องมือหลักและเทคโนโลยีสำหรับการเข้าถึงข้อมูลจากฐานข้อมูลไปยังปรับปรุงประสิทธิภาพของธุรกิจและการตัดสินใจ?
•ธุรกิจใช้ฐานข้อมูลของตนเพื่อติดตามพื้นฐานการทำธุรกรรมและยังต้องมีฐานข้อมูลเพื่อให้ข้อมูลที่จะช่วยให้ บริษัท ดำเนินธุรกิจได้อย่างมีประสิทธิภาพและช่วยให้ผู้บริหารและพนักงานสามารถตัดสินใจได้ดียิ่งขึ้น
•ข้อมูลส่วนใหญ่ที่เก็บรวบรวมโดยองค์กรที่เคยทำธุรกรรมข้อมูลที่สามารถพอดีกับแถวและคอลัมน์ของ relational ได้อย่างง่ายดาย
ระบบการจัดการฐานข้อมูลขณะนี้เรากำลังเป็นพยานการระเบิดของข้อมูลจากการเข้าชมเว็บอีเมลและสังคมเนื้อหาสื่อ
(ทวีตข้อความสถานะ) หรือจากอิเล็กทรอนิกส์
ระบบการซื้อขาย
•ข้อมูลเหล่านี้อาจไม่มีโครงสร้างหรือกึ่งโครงสร้างและดังนั้นไม่เหมาะสำหรับผลิตภัณฑ์ฐานข้อมูลเชิงสัมพันธ์ที่จัดระเบียบข้อมูลในรูปแบบของคอลัมน์และแถว

ความท้าทายของข้อมูลขนาดใหญ่
•ตอนนี้เราใช้ข้อมูลขนาดใหญ่เพื่ออธิบายชุดข้อมูลเหล่านี้พร้อมกับไดรฟ์ข้อมูลขนาดใหญ่ที่พวกเขาอยู่นอกเหนือความสามารถของ DBMS ทั่วไปในการจับภาพเก็บและวิเคราะห์
ข้อมูลขนาดใหญ่มักหมายถึงข้อมูลใน petabyte และ exabyte อีกนัยหนึ่งคือพันล้านถึงพันล้านเรคคอร์ดทั้งหมดแหล่งที่มาที่แตกต่างกัน ข้อมูลขนาดใหญ่มีขนาดใหญ่ขึ้นปริมาณและมากขึ้นอย่างรวดเร็วกว่าข้อมูลแบบดั้งเดิม
ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยได้
รูปแบบและความผิดปกติที่น่าสนใจมากกว่าชุดข้อมูลที่มีขนาดเล็ก,
มีศักยภาพในการให้ข้อมูลเชิงลึกใหม่แก่ลูกค้าพฤติกรรม, รูปแบบสภาพอากาศ, กิจกรรมทางการตลาดทางการเงินหรืออื่น ๆปรากฏการณ์
ธุรกิจมีความสนใจในข้อมูลขนาดใหญ่เนื่องจากสามารถเปิดเผยได้รูปแบบอื่น ๆ และความผิดปกติที่น่าสนใจที่มีศักยภาพ
ให้ข้อมูลเชิงลึกใหม่ในพฤติกรรมของลูกค้า, รูปแบบสภาพอากาศ,
กิจกรรมตลาดการเงินหรือปรากฏการณ์อื่น ๆ


ระบบธุรกิจอัจฉริยะโครงสร้างพื้นฐาน
•คลังข้อมูลและ Data Marts คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์ที่น่าสนใจที่อาจเกิดขึ้นกับผู้มีอำนาจตัดสินใจตลอดคลังสินค้าคลังสินค้าสารสกัดจากข้อมูลข้อมูลปัจจุบันและประวัติจากการดำเนินงานหลายระบบและปรับโครงสร้างข้อมูลเพื่อการจัดการการรายงานและการวิเคราะห์
•ดาต้ามาร์ทเป็นเซตย่อยของคลังข้อมูลซึ่งประกอบด้วยสรุปหรือเน้นมากของข้อมูลขององค์กรจะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
• Hadoop
• Hadoop เป็นซอฟต์แวร์โอเพ่นซอร์สที่จัดการโดย Apache Software Foundation ที่ให้การกระจายประมวลผลข้อมูลจำนวนมากในราคาไม่แพงคอมพิวเตอร์ มันแบ่งปัญหาข้อมูลขนาดใหญ่ลงไปย่อย ปัญหากระจายไปในหมู่ถึงหลายพันคนโหนดการประมวลผลทาคอมพิวเตอร์ราคาไม่แพงและรวมกันแล้วผลลัพธ์เป็นชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
•คอมพิวเตอร์ในหน่วยความจำ
•การประมวลผลในหน่วยความจำช่วยให้ชุดข้อมูลมีขนาดใหญ่มาก
ข้อมูลที่มีขนาดเท่ากับข้อมูลของข้อมูลหรือข้อมูลขนาดเล็กคลังสินค้าเพื่ออาศัยอยู่ในหน่วยความจำทั้งหมด ธุรกิจที่ซับซ้อนการคำนวณที่ใช้เวลาหลายชั่วโมงหรือหลายวันสามารถทำได้เสร็จสมบูรณ์ภายในไม่กี่วินาทีและนี้ยังสามารถทำได้บนอุปกรณ์มือถือ(ดูเซสชันเชิงโต้ตอบเกี่ยวกับเทคโนโลยี)
โครงสร้างพื้นฐานทางธุรกิจอัจฉริยะที่มีอยู่ในปัจจุบันความสามารถและเครื่องมือในการจัดการและวิเคราะห์ปริมาณมากและข้อมูลประเภทต่างๆจากหลายแหล่ง ง่ายต่อการใช้เครื่องมือค้นหาและรายงานสำหรับผู้ใช้ทางธุรกิจแบบสบาย ๆ และอื่น ๆ อีกมากมาย
เครื่องมือการวิเคราะห์ที่มีความซับซ้อนสำหรับผู้ใช้ไฟฟ้าจะถูกรวมไว้

รูปที่ 6.12


เครื่องมือวิเคราะห์: ความสัมพันธ์,รูปแบบแนวโน้ม
•เครื่องมือวิเคราะห์ที่มีรายละเอียดเพิ่มเติมเกี่ยวกับระบบธุรกิจอัจฉริยะการวิเคราะห์และการใช้งานมีดังนี้:
•การประมวลผลแบบออนไลน์(OLAP)
OLAP สนับสนุนการวิเคราะห์ข้อมูลแบบหลายมิติ เพื่อดูข้อมูลเดียวกันในรูปแบบต่างๆโดยใช้หลายรายการ มิติ (รูปที่ 6.13) แสดงแบบจำลองหลายมิติที่สามารถสร้างขึ้นเพื่อเป็นตัวแทนของผลิตภัณฑ์, ภูมิภาค, ยอดขายจริง,และยอดขายที่คาดการณ์ไว้
•การทำเหมืองข้อมูล
•การทำเหมืองข้อมูลทำให้ข้อมูลเชิงลึกเกี่ยวกับข้อมูลของ บริษัท ไม่สามารถทำได้จะได้รับกับ OLAP โดยค้นหารูปแบบที่ซ่อนอยู่และ
ความสัมพันธ์ในฐานข้อมูลขนาดใหญ่และอนุมานกฎจากพวกเขา
เพื่อคาดการณ์พฤติกรรมในอนาคตรูปแบบและกฎระเบียบที่ใช้ในการ
แนะนำการตัดสินใจและคาดการณ์ผลกระทบของพวกเขาการตัดสินใจ จากการทำเหมืองข้อมูล ได้แก่ ความสัมพันธ์, ลำดับ,การจัดกลุ่มกระจุกดาวและการคาดการณ์
•การทำเหมืองข้อความและการทำเหมืองบนเว็บ
เครื่องมือการทำเหมืองข้อความมีอยู่ในปัจจุบันเพื่อช่วยวิเคราะห์ธุรกิจ
ข้อมูลขนาดใหญ่เครื่องมือเหล่านี้สามารถดึงองค์ประกอบสำคัญจาก
ชุดข้อมูลขนาดใหญ่ที่ไม่มีโครงสร้าง, ค้นพบรูปแบบและความสัมพันธ์และสรุปข้อมูล
•การทำเหมืองบนเว็บช่วยให้ธุรกิจเข้าใจพฤติกรรมของลูกค้า
ประเมินประสิทธิผลของเว็บไซต์ specificWeb หรือหาจำนวน
ความสำเร็จของแคมเปญการตลาด ตัวอย่างเช่นนักการตลาด
ใช้บริการGoogleTrendsและ Google Insights for Search,

รูปที่ 6.13


ฐานข้อมูลและเว็บ
•หลาย บริษัท ใช้เว็บเพื่อทำข้อมูลบางอย่างในฐานข้อมูลภายในที่มีให้สำหรับลูกค้าและธุรกิจพาร์ทเนอร์
•ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ DBMS อาศัยอยู่โดยเฉพาะคอมพิวเตอร์ที่เรียกว่าเซิร์ฟเวอร์ฐานข้อมูล DBMS ได้รับ SQL
ร้องขอและให้ข้อมูลที่จำเป็น การโอน Middlewareข้อมูลจากฐานข้อมูลภายในขององค์กรกลับไปที่เว็บเซิร์ฟเวอร์สำหรับการจัดส่งในรูปแบบของเว็บ aWeb ให้กับผู้ใช้
รูปที่ 6.14















ไม่มีความคิดเห็น:

แสดงความคิดเห็น

sss