คำว่า Data Virtualization นี้ก็ถือว่าเป็นศัพท์เฉพาะที่ยังไม่เป็นที่แพร่หลายนัก เพราะบริษัท Composite Software ที่ถูกซื้อมาและถูกเปลี่ยนชื่อเป็น Cisco Information Server หรือ CIS เป็นผู้คิดค้นขึ้นมาและพัฒนาต่อเนื่องมาเป็นระยะเวลายาวนานกว่า 10 ปี
ถ้าอธิบายสั้นๆ ในเชิงธุรกิจ Data Virtualization คือเทคโนโลยีที่จะช่วยให้องค์กรสามารถนำข้อมูลทั้งหมดมาใช้งานแบบศูนย์กลางได้ หรือเรียกว่าการทำ Data Integration โดยไม่ต้องทำ Data Warehouse หรือ Big Data ในขณะที่ประสิทธิภาพการทำงานของระบบนี้ก็จะต้องมีความรวดเร็วสูง สามารถตอบโจทย์การวิเคราะห์ข้อมูลจากฐานข้อมูล หรือแหล่งข้อมูลที่หลากหลายได้จากศูนย์กลาง ทำให้องค์กรสามารถนำข้อมูลไปวิเคราะห์ได้อย่างรวดเร็ว ง่ายดาย และยืดหยุ่น โดยประหยัดค่าใช้จ่ายกว่าการทำ Data Warehouse หรือ Big Data นั่นเอง
ในมุมมองเชิงเทคนิค สิ่งที่ Data Virtualization ทำ ก็คือระบบ Query Engine ที่สามารถเข้าถึงข้อมูลจากทุกฐานข้อมูลและทุกแหล่งข้อมูลได้ และแปลงให้ข้อมูลที่กระจัดกระจายเหล่านั้นสามารถถูก Query ขึ้นมาใช้งานพร้อมๆ กันได้เสมือนถูกจัดเก็บอยู่ในฐานข้อมูลเดียว ทั้งในรูปแบบของ SQL, Web Services, Messaging หรือ Hadoop รวมถึงระบบฐานข้อมูลสำหรับระบบ ERP ชั้นนำอย่าง SAP เพื่อให้องค์กรต่างๆ สามารถพัฒนา Analytic Software หรือ Front-end Application สำหรับตอบโจทย์การวิเคราะห์ข้อมูลได้อย่างอิสระ และยังมีความรวดเร็วในระดับเดียวกับการ Query SQL Database ด้วย Query Optmization Algorithm หลากหลาย ผสมกับเทคนิคต่างๆ เช่น การทำ Caching เพื่อให้การเข้าถึงข้อมูลเหล่านั้นมีความเร็วสูงสุด และส่งผลกระทบต่อประสิทธิภาพของระบบ Production ทั้งหมดน้อยทีสุดไปพร้อมๆ กันด้วย
Data Virtualization ต่างจาก Big Data อย่างไร
ในมุมมองของการวิเคราะห์ข้อมูล ผลลัพธ์ที่ได้อาจจะไม่แตกต่างกันมากนักสำหรับระบบ Data Virtualization และ Big Data แต่ในมุมมองของการ Deploy ระบบวิเคราะห์ข้อมูลนั้น การทำ Big Data จะต้องมีการ Migrate ข้อมูลจากแหล่งต่างๆ มาจัดเก็บรวมกันแบบศูนย์กลางภายในระบบ Big Data ก่อนจะนำข้อมูลทั้งหมดเหล่านั้นมาวิเคราะห์ ในขณะที่การทำ Data Virtualization จะทำให้องค์กรสามารถข้ามขั้นตอนเหล่านี้ไปได้ทั้งหมดเลย ด้วยการใช้ Resource เดิมที่มีอยู่ ร่วมกับระบบ Data Virtualization เพื่อ Query ข้อมูลจากฐานข้อมูลและแหล่งข้อมูลเดิมทั้งหมดแทน
สิ่งที่ทำให้ Cisco มั่นใจว่า Data Virtualization จะสามารถช่วยองค์กรได้ นอกจากความรวดเร็วที่จะทำให้แต่ละองค์กรสามารถไปถึงเป้าหมายในการทำ Enterprise Data Analytics ได้ทันเวลาของตลาดแล้ว เทคโนโลยีนี้ยังช่วยองค์กรลดการลงทุนทางด้าน Infrastructure ลงอย่างมหาศาล เพราะองค์กรที่ต้องการวิเคราะห์ข้อมูลจำนวนมากในระดับของ Big Data Analtyics ไม่จำเป็นจะต้องลงทุนกับระบบ Storage ขนาดใหญ่มากอีกต่อไป และลดค่าใช้จ่ายในการ Migrate หรือ Transform ข้อมูลทั้งหมดออกไปได้ด้วยเช่นกัน
สำหรับบางกรณีที่จำเป็นจะต้องใช้ Big Data การทำ Data Virtualization ควบคู่ไปด้วย ก็จะช่วยเพิ่มความเร็วทั้งภาพรวมของโครงการ และความเร็วในการ Query ข้อมูลให้สูงขึ้น ด้วยการทำให้องค์กรเลือกนำเฉพาะข้อมูลที่จำเป็นไปเก็บในระบบ Big Data เท่านั้น และการใช้งานระบบฐานข้อมูลที่มีอยู่ ร่วมกับ Big Data ผ่านการ Query จากศูนย์กลางก็จะทำได้อย่างง่ายดาย
Data Virtualization เหมาะกับใคร?
สำหรับองค์กรที่ยังมีข้อมูลจำนวนไม่มากนัก Data Virtualization อาจจะยังไม่จำเป็น แต่สำหรับองค์กรขนาดใหญ่ที่มีแผนจะทำระบบ Enterprise Data Analytics นั้น Data Virtualization ถือเป็นอีกหนึ่งเทคโนโลยีที่ควรศึกษาและพิจารณาควบคู่ไปกับการทำ Big Data เพื่อดูว่าระบบที่ต้องการนั้น เหมาะกับการใช้ Data Virtualization เป็นหลัก หรือเหมาะกับการใช้ Big Data เป็นหลัก หรือเหมาะกับการใช้ทั้งสองเทคโนโลยีควบคู่กันไป โดยสรุปแล้ว Data Virtualization จะมีประโยชน์ดังต่อไปนี้
- สามารถรวมฐานข้อมูลและแหล่งข้อมูลหลากหลาย ให้ Query จากศูนย์กลางด้วยวิธีการที่ต้องการได้อย่างง่ายดาย
- สามารถใช้งานข้อมูลจากหลายแหล่งได้แบบ Real-time โดยไม่ต้องเสียเวลาทำการ Migrate หรือ Transform ข้อมูล
- สามารถเข้าถึงข้อมูลจำนวนมากได้ด้วยความเร็วสูง
- รองรับการนำไปใช้งานได้หลากหลาย
- สามารถกำหนดสิทธิ์การเข้าถึงข้อมูลได้หลากหลายระดับสำหรับผู้ใช้งานแต่ละคนได้
- มีระบบ Self Service ทำให้ผู้ที่ต้องวิเคราะห์ข้อมูลสามารถทำงานร่วมกันได้อย่างรวดเร็ว
- รองรับการเพิ่มขยายระบบให้มีขนาดใหญ่ขึ้นได้ตามต้องการ
ทั้งนี้ในมุมมองของ Cisco เองนั้น ไม่ว่าปลายทางแล้วองค์กรต่างๆ จะเลือกใช้ Data Virtualization หรือ Big Data ก็ตาม ทาง Cisco ก็พร้อมจะตอบรับทั้งสองความต้องการด้วยเทคโนโลยีที่มีอยู่ และวิศวกรมากประสบการณ์