การทำเหมืองข้อมูล (data mining) หรือรู้จักกันดีในนามการค้นพบความรู้ในฐานข้อมูล (knowledge discovery in database) เป็นกิจกรรมที่สะกัดเอาสารสนเทศ โดยมีเป้าหมายเป็นความรู้ใหม่ และความจริงบางอย่างจากฐานข้อมูลขนาดใหญ่
การทำเหมืองข้อมูลใช้เครื่องมือที่หลากหลายกว้างขวาง เช่นสถิติ การเรียนรู้เรื่องการทำงานอัตโนมัติ การจำลองแบบ เทคโนโลยีฐานข้อมูล ความฉลาดปัญญาประดิษฐ์ ที่มองเห็นเข้าใจได้
นับตั้งแต่มีการนำคอมพิวเตอร์มาใช้จัดการข้อมูล ในทางธุรกิจได้ให้นิยามไว้ว่ากระบวนการทีสะกัดสารสนเทศที่มีอยู่จากฐานข้อมูลขนาดใหญ่ แต่ไม่ทราบว่าสามารถเข้าใจได้และนำไปใช้ได้ แล้วนำไปใช้ในการตัดสินใจทางธุรกิจแบบฉบับ การทำเหมืองข้อมูลจึงเป็นแนวคิดในทางธุรกิจเป็นวิธีการหาสารสนเทศที่มีประโยชน์ เช่นสามารถหาได้ว่าลูกค้ามาซื้อสิ้นค้าใดพร้อมๆ กันมากที่สุด ซื้อสิ้นค้าใดควบคู่กับซื้อสินค้าใดเสมอ ปริบททางการค้าเป็นจุดเริ่มต้นที่จัดทำกันและขยายผลไปทางวิทยาศาสตร์ เช่นจากฐานข้อมูลสิ่งพิมพ์ของนักวิทยาศาสตร์
ในทางปฏิบัติการทำเหมืองข้อมูลใช้วิธีการที่แตกต่างกันขึ้นอยู่กับชนิดของข้อมูล และการกำหนดวัตถุประสงค์ หลักการที่ใช้ซึ่งยังมีงานอีกมากในการหากระบวนการที่เป็นมาตรฐานในสถานะการและสิ่งแวดล้อมที่แตกต่างกัน ยิ่งกว่านั้นก็คือเนื้อหาข้อมูลที่ได้รับการรวบรวมมาเป็นองค์ประกอบสำคัญในการวิเคราะห์ใดๆ
กระบวนการในการทำเหมืองข้อมูลโดยทั่วไป
1. การจัดข้อมูล (captured data) มีการบูรณาการจัดระบบในแนวกว้าง ในรูปของคลังเก็บหรือ data warehouse
2. การทำเหมืองจาก warehouse
3. การจัดระบบและนำเสนอของเหมืองสารสนเทศ ที่จะให้เข้าใจได้
จากนิยามของการทำเหมืองในการแยกสารสนเทศที่ไม่ทราบแต่มีอยู่ตามกระบวนการเก็บข้อมูลที่ผ่านมา กระบวนการในการทำเหมืองจะมี 2 แนวทางคือ verification driven ที่ทำการตรวจสอบ ตามข้อตกลง สมมุติฐานโดยผู้ใช้ อีกแนวทางหนึ่งคือ discovery driven ที่จะทำให้ค้นพบสารสนเทศได้อย่างอัตโนมัติ โดยมีเครื่องมือที่เหมาะสม
ไม่มีความคิดเห็น:
แสดงความคิดเห็น