วันจันทร์ที่ 15 ตุลาคม พ.ศ. 2555

โครงงานวิจัยระดับปริญญาตรี1



บทที่ 1
บทนำ

1.1  ความเป็นมาและความสำคัญของปัญหา
 เทคโนโลยีปัจจุบันนี้ได้ก้าวหน้าไปอย่างมากมายไม่ว่าจะเป็นความเร็ว ประสิทธิภาพของคอมพิวเตอร์ที่เพิ่มขึ้นแต่ก่อนมาก การจัดเก็บข้อมูลที่มีอยู่มากมาย (DBMS) ทำให้ฐานข้อมูลนั้นมีขนาดใหญ่ขึ้นเรื่อยๆ แต่กลับไม่สามารถเอาข้อมูลที่เก็บนำมาใช้ให้เกิดประโยชน์สูงสุดได้ การทำเหมืองข้อมูลคือกระบวนการที่กระทำกับข้อมูลจำนวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทำเหมืองข้อมูลได้ถูกนำไปประยุกต์ใช้ในงานหลายประเภท ทั้งด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม
 การทำเหมืองข้อมูลเป็นข้อมูลเป็นขั้นตอนย่อยที่สำคัญของการค้นหาความรู้ (knowledge discovering) อันเป็นหนึ่งในกระบวนการจัดการความรู้ (ค้นหา จัดเก็บ เผยแพร่ และนำความรู้ไปใช้) โดยมีจุดมุ่งหมายเพื่อวิเคราะห์ชุดของข้อมูลหรือสารสนเทศที่ต้องการเพื่อแสวงหารูปแบบความสัมพันธ์ของข้อมูลแบบใหม่ๆที่เป็นประโยชน์เด่นชัด เทคนิคการทำเหมืองข้อมูลถูกนำมาใช้ในการค้นหาความรู้และรูปแบบความสัมพันธ์ของข้อมูลแบบใหม่ๆที่เป็นประโยชน์เด่นชัด เทคนิคการทำเหมืองข้อมูลถูกนำมาใช้ในการค้นหาความรู้และรูปแบบความสัมพันธ์ของข้อมูลแบบใหม่ๆ ทั้งทางด้านธุรกิจที่ใช้ในการบริหารจัดการการโฆษณาสินค้าเพื่อเจาะจงกลุ่มเป้าหมายในการโฆษณาและด้านการศึกษาการบริหารด้านต่างๆ ในระดับอุดมศึกษา ในระดับมหาวิทยาลัย
          การบริหารการศึกษาของคณบดีในระดับคณะ มหาวิทยาลัยเทคโนโลยีราชมงคลตะวันออก วิทยา-เขตจักรพงษภูวนารถ มีการจัดการบริหารงานที่เป็นการรับฟังปัญหาจากบุคคลต่างๆ และคณบดีก็รับเอกสารจากเจ้าหน้าที่มาเพื่อวิเคราะห์และตัดสินใจในเรื่องต่างๆ มีการประชุมปรึกษาหารือกัน

ในเรื่องของ ประชุมโครงการ งานวิจัย การเลือนขั้นเงินเดือน ปัญหาทางด้านวิชาการ เรื่องโหลดขั้นต่ำในการสอน เรื่องห้อง เรื่องการสรรหาหัวหน้าสาขา เรื่องการรับนักศึกษา  เรื่องการเทียบโอนหน่วยกิตสถาบันต่างๆ  หรืออาจจะเป็นการประชุมระดับวิทยาเขตก็ต้องมีการเสนอแนวทางนโยบายในการบริหารงานคณะ ฯลฯ ต่างมีปัญหาเกิดขึ้นมากมาย ปัญหาที่เกิดขึ้นอาจจะมีบางส่วนที่เป็นปัญหาที่ต้องแก้ไขเฉพาะหน้าแต่สิ่งที่ต้องแก้ไขปัญหาต้องแก้ไขปัญหาแบบยั่งยืน มองไปที่ฐานของปัญหาถึงจะแก้ไขปัญหานั้นได้อย่างจริงจัง และคณะเองก็ยังไม่มีเทคโนโลยี ระบบ หรือเครื่องมือที่จะช่วยให้การตัดสินใจได้อย่างถูกต้องมีหลักเกณฑ์ที่เป็นที่น่าเชื่อถือได้
          การทำเหมืองข้อมูลเพื่อค้นหาความสัมพันธ์ของการบริหารจัดการคณะ ของมหาวิทยาลัยเทคโนโลยีราชมงคลตะวันออก วิทยาเขตจักรพงษภูวนารถ โดยใช้โมเดลต่างๆ ได้แก่ การจัดหมวดหมู่ของข้อมูล การสร้างความสัมพันธ์ของข้อมูล การจัดกลุ่มของข้อมูล
          จากรายละเอียดที่กล่าวมาข้างต้นผู้จัดทำจึงได้มีแนวคิดว่าควรมุ่งเน้นไปที่ประเด็นในส่วนงานที่เกี่ยวข้องกับนักศึกษา  โดยแตกประเด็นกับงานที่เกี่ยวข้องกับนักศึกษาเป็นสามประเด็นย่อย คือ        
          1.  สร้างกฎความสัมพันธ์ของปัจจัยที่ส่งผลให้นักศึกษาเรียนไม่จบตามหลักสูตร  โดยใช้โมเดล Associate อัลกอริทึม Apriori ในการหากฎความสัมพันธ์ของปัจจัยต่างๆ 
          2. พยากรณ์เปอร์เซ็นต์ของนักศึกษาที่มีปัญหาในการเรียน ส่งผลให้เรียนไม่จบตามหลักสูตร โดยใช้โมเดล Classify อัลกอริทึมที่เลือกมาจับคือ Decision tree : J48 ในการพยากรณ์เปอร์เซ็นต์ของนักศึกษาที่ไม่จบตามหลักสูตร
          3. วิเคราะห์ความสัมพันธ์ของข้อมูลนักศึกษาที่จบการศึกษาแล้วได้รับเกียรตินิยม โดยใช้โมเดล Associate อัลกอริทึม Apriori ในการหากฎความสัมพันธ์ของข้อมูล  และจัดทำเป็นวิจัยที่มีชื่อว่า  “การวิเคราะห์ปัจจัยที่เกี่ยวข้องกับนักศึกษา เพื่องานด้านบริหารระดับคณะ ด้วยเทคนิค Data mining กรณีศึกษา คณะบริหารธุรกิจและเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีราชมงคลตะวันออก วิทยาเขตจักรพงษภูวนารถ”

1.2  วัตถุประสงค์ของการศึกษา
          1.2.1  เพื่อพัฒนาระบบสำหรับกระบวนการ Preprocessing Data
          1.2.2  เพื่อพัฒนา “ระบบวิเคราะห์ปัจจัยที่เกี่ยวข้องกับนักศึกษา เพื่องานด้านบริหารระดับคณะ”

1.3  สมมติฐานทางการวิจัย
          1.3.1  ประสิทธิภาพของระบบสำหรับกระบวนการ Preprocessing Data มีประสิทธิภาพด้านความถูกต้องในการทำงานเกิน 80 %
          1.3.2  ประสิทธิภาพของระบบวิเคราะห์ปัจจัยที่เกี่ยวข้องกับนักศึกษามีประสิทธิภาพเกิน 80%

1.4  ขอบเขตการวิจัย
          1.4.1  ขอบเขตการศึกษาข้อมูลสำหรับทำวิจัย
              1.4.1.1  ศึกษาโมเดลต่างๆ ได้แก่ การจัดหมวดหมู่ของข้อมูล การสร้างความสัมพันธ์ของข้อมูล การจัดกลุ่มของข้อมูล สำหรับการทำเหมืองข้อมูล
                      1.4.1.1  ศึกษาข้อมูลของนักศึกษา คณะบริหารธุรกิจและเทคโนโลยีสารสนเทศ 
          1.4.2  เครื่องมือที่ใช้ในการทดลอง
                      1.4.2.1  คอมพิวเตอร์โน้ตบุ๊คจำนวน 1 เครื่อง
·       หน่วยประมวลผลกลาง (CPU) เอเอ็มดี อี-350 (AMD E-350) 1.60 กิกะเฮิรตซ์ (GHz)
·       หน่วยความจำหลัก (RAM)  4 กิกะไบต์ (GB)
·       พื้นที่จัดเก็บข้อมูล (Disk space) 500 กิกะไบต์ (GB)
1.4.2.2  เครื่องมือที่ใช้หากฎความสัมพันธ์  คือ โปรแกรมวีก้า (weka)  
1.4.2.3  ระบบปฏิบัติการ (OS) วินโดวส์เซเว่น (Windows 7)
1.4.2.4  โปรแกรมสร้างฐานข้อมูล ด้วย MySql
1.4.2.5  โปรแกรมสร้างเว็บแอปพลิเคชั่น
·       ภาษา PHP
·       เครื่องมือที่ใช้พัฒนาเว็บแอพพลิเคชั่น โปรแกรม Dreamweaver
                      1.4.2.5  ข้อมูลที่ใช้สำหรับทำเหมืองข้อมูลได้แก่ ฐานข้อมูลระบบทะเบียนของมหาวิทยาลัยเทคโนโลยีราชมงคลตะวันออก วิทยาเขตจักรพงษภูวนารถ ย้อนหลัง 8 ปี

          1.4.3  ประชากรที่ใช้ทดสอบระบบ
                      1.4.3.1  ผู้เชี่ยวชาญทางด้านระบบสารสนเทศ จำนวน 5 คน
          1.4.4  ขอบเขตการทำงานของผู้เกี่ยวข้องกับระบบ
                      1.4.4.1  ผู้ดูแลระบบ
·       Import ข้อมูลพื้นฐานที่เกี่ยวข้องในรูปแบบ Excel ไฟล์ได้
·       สามารถใช้ระบบสำหรับกระบวนการ Preprocessing Data
                     1.4.4.1  คณบดี หรือ ผู้ใช้
·       สามารถดูปัจจัยที่ส่งผลให้นักศึกษาเรียนไม่จบตามหลักสูตร
·       สามารถดูข้อมูลพยากรณ์เปอร์เซ็นต์ของนักศึกษาเรียนไม่จบตามหลักสูตร จากองค์ความรู้ที่สกัดจาก data set หรือจากคำถามที่ต้องการทราบ
·       ดูข้อมูลการวิเคราะห์ความสัมพันธ์ของข้อมูลนักศึกษาที่จบการศึกษาแล้วได้รับเกียรตินิยม

1.5  ขั้นตอนการดำเนินงาน
          1.5.1  จับประเด็นปัญหาที่ต้องการหาองค์ความรู้
          1.5.2  ศึกษาข้อมูลที่เกี่ยวข้องกับนักศึกษาหรือประเด็นปัญหาที่สนใจ
          1.5.3  ศึกษาและวิเคราะห์อัลกอริทึมที่จะนำมาใช้ในการหาผลลัพธ์ของประเด็นปัญหาที่สนใจ
          1.5.4  วิเคราะห์และออกแบบระบบสำหรับกระบวนการ Preprocessing Data
          1.5.5  วิเคราะห์และออกแบบแอพพลิเคชั่น “ระบบวิเคราะห์ปัจจัยที่เกี่ยวข้องกับนักศึกษา เพื่องานด้านบริหารระดับคณะ”
          1.5.6  การติดตั้งและทดสอบระบบ
          1.5.7  การประเมินประสิทธิภาพของระบบสำหรับกระบวนการ Preprocessing Data และ ประสิทธิภาพของระบบวิเคราะห์ปัจจัยที่เกี่ยวข้องกับนักศึกษา

1.6  ประโยชน์ของการวิจัย
          16.1  คณบดีสามารถดูปัจจัยที่ส่งผลนักศึกษาเรียนไม่จบตามหลักสูตร เพื่อเป็นข้อมูลในการตัดสินใจในการบริหารงานคณะ
          1.6.2  คณบดีสามารถดูข้อมูลเปอร์เซ็นต์ของนักศึกษาเรียนไม่จบหลักสูตร เพื่อเป็นข้อมูลในการตัดสินใจในการบริหารงานคณะ
          1.6.3  คณบดีสามารถดูปัจจัยที่ส่งผลให้บัณฑิตได้รับเกียรตินิยม จะได้นำไปบริหารและสนับสนุนให้ปัจจัยนั้นๆมากยิ่งขึ้น

1.7  นิยามศัพท์เฉพาะ
          1.7.1  เหมืองข้อมูล หมายถึง การสำรวจและวิเคราะห์ข้อมูลจำนวนมากเพื่อค้นหารูปแบบหรือความสัมพันธ์ที่ซ่อนอยู่ในข้อมูลขนาดใหญ่นั้น และนำความรู้ที่ค้นพบได้นั้นไปใช้ให้เกิดประโยชน์
          1.7.2  การจำแนกประเภทข้อมูล หมายถึง กระบวนการสร้างตัวแบบเพื่อจัดการข้อมูลให้อยู่ในกลุ่มที่กำหนดมาให้ โดยจะนำข้อมูลส่วนหนึ่งมาสอนให้ระบบเรียนรู้เพื่อจำแนกข้อมูลออกเป็นกลุ่มตามที่ได้กำหนดไว้ และนำข้อมูลส่วนที่เหลือจากข้อมูลสอนระบบมาใช้ทดสอบ
          1.7.3  การค้นหากฎความสัมพันธ์ หมายถึง การค้นหาความสัมพันธ์ของข้อมูลจาข้อมูลขนาดใหญ่ที่มีอยู่เพื่อช่วยในการวิเคราะห์และตัดสินใจในธุรกิจ
          1.7.4  เว็บแอพพลิเคชั่น คือ ตัวโปรแกรมของเว็บแอพพลิเคชั่นจะถูกติดตั้งไว้ที่เซิร์ฟเวอร์ (Server) คอยให้บริการกับไคลเอนต์ ( Client)  และที่ Client ก็ไม่ต้องติดตั้งโปรแกรมเพิ่มเติม สามารถใช้โปรแกรมประเภทเบราว์เซอร์( Brower)  ที่ติดมากับ ระบบปฏิบัติการ (Operating System:OS)
1.7.5  ความถูกต้องของตัวแบบ หมายถึง การนำกลุ่มข้อมูลสำหรับตรวจสอบ (Validation set) มาหาความสัมพันธ์ และเปรียบเทียบค่าความเชื่อมั่นกับตัวแบบที่สร้างได้ที่เงื่อนไขเดียวกันถ้าค่าความเชื่อมั่นของข้อมูลตรวจสอบเท่ากับหรือมากกว่าแสดงว่าตัวแบบมีความถูกต้อง

ไม่มีความคิดเห็น:

แสดงความคิดเห็น